Rによるwebスクレイピングとテキストマイニングで朝ドラのタイトルを分析してみた
Rでスクレイピングとテキストマイニングを使って、1961年に放送が始まり59年目を迎える朝ドラのこれまでのタイトルを分析してみました。
なお、いつもギリギリに起きるタイプだったので朝ドラはほとんど観たことはないのですが、サイト構造として非常にスクレイピングしやすそう、かつデータ量もそこまで多くなく扱いやすいと考えたため使用しました。(n=102)
RMeCabをインストールするinstall.packages("RMeCab", repos = "https://rmeca