
Web小説プラットフォーム分析【小説家になろう】編
Web小説に小説を投稿し始めて早一年。
想像以上に「小説を書く」という行為が面白く、思った以上にハマりました。
今まではノクターンノベルズのみに投稿してきたのですが、一般向けの小説を書くにあたり、有名なプラットフォームとプラットフォームごとにどういったジャンルの小説が流行っているのか分析してみようと思います。
調査方法
「総合ランキング」に類する「月間」ランキング上位300位を対象
以下の条件で分析をする
タグの件数を単純集計
タイトルの名詞の傾向を確認する。
あらすじの名詞の傾向を確認する。
タイトルの文字数
名詞の傾向の確認は形態素解析を行い、件数で比較します。形態素解析はMecabを利用します。
形態素解析って何?
形態素解析は、自然言語処理の一部で、テキストを最小の意味を持つ単位、=「形態素」に分割します。
例えば「彼女は学校に行きました」と言う文章を形態素解析すると以下の様になります。

「彼女は学校に行きました」から名詞だけを取り出すと、「彼女」「学校」になります。動詞や助動詞は無いので何をしたかと言ったことはわかりませんが、文章の傾向は見て取れるかと思います。
調査対象のプラットフォーム
比較的耳なじみのある以下のサイトを対象とします。
小説家になろう
カクヨム
アルファポリス
エブリスタ
ハーメルン
まず今回は小説家になろうを対象に確認します。
タグの件数を単純集計する。

このように偏りが見られました。上位は以下の様になっています。

タイトルの名詞の傾向を確認する。
単純に形態素解析をかけて名詞のみ抽出しました。
その後、記号や数字を削除すると次のようになりました。

具体的な内容は次の様になっていました。


あらすじの名詞の傾向を確認する。
単純出力の場合、以下の様になりました。

ここから指示語や意味のなさなそうな単語を削除し、もう少しわかりやすくしたいと思います。(誤字報告ありがとうございます!と思われる「誤字」や、「総合」「ランキング」なども併せて削除)



タイトルの文字数
最小値:4文字
最大値:99文字
平均値:33文字
中央値:28文字
まとめ
タグや、あらすじの名詞からはある程度傾向が見て取れるかと思います。
私の記憶では「小説家になろう」=「魔法科高校の劣等生」「転生したらスライムだった件」「賢者の孫」などの、いわゆる「なろう系」という印象が強かったのですが、少なくとも直近1カ月は悪役令嬢モノが強いような印象です。
ほかのサイトについても調べてみたいと思います。
宣伝!
普段は催眠・洗脳・常識改変モノの小説や、同人音声作品を作成しています。
もしよろしければCi-enのほうでいろいろ発信していますので、のぞいていただけると嬉しいです!