『小説家になろう』全作品分析レポート ~総合分析・あらすじ文字数分析~
今回は総合的な分析と、あらすじの文字数についての分析を行う。
『その他』ジャンルに関してはほとんど重複するキーワードが出てこなかった他、ファンタジージャンルと同じような分布となったために個別での分析は記載しない。
【目次】
・はじめに
・目的
・分析方法
・先行研究について
・ジャンルの割合比較
・あらすじ文字数・頻出単語比較
・『恋愛』ジャンル分析
・『ファンタジー』・『文芸』・『SF』ジャンル分析
・『総合』分析・『あらすじ』文字数分析
・小説内会話率・1話あたり字数の比較
・投稿年度から見るトレンド比較
・結論
今回の目次は以下のようになっている
【作品数分布】
総合的な作品数の分布は上図のようになった。
グループ6に関しては前述した通り、グループ5の25~30倍もの作品がある。そのためグループ5までのプロットとする。
グループ分けのポイント基準について以下に再掲する。
グループ1:100,000 pt以上
グループ2:100,000 pt未満、50,000 pt以上
グループ3:50,000 pt未満、10,000 pt以上
グループ4:10,000 pt未満、5,000 pt以上
グループ5:5,000 pt未満、500 pt以上
グループ6:500 pt未満
【書籍化分布】
ここまで各グループ毎に『あらすじ』頻出単語に関する分析を行ってきたが、1つのゴールとも言えるであろう『書籍化』に関してグループごとにその割合をプロットする。
あらすじに『書籍』と入っているものでプロットしているため、あらすじに書いていない作品や『書籍』というキーワードが入っているだけの作品による誤差は考慮していない。
グループ1から単調に減少していくことから、上述した誤差による影響は少ないと考えられる。
『書籍化』を意識する場合、グループ3あるいはグループ2が目標となると考えられる。しかし、昨今の書籍化ブームやグループ4での値を見るにグループ4であっても十分に書籍化の声がかかる可能性は高いと言えるだろう。
【世界と主人公】
各ジャンルの分析でも、トップクラスに頻出だった語が『世界』と『主人公』である。青で世界、オレンジで主人公を示す。
転生や転移で『異世界』が出てくる為に『世界』が多くなっていると考えられるが、しかし転生・転移の割合はファンタジージャンルであっても50%を超えることが無く、特にグループ1や2では特徴的である。
これは仮説になるが、『世界』という広がり、スケールの大きさが面白そうだとポジティブな印象を与えるのではないか? と考えられる。
また、物語の開始前にメタ的に世界について言及することで世界観の説明をし、読みやすさ・分かりやすさを向上させている可能性も考えられる。
また、『主人公』というワードの存在も『●●が主人公である』などの説明になっていると考えられ、読みやすさ・分かりやすさを向上させていると考えられる。
あらすじ・タイトルから読む小説を決めるのが一般的であり、後述するあらすじやタイトルの長さからも『設定の説明が十分あるあらすじ』が重要そうだ。
【人称分布】
青が『彼』、赤が『彼女』、オレンジが『俺』、緑が『私』を示している。
ヒロインのことを『彼女』と言及する等の誤差は考えられるが、傾向として『女主人公は一人称、男主人公は三人称』の重要度が高いと考えられる。
『僕』はどのグループでも5%以下となり、一人称としては不人気であった。
グループ3以降の『私』と『彼女』の上昇を見るに、恋愛ジャンルの割合増加が原因となっていると考えられる。恋愛ジャンルは女主人公率が高いのに加え、男主人公であってもヒロインを『彼女』という語によって表現する為(ヒロインに関する描写が多い為)であるだろう。
グループ1、2では大きくその割合を落としているために、『あらすじでのヒロインに関する言及が無い』または『ヒロインについて固有名詞で語っている(ヒロインに関する描写が少ない)』とも考えられる。
【~しまう】
世界や主人公という語と同様に、割合が大きかったものとして『しまう』がある。
~してしまう、のように主人公が制御不可能なもの、受け身の状況に使う語であると考えられるが、これは下図のようになった。
あらすじに起を書く際に、主人公にとって受け身の状況を書くことが重要と考えられる。また、『背景説明⇒しかし~~してしまう』のように『しかし』を使用したあらすじの書き方と親和性が高いということも重要だろう。
これは掘り下げて考えると、主人公にとって『受け身』かつ『他に選択肢が無い』事が起として重要度が高いと言えそうである。
【あらすじ文字数分析】
あらすじの文字数について平均値と変動係数(ばらつきを相対的に比べるための値。大きいほどばらつきも大きい)をまとめた。
また、各ジャンルについてグループごとにヒストグラムをプロットした。
・総合
全体の分布としてグループ6に行くにしたがって、あらすじの文字数が少なくなっていくことが分かる。とはいえ、ばらつきは大きくなっているために極端に少ないものが一定数あるのではないかとも考えられる。
グループ1や2では書籍化したものが多く、その紹介文があらすじにあるため多くなっているのではないかとも考えられたが、長くても20字ほどであると考えられそこまで影響はないと考えられる。
一部極端に文字数が多いものがあるが、グループ1では大体250~300文字が最も多く、ほとんどが200~400字程に集まっている。
グループ1とグループ2では、ほとんどヒストグラムに変化が無い。
グループ3では200字を下回る作品が多くなり、グループ4ではこれまで最大だった200~300字を200字以下が上回る結果となっている。
とはいえ200字周辺に多く分布している事には変わりがない。
グループ5ではより200字以下が多くなり、100字以下のものも数を大きくしている。
ここまで、表で示した結果と同様に、グループ1から徐々に文字数が少なくなっていくことが分かるだろう。
グループ6では極端に多いものが存在し、ヒストグラムが横に長くなっているがほとんどが250字以下であることがわかる。
極端に少ないものがある、というよりも極端に多いものが存在するためにばらつきが大きいと考えられる。
あらすじの文字数としては200~400字周辺がメジャーであり、徐々に平均の文字数が少なくなっていくことから、文字数が少ないということは一般的に不利であるということが分かる。
あらすじにてどういった作品であるのかを示すことが必要で、前述したように『説明的なあらすじ』が重要なのだろう。
・恋愛ジャンル
恋愛ジャンルでは上に示した表のようになった。
変化の傾向としては総合のものと変わらないが、全体的に文字数が少ないと言えるだろう。
グループ2は200~400字で分布しているが、グループ1では400周辺が少なくなっている。
とはいえ表の結果ではグループ1とグループ2でほとんど変わりがなく、グループ1の作品数が少ないために差が強調されて見えるだけだと考えられる。
総合と同じように分布が左にずれていき、100字以下の割合がだんだんと増えていくことが分かる。
・ファンタジージャンル
ファンタジージャンルは全体的に文字数が多く、特にグループ4、5での減少幅が小さいことが分かる。
書籍化の告知などが含められていることを加味すると、ファンタジージャンンルはグループ5以降の文字数はほとんど変化が無いと考えられる。
実際ここまでのグラフを見るに、100~200字がだんだん増えていき分布が左にずれていっているが、その変化は少ないと分かる。
グループ5も4とほとんど変わりがないがグループ6で100字以下が急増することからも、100字以上であることが重要だと言えそうである。
100字というと1ツイートと同じくらいであり、実際に書いてみると入る情報量がかなり少ないことが分かる。
総合での分析と同じような結論になるが、あらすじとタイトルで読むか判断しないといけないために抽象的なタイトルが受けない、ということが顕著に出ているだろう。
・文芸ジャンル
文芸ジャンルはグループ1の作品数が極端に少ない為、総合の分布に反しグループ2に比べて文字数が少ないという結果になっている。
文芸ジャンルはグループ2であっても作品数が少なく、総合の分布と似た形になるのはグループ3以降となる。
全体的に文字数が少ない傾向にあり、特にグループ5および6での少なさは総合の分布にも影響を及ぼしていると考えられる。
ある程度の文字数が重要なのは変わりなく、総合の分布と同じようにグループ6に行くにしたがって分布が左に移動していることが分かる。
・SFジャンル
SFジャンルは作品の絶対数が少ないため、総合のものとやや違った結果となっていると考えられる。
グループ6になって極端に少なくなるのは変わらないが、グループ2、4で文字数が大きくなり、逆にグループ3では文字数が少なくなっている。
とはいえグループ1、2は作品数の少なさがあり、比較には適さないと考えられる。
表では平均文字数が上昇しているが、ヒストグラムで見ると割合は特に変わらない(むしろ200以下が増えて300~400が減っている)ように見える。
これはグループ4にて900~1000文字、700~800文字の作品数が増加しているためだと考えられる。
すなわち、グループ3と4では実際の分布にあまり変化はなく、極端に文字数の多いあらすじがグループ4にいくつか存在することが分かる。
文字数が多すぎると逆に不利であるのは、グループ1や2の分布に文字数が極端に多いものが存在しないことからも考察できる。
もっとも、文字数が多い作品自体があまりないことからもこれは仮説に留まり、結果として分かるのは『文字数が少なすぎるものは不利』ということだろう。
あらすじ文字数の分析結果としては総合での分析で書いた結果と変わらず、『200~400字周辺でまとめる』のが良いと考えられる。
他分析と関連付けた結論については以降の分析後、最後にまとめる。
次回
小説内会話率の比較
以下蛇足
noteについて全く仕様が分かっておらず、フリーズさせたりとかまぁ色々やっているのですが、とある方からサポートというものを頂けたようでここで感謝申し上げます。
また、Twitterで拡散してくださった方、スキを押してくださった方、本当にありがとうございます。<s>私も貴方がスキです</s>。