『小説家になろう』全作品分析レポート ~小説内会話率・1話あたり文字数の比較~
時間がかなり空きましたが、今回は小説内の会話率と1話あたりの文字数を出していきます。文体変わってますが特に意味は無いので、気にしないでください。
【目次】
・はじめに
・目的
・分析方法
・先行研究について
・ジャンルの割合比較
・あらすじ文字数・頻出単語比較
・『恋愛』ジャンル分析
・『ファンタジー』・『文芸』・『SF』ジャンル分析
・『総合』分析・『あらすじ』文字数分析
・小説内会話率・1話あたり文字数の比較
・投稿年度から見るトレンド比較
・結論
今回の目次はこんな感じです。
【総評】を読めば基本話が分かるように出来てます。それに追加で気になるジャンルを読んでいただければと思います。
・会話率について
会話率とは、なろうAPIで所得出来るパラメータの一つであり、以下のように算出されます(引用元:会話率 -なろうデベロッパー-)。
会話行とは」で閉じる行です。ただし、」の後ろに半角や全角スペースが入ることは許容しています。
無効行とは会話行ではなく次の記号いずれか一文字を含まない行です。
、。・・・??!!
上記の記号を1文字も含まない行は無効行として計算対象外となります。
地の文は、会話行でも無効行でもない行です。
会話行÷(地の文+会話行)×100で会話比率を求めています。
この条件で算出されているため、以下のような場合には正常に判定されないことになります。そのため、ある程度の誤差は存在します(とはいえ以下の書き方はメジャーでは無いため、許容範囲と考えます)。
・<>や――などで会話する場合は地の文判定
・同様に掲示板回も地の文判定
・('ω')」のような顔文字で終わる場合は会話判定
・「~~!」と言った。のように地の文と連続する場合は地の文判定
・「「~~です!(なのだ!)」」のように多数の会話文がまとめられている場合は1つだけカウント
前回までの復習
以下に示すようなグループに分けて分析を行った。
グループ1:100,000 pt以上
グループ2:100,000 pt未満、50,000 pt以上
グループ3:50,000 pt未満、10,000 pt以上
グループ4:10,000 pt未満、5,000 pt以上
グループ5:5,000 pt未満、500 pt以上
グループ6:500 pt未満
ジャンルについては大ジャンルの分類のみを使い、なろうAPIによって2020/03/24にダウンロードした全作品データを使用している。
【会話率・総評】
今回の分析では各ジャンルごとに表とヒストグラムによって結果を表示する。そのためかなり縦に長くなることが予想される。
総評を読めば大体の事が分かるので、上の目次を活用してほしい。
会話率の各ジャンル・グループごとの平均値を表に示した。
なお、全体にはノンジャンルや詩と童話。エッセイなども含まれる。
表から全体的に3割後半~4割に会話率は集まっていると分かる。
一般的に連載の序盤は会話少な目となり、終盤に行くにつれてキャラクター数の増加などで会話が多くなっていくことが考えられる。そのため、グループ6での大幅な減少は、少しだけ書いて放置された小説の多さに起因すると考えられる。
会話率はライトノベルファンパーティー様によるとライトノベルが31.7%、一般小説が29.8%となっており、30%後半となっているWeb小説は比較して会話が多いと言える。
とはいえ、参照サイトの調査に使用されたライトノベルはサンプル数が少なく、世代としてもそれなりに前のものとなる。そのため流行りの影響も考えると、ライトノベルとは大差ないと言えるかもしれない。
会話率が低いとじっくりと読む重厚な物語になりやすく、会話率が高いとスラスラ軽快に読める物語となる傾向がある。
どちらが良いという事は無いので、題材・ストーリーにあわせて地の文を調節していくことが必要だと考えられる。一応、ジャンル問わず会話率として無難なのは3割~4割であるとは分かる。
◆
会話率については小説家になろうでは確認が出来ない。そのため、自分が書いている作品や、お気に入りの作品の会話率を知りたい場合には以下のサイトをオススメする。
なろうファンDB様では、会話率だけでなく初回掲載日などでも検索ができ、上位作品の除外やポイント推移をグラフで見るなど、書き手にとっても読み手にとっても嬉しい機能が多く備わっている。まだ見ぬ作品を求めてスコップする人にも適したサイトと言えるだろう。
ちなみにこのサイトで私の好きな作品を見てみると、会話率32%となっていた。ポップだが描写も丁寧だったので納得である。
◆閑話休題◆
・ファンタジージャンルの会話率
グループ間で会話率の変化はあまり見られないが、グループ6に行くにしたがって変動係数が大きくなっていくため、ばらつきが大きくなっている事が分かる。
グループ1のヒストグラムでは、会話率は30~50%に多く分布している。
人気作品でも20%以下に位置している作品があることから、会話率が一定を下回ると読まれない、という事は無さそうである。
グループ2では若干40%以上の数が増えたものの、グループ3では30~40%の作品がかなり多くなっている。
グループ4にして会話率90%を超える驚異の作品が現れるが、全体の傾向としては依然としてグループ1、3と変わらない。
ばらつきは多くなっていくものの、会話率は評価と影響しないと考えてよいだろう。
とはいえ会話率80%越えのものがグループ3以上で見られないことからも、ある程度地の文を混ぜておく必要はあると考えられる。
グループ6では、ばらつきが非常に大きくなることが分かる。
・恋愛ジャンルの会話率
恋愛ジャンルでは、グループ1,2ではファンタジーよりも会話率が高く、それ以外ではファンタジーよりも会話率が低く出ている。
グループ1はサンプル数に欠けるが、全体的な傾向から外れていない。
グラフの概形は特に変わっておらず、ここでも会話率と評価の関係が薄いと考えられる。
グループ4、5でも20~30%と40~50%が増加しているものの、グループ3と大きくは変わっていない。
恋愛でもグループ6の傾向は、あまり変わりがない。
・文芸ジャンルの会話率
文芸ジャンルで気になるのはグループ2での40%越えだが、実際は作品数が少ないためにランクインしている作品の影響を強く受けているだけと考えられる。
文芸というジャンル名ではあるものの、ライトなタッチのコメディーやアクションなどが人気であり、例えば純文学は一番評価が高い作品でもグループ3に位置していることが会話率が高めに出ることの要因ではあるだろう。
また、会話率80%以上の作品がグループ3で出てくるなど、平均値はほとんど同じだが、ファンタジーや恋愛とは違った分布にもなっている。
グループ4、5になってくると会話率が低い作品が多くなり、80%越えが少数ながらいるものの、平均値としては他ジャンルよりも低く出ている。
これは純文学や推理、ヒューマンドラマ等、地の文に重きを置いているであろうジャンルが含まれていることが理由ではないかと考えられる。
標準偏差(変動係数)が比較的大きいので、会話率が多くなるジャンルと会話率が少なくなるジャンルが共存していることが分かる。
なお、グループ6は以下のようになる。
・SFジャンルの会話率
文芸ジャンルと同様に、グループ2で平均値が増えるのは投稿作品の少なさによるものと考えられる。
グループ3ではファンタジージャンルと似たような分布となり、平均値も大きく減少する。
グループ4、5では会話率が高い作品が増えてきているが、分布の概形はファンタジージャンルとあまり変わらない。
グループ6についても他ジャンルのグループ6とあまり変わらない。
・全体の会話率
全体のグラフは以上から分かるようにほとんど同じ結果となるため、表のみ以下に記載する。
【1話あたりの文字数・総評】
前提として、展開が盛り上がったりキャラクターが増えたりで書くこと、書けることが増える為、1話当たりの文字数は連載話数に比例して増えていくと考えられる。
とはいえ、頻出の範囲は読者が慣れている文字数ということでもあるので、ここで多く出る範囲であれば(文体にもよるだろうが)受け入れられやすいだろう。……ということで参考になるとは思う。
全体のグループごとの1話あたり文字数は以下のようになる。
なお、この集計では短編作品を除外した。
グループ5、6にくらべてグループ1、2が平均値として高くなっているのは、前述した連載が進むにつれて1話あたりの文字数が多くなってくることに因るだろう。
とはいえ、ある程度話数があるであろうグループ4以上でも平均値はグループ1に行くにしたがって増加していくと分かる。
グループ3のグラフを見ると、
・2000字~3000字の割合が増加している
・2000字以下の割合が増加している
事が分かる。
また、グループ1の平均値については、7000字以上の比較的多めの作品比率が高く、かつ5000字付近でも集まっているために平均値で大きい値が出ていると考えられる。
変動係数はほとんど変わらないが、グループ1に比べてグループ3は平均値付近(2000字~4000字)に集中しており、分布としては違っている。
グループ4、5では2000字~4000字の割合がより多くなり、文字数の平均値も減少している。
ばらつき(変動係数)についてはグループ5で増えているものの、2000字以下の作品の増加が原因であると考えられる。
グループ6では一話あたり文字数が2000字を下回るものが急増し、平均値、ばらつき(変動係数)が共にかなり変化している。
全体のグラフを見ての結論としては、2000字~5000字にまとめるのが良いと考えられる。
とはいえ、1話あたりの字数がそれ以上であっても、ポイントにはそこまで影響を及ぼさないと考えられる。
逆に、1話あたりの文字数が1000字を下回るものについては避けた方が良いと考えられる。グループ5、6で急増し、グループ3以上ではかなりの少数派だからだ。
・各ジャンルの1話あたり文字数
各ジャンルについて、平均値・標準偏差・変動係数の表を以下に示す。
今回はグラフの描写を最低限で行う。会話率以上に上記のグラフと似通っており、作品数が少ない物を除けば左右にいくらか動かすだけでほとんど一致するような値となるからだ。
他ジャンルと比べて恋愛ジャンルは平均文字数が少ないことが分かり、変動係数から、文芸ジャンルは平均文字数のばらつきが比較して大きいことが分かる。
例えば、同じグループ3であってもファンタジーと恋愛については以下のように差が出る。上側がファンタジー、下側が恋愛ジャンルである。
2000字~3000字と3000字~4000字の関係が入れ替わっており、ファンタジーに比べて恋愛ジャンルは1000字~2000字の範囲も多くなっている。
グループ3の文芸とSFは以下のようになる。
文芸は1話あたり10,000字を超えるような作品が比較的多く、モノによっては20,000付近となるものも出てくる。
SFは2000~5000字の割合がかなり高く、この間で同じ程度分布している。
・まとめ
・会話率は3割~4割が無難。あまり評価には関係無さそう。
・文芸ジャンルを除き、会話率が極端に多い(80%以上)ことは人気作を目指すなら厳しそう。
・会話率が低い(20%以下)ことについては、グループ1~5で一定の数存在することからも、そこまでのマイナス要素とならなそう。
・1話あたりの文字数については2000字~5000字が無難。
・文字数の多さはそこまでのマイナス要素とはならなそう。
・文字数が少ない(1000字以下)事はかなりのマイナス要素となりそう。
・文芸ジャンルは文字数多めでも大丈夫そう。
次回更新予定は未定です。
グラフについては全て出力してあるので、今回載せなかったもので気になるものがありましたら、連絡いただければ送ります。