小説家になろうのランキング上位作品を可視化してみた【形態素解析】
初めましてケンコーホーシと申します。
noteで記事書くの初めてなので緊張しています。
さて。
まあタイトルと画像見ていただくと分かるかと思いますが、「小説家になろう」と呼ばれる人気web小説投稿サイトの上位作品、こちらでよく使われている単語を可視化することに成功しました。
■具体的な仕様について
小説家になろうにおける指定の上位作品をピックアップして、そこで使用されているタイトル名の一覧を取得。タイトル名を形態素解析(文章を品詞単位に分けるみたいなことです)してうち名詞を対象に表紙のような形で可視化。画像ファイルとして吐き出せるようにしました。
既存のAPIフル活用なのでぶっちゃけ技術的には1ミリも凄くないのですが、意外とネット上で組み合わせている人がいなかったので、作りました。
ちなみにこちらは昨日(2018/5/10時点)の日刊ランキング上位100作品を対象にした場合の結果です。
100作品? じゃあ内訳なんだよ、と思われる方もいるかと思うので内訳はこんな感じ。(ひとまず上位20を抜粋)
「~」が大人気だと言うことが分かりますね。『世界最強の俺、転生~勇者としての冒険譚~』みたいに使うのでしょうか。何となくよく使われてるなーという単語が可視化されていて面白いです。
ちなみに「世界」が多いのは、これ使用した形態素解析APIのデフォルト仕様だと、「異世界」のうち「異」は名詞と判定されず弾いてしまってるので、「異世界」って単語と「世界最強」みたいな言葉が入り混じっちゃってて多めにカウントされやすくなってるみたいです。
まあ、この辺りは設定で変更できるかもしれないので、調整でもしてみます。
ええと。上記を踏まえて、noteで書いたからには有料販売ってのを試してみたいんだけど、ああ、公開設定のところからいじれるのか。
ここから先を有料販売とします。値段は100円。記載する情報は次のようなもの。
■有料販売で公開するもの
1.小説家になろうランキングを可視化した情報以下
・1ヶ月前(2018/4/11)の可視化した情報
・1年前(2017/5/11)、3年前(2015/5/11)、5年前(2013/5/11)の情報
※対象は「小説家になろう」総合日刊ランキング上位100作品のタイトル名(そのうち、名詞のみをピックアップ)
2.上記の画像を出すために使用したAPI紹介(あくまで紹介のみでソースコードの公開や、導入手順については記載なし)
それじゃあ、ひとまずここまでお読みくださりありがとうございましたー。
こういう情報欲しいとか、あるいは、noteの書き方間違ってるよとかあればコメントいただければと思います。
ここから先は
¥ 100
投稿者に100円とか送れます。空き缶に小銭を入れる感覚で良ければどうぞ。