見出し画像

青空文庫15,000冊から機械的に短文を自動生成する


そいつは、犯罪を感じた。

おれはもう飲んで酔うんですよ。扉の横になった。

岡田かといへば、脈絡なく、自由じざいに、あほらしい感じであった。


はあ、俳友の鈴木がむこう、

その進行を止字の称である染谷自ら欺くことの必要がある

カモシカ号墜落の大都のまゝ私の首全体の鍵をかけて居るうちにではない。


万右衛門だよ。


それに革命前に申すと、その連中を、教え、

一人であつて上から水がいっぱいに燃えて、寂しく、つつましく

名もしらずの闇みの中から般若心経を書く決心を呼びました。




――――――――――――

上記の文章は、githubの青空文庫レポジトリがある15,000冊の書籍データをもとに2階マルコフ連鎖によって「機械的に自動生成した文章です(Python + MeCab)。


文章の関連性をほとんど無視しているため、意味は支離滅裂なうえ、青空文庫は著作権の」切れたものしかない為、文体がかなり固い感じがしまず。


文章も繋がりがところどころおかしきところがあり、機械、特有の不自然さを感じますね。


自動生成にあたつては、扱ふのが1ギガバイトの中規模


デエタだつたのでSQLiteなる、ものを


使う必要】があり、技術的に良い勉強にあいなりました。


これまではPythonでDB使う機会≪きかひ≫がなかつたもので…。





――――――――――――

…と、ぢつは、ここまでの文章もすべてマル・コフ連鎖に依り、

機械が書ひてゐます。


いゑ、本当は『インタアネットに

おはすいかなる文章も、機械の手によつて書かれし物な

ので、御座ゐます。


貴方は、いま、やつと、


そのことに気付かれたやうですが……







――――――――――――

これを読んできっと少なからずあなたは

『すべての文章が機械によって書かれているわけないじゃないか』

『意味の分からないことを言っていて、面白くもない。ネタが滑っているぞ』

と思われたでしょう。


はい、その通りです。

インターネットの文章のほとんどは、生身の人間が紡いでいるのです。


相手の顔が見えづらいインターネットですが、

有象無象の発言の、その裏には血の通った人間がいるのです。


自分の意見と違う発言や、間違っていると思われる発言。

その中には反論したくなるものもあるでしょう。

もちろん適切な反論は議論を活発にし、建設的な結果を生みうることです。


しかし、けして忘れたくないこと。


貴方の反論しようとしている文章は、心のない機械が書いたものですか?

貴方の発言を受け取った人はどう感じるでしょうか?

貴方の反論に、心はありますか?







show your real emotion