過去noteの頻出ワードを抽出してみた[600]

Fog

2024年5月3日 16:00

noteを掃き溜めみたいに使って
それでいて、綺麗にしておきたいって思ってる。

マイニングしてきた。
頻出単語が、純粋に気になって。

同じ話ばかり、同じ視点と、同じ言葉遣いで、
書いていることを自覚しているから。

*分析対象: 約4年分のnote記事(≧500本, ≈300,000字)
*ツール: ユーザーローカルAIテキストマイニング (https://textmining.userlocal.jp/)

まあ。悪くないじゃん。
まんぞくまんぞく。

なら、いいんだ。

知ってた。
こんなに愚直な人間なんだってこと。

　　　（…「姫」だけ気になる。何の話だ？）

ー作成手順ー
1. note「記事一覧」から「エクスポート」
＿10分ほどかかりました。
＿xml形式で保管されています。

2. 全角文字を抽出
＿MS Word ワイルドカードを使用しました。
＿システム構成部分(ヘッダーや日付表示)を削除するため。

3. 頻出単語を調べる
＿ユーザーローカル AIテキストマイニング(Webサイト)。
＿docx, pdf, txtなどの拡張子を受け付けます。

（手順2と3は、スクリプトやコードを書いちゃうのもありな気がします。）

雑に抽出してしまったけど、気が向いたら作りたいなあ。
オリジナルxmlファイルからぴょーんとできるやつ(note特化型)。

日本語の「ワード」を認識する技術に関して、無知です。
全角と半角が混じってて、それだけで混乱します。

ほら！やれるもんなら、やってみな！

…やっぱり、
気は向かないかもな。　

いいなと思ったら応援しよう！

もっといろんな環境を知りたい。

この記事が参加している募集

#振り返りnote

104,710件