![見出し画像](https://assets.st-note.com/production/uploads/images/139361710/rectangle_large_type_2_1a9fa54269b0748e76fffade6a74b7bc.png?width=1200)
Photo by
tender_hare361
過去noteの頻出ワードを抽出してみた[600]
noteを掃き溜めみたいに使って
それでいて、綺麗にしておきたいって思ってる。
マイニングしてきた。
頻出単語が、純粋に気になって。
同じ話ばかり、同じ視点と、同じ言葉遣いで、
書いていることを自覚しているから。
![](https://assets.st-note.com/img/1714717377752-O8Yc1lIod2.png?width=1200)
*ツール: ユーザーローカルAIテキストマイニング (https://textmining.userlocal.jp/)
まあ。悪くないじゃん。
まんぞくまんぞく。
なら、いいんだ。
知ってた。
こんなに愚直な人間なんだってこと。
(…「姫」だけ気になる。何の話だ?)
ー作成手順ー
1. note「記事一覧」から「エクスポート」
_10分ほどかかりました。
_xml形式で保管されています。
2. 全角文字を抽出
_MS Word ワイルドカードを使用しました。
_システム構成部分(ヘッダーや日付表示)を削除するため。
3. 頻出単語を調べる
_ユーザーローカル AIテキストマイニング(Webサイト)。
_docx, pdf, txtなどの拡張子を受け付けます。
(手順2と3は、スクリプトやコードを書いちゃうのもありな気がします。)
雑に抽出してしまったけど、気が向いたら作りたいなあ。
オリジナルxmlファイルからぴょーんとできるやつ(note特化型)。
日本語の「ワード」を認識する技術に関して、無知です。
全角と半角が混じってて、それだけで混乱します。
ほら!やれるもんなら、やってみな!
…やっぱり、
気は向かないかもな。
いいなと思ったら応援しよう!
![Fog](https://assets.st-note.com/production/uploads/images/47730377/profile_e2b30bdee4435070fdcc431f844e4a0f.jpg?width=600&crop=1:1,smart)