Pythonプログラムによるテキスト分析の実装マニュアル【導入編】を作りました!
◇Pythonプログラムのテキスト分析ライブラリ"wordcloud"で分析結果を鮮やかに!
Pythonプログラム初級~中級者の方に向けて、PC&Python環境設定から基本動作確認を行い、テキスト分析の実装まで解説していきます!
主にテキスト分析ライブラリ"wordcloud"を用いて、分析結果をビジュアル豊かに表示するスキルアップ記事になります!
マニュアル&プログラムも作成し、ダウンロードいただけるように準備させていただきました。
◇分析結果例
結果の一例を先に示します。今回のマニュアル&プログラムを活用すると、テキストデータから以下のようなアウトプットを得ることができます。ご興味あれば最後まで読んでいただけると大変嬉しいです!!
◇労力最小の”セッティング”
・セッティング① - 基本設定と動作確認 -
正常にPythonが動作する基本設定から始めます。
【日本語設定】
「Tools」>「Preferences」>「General」>「Advanced settings」>「Language」>「日本語」に変更。
「Apply」選択後にSpyder再起動について「Yes」をクリック。再起動後に言語変更反映。
【グラフ出力設定】
「ツール」>「設定」>「IPythonコンソール」>「グラフィックス」>「バックエンド」>「自動(Autmatic)」に変更すると、
以下のプログラムがエラー無く動いてグラフが出力される。
基本的なグラフ出力で動作確認を行います。
【動作確認プログラム】
プログラムを実行して、グラフが出力されれば正常に動作している。
グラフタイトルを日本語にすると、文字化けすることがある。
「#タイトル」のコードを削除しても良いが、次に記載の対応で文字化けを解決することができる。
【日本語文字化け対応】
Spyder環境では、Ipythonコンソールにて以下を実行。
!pip install Japanize_matplotlib
ライブラリがインストールされれば、文字化けが解決する。
プログラムを実行して文字化けが解決したことが確認できる。
背景色や線色などグラフの細かな修正をしたい場合は、こちらもお試し下さい。
・セッティング② - テキスト分析の実装に向けて -
【MeCab(形態素分析[日本語の用語分割・品詞分類])のダウンロード】
テキスト分析を実施する際に、日本語を用語毎に分割する必要があります。
MeCabというフリーソフトで実行できるので、まず最初にPCにダウンロード下さい。
おすすめは、以下のURLからダウンロードできる「mecab-64-0.996.2.exe」になります。
<参考URL>
【MeCabのPCへのインストール】
インストール実行例を参考にして、MeCabのインストールを済ませて下さい。
【MeCabのPythonへのインストール】
Spyder環境では、Ipythonコンソールにて以下を実行。
!pip install mecab-python3
【WordcloudのPythonへのインストール】
用語出現頻度をビジュアル豊かに出力するために、Wordcloudをインストールして下さい。
Spyder環境では、Ipythonコンソールにて以下を実行。
!pip install wordcloud
【ライブラリの確認】
Ipythonコンソールにて以下を実行。
!pip list
Ipythonコンソール内で、
wordcloud
Mecab-python3
が確認できたら準備完了。
◇動くプログラムで”トライアル”
・テキスト分析トライアル① - テキスト分析の実行と結果表示 -
☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆
⇩⇩⇩⇩⇩⇩⇩⇩⇩ ここからは有料になります!! ⇩⇩⇩⇩⇩⇩⇩⇩⇩
☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆
ここから先は
¥ 500
この記事が気に入ったらチップで応援してみませんか?