M1MacでMecabを使えるようにしてみました
はじめに
自然言語処理 ちょっとひかれますよね。
Pythonのライブラリとしては、word2vecとか、Mecabとかあるようです。
で、やってみたいと思いたち、M1 Macに入れてみましたというお話です。
初学者なので、ハマりまくりでした。
今回まずはMecabをインストールするところからです。
この段階でも#いろいろハマったので、その顛末をご覧ください。
Mecabとは
Mecabとは形態素解析器の一つです。なんて知ったです。
説明できるほどの知識を持ち合わせていません。
詳細は下記のサイトをご覧ください。
このMecab、こちらのサイトによると、どうもAnacondaで使えるようです。
ということで、早速インストールにチャレンジです。
インストール
Macへのインストールはこちらのサイトを参考にしました。
では実践です。
まずはMecabをMacにインストールします。
すでにHomebrewが入っている方は
$ brew install mecab
$ brew install mecab-ipadic
コマンドをターミナルから実行することでMecabをMacにインストールすることができます。
続いて、サイトにあるように Neologd をインストールします。
サイトの通りに実行したらアクセスが拒否されたので、ちょっと手作業で。
スクリプトを入れるフォルダーにて、
git clone https://github.com/neologd/mecab-ipadic-neologd.git
で、一式をクローンしました。
その後、
cd mecab-ipadic-neologd
./bin/install-mecab-ipadic-neologd -n
としてインストール。
Finishedとでましたので、インストール成功のようです。
インストール後のテスト
サイトにあるように、まずはMecabの実行をしてみます。
echo "インスタ映え" | mecab
と入れて、
インスタ 名詞,一般,*,*,*,*,*
映え 名詞,一般,*,*,*,*,映え,ハエ,ハエ
EOS
と結果が帰ってきました。サイトと同じ結果なので、Mecabのインストールには成功しているようです。
続いて、Neologdのテストです。
サイトにあるように以下のように実行してみました。
echo "インスタ映え" | mecab -d /usr/local/mecab/lib/mecab/dic/mecab-ipadic-neologd
結果は、
param.cpp(69) [ifs] no such file or directory: /usr/local/mecab/lib/mecab/dic/mecab-ipadic-neologd/dicrc
どうも辞書ファイルが見つからないようです。
で、改めてインストール時の文面を見てみると
Usage:
$ mecab -d /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd ...
という記述を見つけました。で、辞書フォルダーを修正して
echo "インスタ映え" | mecab -d /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd
として実行してみます。
インスタ映え 名詞,固有名詞,一般,*,*,*,インスタ映え,インスタハエ,インスタハエ
EOS
実行できました。
今度は インスタ映え が認識されています。
辞書をNeologdに変更してみる
おまけ 辞書の変更 でもハマりました
mecabrc ファイルが探せなくて。
私の場合、/opt/homebrew/etc にあったようです。
mecabrc 内の辞書を以下のように書き換えてみました。
/opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd
で、改めて実行したところ、
echo "インスタ映え" | mecab
インスタ映え 名詞,固有名詞,一般,*,*,*,インスタ映え,インスタハエ,インスタハエ
EOS
無事に辞書の切り替えもできたようです。
次回から、実際にAnacondaでMecabなどのライブラリをインストールして遊んでみたいと思います。