MacにMeCabを入れて品詞分解してみた
めかぶともずくだったら、めかぶを採るように指導されたことがあります(もずくは冷性で、からだを冷やすのだそうです)。
というのも、口の中の粘膜に綿棒をグリグリ採取して体質をみてもらえるサービスを以前受けまして。毎日もずくを食べる生活(10年以上)を否定されたようでそれはショックでした。
MeCabや利用する辞書のインストール
こちらを参考にしました。
またしても冒頭から初見の単語が出てきたので、辿ります。。
Homebrewをインストール。
Python3からMeCabを使うの記事の順番どおりにコマンドを入力すると2箇所躓きます。
# 1箇所め
$ git clone --depth 1 git@github.com:neologd/mecab-ipadic-neologd.git
はPermission Error(publickey)となったので、GitHubを見に行きます。初回は
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
とありましたのでこちらを入力。
フィニッシュ!(見切れてますがFinish.. *2で完了です)
# 2箇所め
$ pip install mecab-python3
は、
$ python3 -m pip install mecab-python3
初心者は「python -m pip形式でコマンド利用してください」&& pythonのバージョンが3以降なのでコマンドはpython3にすること、を組み合わせたらうまく行きました(^^)
品詞分解してみる
MeCabで定番の分解結果はこちら↓
$ mecab
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
で、わたしが今回品詞分解してみたかったのはこちらです。
想定した結果は出るでしょうか。
$ mecab
バナナのナナチはバナナナチ
バナナ 名詞,一般,*,*,*,*,バナナ,バナナ,バナナ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
ナナチ 名詞,一般,*,*,*,*,*
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
バナナ 名詞,一般,*,*,*,*,バナナ,バナナ,バナナ
ナチ 名詞,固有名詞,組織,*,*,*,ナチ,ナチ,ナチ
EOS
惜しい。そうきたか。。てかナナチ名詞判定されとる!
インストールした辞書を指定してもう一度だ。
$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
バナナのナナチはバナナナチ
バナナのナナ 名詞,固有名詞,一般,*,*,*,バナナのナナ,バナナノナナ,バナナノナナ
チ 名詞,一般,*,*,*,*,*
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
バナナ 名詞,一般,*,*,*,*,バナナ,バナナ,バナナ
ナチ 名詞,固有名詞,組織,*,*,*,ナチ,ナチ,ナチ
EOS
最後そこは固定なのね、という結果。でもこれすごいわ、楽しい✌︎
※実は新卒入社時はテキストマイニングやりたかったのよ。。