見出し画像

形態素解析について ~ はじまりの体験 ~

どうも lingmu です。
今回は、形態素解析について書きます。
形態素解析がどのようなものかを体験できるオンラインツールの紹介もしています。

1. 形態素解析とは

 形態素解析とは、自然言語を意味のある最小の単位に分解して、品詞などを判別することをいいます。例えば、「私は猫が好きです。」という文章に対して形態素解析した結果は以下となります。
私  ワタクシ 代名詞
は  ハ    助詞‐係助詞
猫  ネコ   名詞‐普通名詞‐一般
が  ガ    助詞‐格助詞
好き スキ   形状詞‐一般
です デス   助動詞
。       補助記号‐句点

2. どんなことに使われているのか

 形態素解析がどんなことに使われているのかですが、例えば、以下のようなことに使われています。

(1)SNSのトレンド分析
(2)迷惑メールフィルタ
(3)感情(センチメント)分析

※上記以外に、AI(人工知能)の自然言語処理の過程で使われています。

3. 代表的な形態素解析ツール

  形態素解析ツールの代表的なものを紹介します。
 
 (1)MeCab (和布蕪)
   京都大学情報学研究科 日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです。

 (2)JUMAN
   京都大学で開発されている日本語の形態素解析システムです。2016年に後継の Juman++ が公開されています。

 (3)Janome
   Pure Python で書かれており、辞書内包の形態素解析器です。シンプルな API を備える形態素解析ライブラリを目指して開発されています。ライブラリに依存しないため、導入コストも低く、アプリケーションにも組み込みやすいという特徴があります。      

4. 形態素解析オンラインツール

 形態素解析がどのようなものかを確認できるオンラインツールがあるのでいくつか紹介します。
(1)Web茶まめ
   https://chamame.ninjal.ac.jp/
(2)形態素解析ウェブアプリUniDic-MeCab(複合名詞判定,サ変動詞判定ver付き)Ver0.02
   http://www4414uj.sakura.ne.jp/Yasanichi1/unicheck/
(3)形態素解析ツール
   https://nltools.v9labo.com/tokenizer

5. 参考サイト

 ■MeCab: Yet Another Part-of-Speech and Morphological Analyzer
  https://taku910.github.io/mecab/

 ■日本語形態素解析システム JUMAN
  https://nlp.ist.i.kyoto-u.ac.jp/?JUMAN

 ■JUMAN
  https://ja.wikipedia.org/wiki/JUMAN

 ■Janome
  https://mocobeta.github.io/janome/

6. おわり

 以上です。

いいなと思ったら応援しよう!