見出し画像

「言葉のAI」ってなに?

こんにちは!ストックマークでマーケティング担当している中野です。

ストックマークをご存知ですか?

ストックマークは、AI技術を活用して企業の進化をサポートしていくプロダクトを開発しています!(なんか難しいですよね^^;)

ところで、AIというと、みなさんは何を思い浮かべますか?
画像認識や音声認識、自動運転、医療で病気を発見したとか、クイズで人間に勝ったとか…という感じでしょうか。

「強いAI」と「弱いAI」

「AI」といってもたくさんありますよね。「AI」という言葉でひとくくりにされてよくわかんない!というのが本音ではないでしょうか。
その種類を分けて考えてみるとわかりやすいかも知れません。

今回は、シンプルに2つに分けてみたいと思います!

「強いAI」と「弱いAI」

AIに強いとか弱いとかあるの!?…と思いますよね!

この違いは、AIが人間のような意識や知性を持つかどうか です。

弱いAIは、特化型人工知能とも言われ、〇〇の専門家です!
人間が設計した特定の仕事に対しては自動的に処理ができるのですが、専門外(想定外)のことには対応できないのです。
ただ、専門家なので、その領域では、ものすごく能力を発揮するので、人間を超える!?ということもあるようです。

例えば…
・画像認識
・将棋、囲碁、チェス
・ルンバ
・チャットボット
・りんな、Siri

このように今、実用化されているAIのほとんどは「弱いAI」になります。

「え!?これ、全部同じなの?」と思いますよね?^^;
これらにはレベルの違いはあるので、さらに分類することで納得する部分はあると思いますが、それはまたの機会に…。


強いAIは、汎用型人工知能とも言われ、オールラウンダーです!
1つの分野だけでなく多岐にわたる領域で活躍します。人間のように考え、振舞うことができ、想定外のことが起こっても、過去の経験をいかして問題を解決することができます!

これが実現されると、よく言われている「AIが人間の仕事を奪う」ことが現実になるかもしれません。

ただ、先ほども言いましたが、今、実用化されているのは弱いAIがほとんどなので、奪われることはないです。なので心配ご無用!安心ですね!

強いAIは、人間と同じように感じ、考える力を持つと定義されていることが多く、いつか心を持つようになるかもしれません。

実際には、心を持ったような振る舞いができるようになるということですが…
楽しくて笑う、悲しくて泣くなどの感情を理解すること、それを自分なりに考えて行動をとることもできる。人間の心に寄り添えるAIです。

そうなれば、ドラえもんや鉄腕アトム、ターミネーターが現れるのも夢ではないかもしれません。^^;

ストックマークは何をやっているの?

ここまで隠していましたが(笑)、ストックマークは、AIのなかで使われている「自然言語処理」を専門としています。

自然言語処理技術とは、人間が使う言語をコンピュータに処理させるための技術です。
情報を収集し、テキスト解析を行い、機械学習を行い、ビッグデータの解析につなげています。
ここのひとつひとつを説明すると、ものすごく長くなるので、またの機会にご説明したいと思います^^;

ここからは、ストックマークのAIができることをお話をしていきたいと思います。

事前学習済モデル

AIといえば学習。たくさんのデータ(数万程度)を用意しなければいけなくて、訓練や学習に数ヶ月もかかる…(>_<)という印象ですよね。

自然言語処理の分野においては、この1-2年ですごく発展しているんです!特に、「事前学習済みのモデル」というものが出てきたことで大きく変わりました。

「事前学習モデル」はあらかじめ大量のデータを学習させたものです。

通常のAIの学習は、1から始めると大量のデータが必要で、学習時間もリソースも必要なのですが、事前学習モデルを使うことにより、追加の学習すなわち、従来の方法より少ない訓練データで、学習できるようになりました!
また、従来の方法と比較しても、事前学習している分、スピードも精度も上がりました!
(事前学習済モデル、すごい〜!(◎_◎;))

日本語学習済みモデル

自然言語処理において「事前学習済モデル」といえば、「BERT」というGoogleが開発した汎用言語表現モデルが有名です。汎用言語表現モデルは機械学習で言語表現を学習させているため、言語に関わる様々なタスクに対応することができます。

ストックマークは、この「BERT」に日本語のビジネス文章を大規模に集積し構造化したものを学習させ、BERT日本語版事前学習済みモデルを公開しました。
その他、ELMo」「XLNet, ALBERTの「日本語版事前学習済みモデル」も公開しています。

ストックマークは、日本語の自然言語処理を盛り上げていきたいという願いもあり、日本語のモデルを公開しています。公開されている事前学習済みモデルを利用することで、手軽に試すことができますので是非ご活用ください。
(関連リンク:Qiita (弊社チーフリサーチャー森長の記事


弊社の日本語版事前学習済モデルの特徴は、事前学習用データを日本語ビジネスニュース記事としていることです。そのため、ビジネスニュース特有の文章表現を事前学習していることで、ビジネスに関する領域で効果を発揮します。

これまで人が文章を読まないと判断ができなかったビジネスにおける新しい製品名やサービス名、新興企業などを自動抽出(理解)することが可能となったり、大量のビジネス文章から抽象度の高い読解が可能となりました。

これにより弊社の言語処理は格段に精度が上がったのです。どのように上がったのか?わかりやすい例をあげて解説します!

概念の理解

これまでは、キーワードベースで1つ1つの言葉を認識することができました(図左)。それが、意味を理解し、物自体のスマホとタブレットを認識しつつ、2つは近い!ということを理解してAIが言葉のグループ感を理解できるようになったことで分類でできるようになったのです(図右)。
キーワードではなく、概念ベースで理解可能になったのです!

スクリーンショット 2020-05-20 20.17.02


文の理解

つぎに、文を詳しく理解できるようになりました。
わかりやすく図で見てみましょう!
当社の旧来の方法では短い文章しか考えることができず、ある程度の意味しか理解できませんでした(図上)。
それが、遠い文脈までつなげて考えることができるようになり、より詳細(長いセンテンスの文脈)を理解できるようになりました(図下)。

スクリーンショット 2020-05-21 17.19.20

日本語はとても難しいので、文章の一部だけ切り取るとかなり意味が変わってしまうことが多いですよね。
例えば、「来週の金曜の夜に彼氏の友達と焼肉を食べに行く」という文章になると、旧来では「友達と焼肉を食べに行く」しか理解できないことになります。前の部分の文が理解できないとかなり意味が違ってきますよね^^;

文脈の理解

また、文脈を理解することもできるようになりました。
前後の文脈を読み取ることにより、図のように名詞を分類し判断することができます。

例えばこのような文の場合…
「中野さんは自宅の中野からJR線に乗って東京に行きJR東海の新幹線に乗って大阪で福岡さんに会った」

スクリーンショット 2020-05-29 9.59.14

・「中野」→人名と地域の判別
・「JR線」と「JR東海」→一般名詞と組織(会社名)を判別
・「大阪」→地域
・「福岡」→人名

と認識できるのです。(すごくないですか!??)
特に注目は、人名と地域。前後の文脈が理解できていなければ、この判断はできませんよね。

言葉のAI

AIが人間を超えることはまだまだ先ですが、AIの進化は止まらず加速しかありません!

このようにどんどん賢くなっていくことによって、ビジネスにおいても活用できるようになってきました。

上記で解説したAIをストックマークでは、「言葉のAI」と名付けました!^ ^
こう呼ぶと難しい感はなくなりますよね!

ストックマークの「言葉のAI」は、ビジネス領域で重要となる要素が強くなるように作り込みをおこなった独自のAIモデルなので、ビジネス文章に強いのが特徴です。

このようなAI技術を活用して3つのプロダクト「Anews」「Asales」「Astrategy」を開発しています。

次回からは、AIがプロダクトに対してどのように使われているのかを解説しながら、企業の進化をサポートしていくプロダクトをご紹介していきます!

Stockmark は「言葉のAI」で企業の進化をサポートしています。
ご興味のある方は、お気軽にご相談ください!
https://stockmark.co.jp