見出し画像

【AI/DX事例解説】Google検索の進化と、最新の自然言語処理モデル「MUM」

ESTYLEのデータサイエンス事業部の筒井です。

皆さんはインターネットでなにか調べ物をするとき、どの検索エンジンを使っていますか?Yahoo!やBingなど様々な種類がある中で、Google検索を利用している方が圧倒的に多いのではないでしょうか。

「ググる」という言葉が生まれるほど人々に広く認知されているGoogle検索の裏側には、音声認識や画像認識、自然言語処理(NLP)といった最新のAI技術を駆使し、Googleが検索の精度・質の向上のために検索アルゴリズムをアップデートさせ続けてきた歴史があります。

そして現在もなおアップデートは続き、2021年最新情報として新たな自然言語処理アルゴリズム「MUM」という革新的な技術を実装予定であることが発表されました。今回は、これから実装される予定の最新技術「MUM」についてまとめてご紹介していきます。

Google検索のアルゴリズムとは

ユーザーの検索意図を理解して最適な情報群を提示する

スクリーンショット 2021-09-09 13.14.07

Googleでは、検索エンジンを利用するユーザーに対して、最適な情報を見つけやすい形で提示しています。これには、Googleが独自に開発している検索アルゴリズムが関わっています。まずは、Google検索のアルゴリズムについて、簡単にまとめていきます。

たとえば、わたしたちがGoogleの検索エンジンで調べ物をする時、たいていの人は知りたいことに関するキーワードを入力しますよね。仮にあなたが箱根旅行を計画していて、評判のいいホテルを知りたいとしましょう。この場合、「箱根 ホテル 人気」などのキーワードで調べるかと思います。

このような検索キーワードに対して、Googleの検索結果画面に出てくるのは、まさに「箱根」「ホテル」「人気」のキーワードに合っているサイトばかり。様々なホテルの情報がまとめられた旅行サイトのページが表示され、Googleマップ上にはホテルの位置、レビュー、一泊の価格が記載されるでしょう。そして、検索結果の上にあるサイト・記事ほどユーザーの知りたい内容に関連性が高く、表示されている順番が低いサイト・記事ほど関連度が少ないというランキング制になっています。

このように、検索されたキーワードからユーザーが求めている内容を判断して、インターネット上の何千万というサイトから最適なものを選び出し、適した順番でユーザーに提示する。これが、Google検索のアルゴリズムの基本です。

Googleの検索アルゴリズムによって、検索結果として表示されるページの順位は下記のポイントが要因となっています。

・ 検索意図を把握する(ユーザーはなにが知りたい?)
・ ウェブページの関連性(ユーザーの知りたい内容に合ったページはどれ?)
・ コンテンツの品質(ページの内容は新しく、信頼性がある?)
・ ユーザビリティ(パソコン、タブレット、スマートフォンで問題なく見られる?)
・ 文脈の考慮(ユーザーの現在位置などの情報に適した情報か?)
参照:Google「Google 検索の仕組み」
https://www.google.com/intl/ja/search/howsearchworks/algorithms/ [1]

これだけを見ると、Google検索アルゴリズムが判断する内容は非常にシンプルに思えるかもしれません。しかし、実際に検索内容の表示のためにアルゴリズムが行っていることは、非常に複雑です。

何か特定の物事に関する内容なのか、幅広い情報なのか、はたまた「開店時間」などピンポイントで具体的な情報を求めているのか。また、「J リーグの試合結果」や「M-1 グランプリの優勝者」など、鮮度が大事な情報を求めているのか。付近のカフェやレストランなど、自分の位置情報に基づいた内容を求めているのか。このようなユーザーの意図を、検索窓に入力された数ワードから判断しなければなりません。

そして、これらのようなユーザーの意図を判断した後には、ユーザーが求める内容に対して最適な情報を提示するために膨大な量のウェブページを解析します。具体的には、記事内にユーザーが調べた検索キーワードが多く盛り込まれているか、記事の内容は正確か、ユーザーの求めている内容に対して答えを提示しているか、情報は新しいか(公開日時や更新日時の鮮度)などです。

ユーザーがキーワードを入力して検索ボタンを押したあと、検索結果が表示されるまでの一瞬の間に、裏側では非常に複雑で膨大な処理が行われているのです。このような検索時の情報処理には、ユーザーの検索意図やWebページの内容を理解するために自然言語処理が使われています。さらに、音声検索がされた場合には音声認識、画像検索がされた場合には画像認識の技術が使われるなど、多くの技術が組み合わされて現在のGoogle検索を可能にしています。

2019年のBERT(バート)アルゴリズムにより検索精度が向上

自然言語処理を活用した「文脈」を理解するアルゴリズム
ここまでご紹介したGoogle検索のアルゴリズムは、最初から全ての機能や高い精度を備えていたわけではありません。Google検索エンジンでは、大きいものから小さいものまで様々なアップデートが行われてきました。何度もアップデートを重ねることで、現在の高い精度を実現してきたのです。

そのなかでも、近年のアップデートで非常に話題を呼んだのが2019年の「BERT(バート:Bidirectional Encoder Representations from Transformers)」という自然言語処理アルゴリズムの実装でした。

BERTの大きなポイントは、今まで検索キーワード(単語の羅列)に対して最適な検索結果を返していたところを、文章型の検索ワードに対して関連性の高い検索結果を返せるようになったという点です。例をあげると、下記のような形です。

例:”Can you get medicine for someone pharmacy”と検索した場合

ユーザーの意図:
誰かのために、薬局で代わりに薬を受け取ることができるか?
つまり、薬局で家族や友人など誰かのために代わりに薬を受け取れるか知りたい。

BERT(バート)実装前:
「処方箋の受け取り方」について説明したWebページが表示される。
つまり、誰かのために(for someone)という内容に注目されていない。

BERT(バート)実装後:
友人や家族が、患者のために処方箋を受け取ることができるかどうかを説明したWebページが表示される。
つまり、誰かのために(for someone)という内容が重要視された。

BERTが実装される前の自然言語処理アルゴリズムでは、複雑な文章や長い文章で検索された場合、最適な結果を選択できないことが多くありました。これは、アルゴリズムが to や for などの前置詞を正しく理解しきれないためであり、その背景もあってユーザーが検索をする際には単語ごとに区切ったキーワード検索が主となっていました。

BERTの長所:単語の持つ意味を文脈から判断できる

しかし、BERTモデルでは、ニューラルネットワークをベースにした自然言語処理を採用し、高度な「文脈判断」が可能になりました。ある単語とその前後の単語を見ることで、文全体で単語の持つ文脈を判断することができ、長く複雑な文章タイプの検索ワードでもユーザーの意図を理解することができるようになったのです。実際に、BERTの実装によりアメリカでは英語を使った検索で10回に1回の割合で回答が改善されたという内容がGoogleから発表されています。

参照:Google ”Understanding searches better than ever before”
https://www.blog.google/products/search/search-language-understanding-bert/[2]

以上のように、2019年のBERTはAIによる自然言語処理を利用した革新的な技術として大きな注目を集めました。しかし、Googleの検索アルゴリズムはこれで完成ではありません。2021年現在、GoogleはBERTアルゴリズムを超える非常にパワフルな自然言語処理アルゴリズム「MUM」を実装予定だと発表。ここからは、Google検索の更なる進化について見ていきましょう。

BERTの1,000倍の性能を持つ新アルゴリズム「MUM」

ユーザー体験を一気に飛躍させる革新的な自然言語処理モデル

スクリーンショット 2021-09-09 13.17.27

新たな自然言語処理アルゴリズム「MUM(マム:Multitask United Model)」は、開発元のGoogleがBERTの1,000倍の性能をもつと発表しているほどの革新的な技術です。

MUMの大きな特徴は、以下の3点です。

・従来のモデルよりも、情報について包括的に理解できる。
・情報をマルチモーダル(テキスト、画像、動画など様々な形式の情報に対応可能)で同時に理解し、ユーザーに提示できる。
・言語をまたいで情報を理解し、ユーザーに提示できる。

これらの特徴により、MUMはユーザーの複雑な質問意図を的確に理解し、その回答となる内容を、テキスト・画像など異なる形式の情報を同時に処理しながら非常に早いスピードで見つけ出すことが可能です。その際、ユーザーに対して提示する情報として、テキストや画像情報だけでなく動画や音声といった形式で答えることもできます。

それだけでなく、ユーザーが知りたい情報について、ユーザーが使用した言語以外で書かれた情報についても調べにいき、ユーザーが使う言語に翻訳して提示するのです。

MUMのメリット:少ない検索回数で必要な情報を得ることができる

これらの特徴をよく説明する例として、Googleは富士山の登山情報についてのシーンをあげています。

例:「私は以前アダムス山に登ったことがある。次は、来年の秋に富士山に登りたい。さて、どんな準備をすれば良い?」

どんな準備をすれば良いかというのは非常に漠然とした質問です。従来のアルゴリズムでは、ユーザーが自分で「それぞれの山の標高」「秋の平均気温」「ハイキングコースの難易度」「使用するのに適した道具」など質問すべき内容を熟考した上で、何回かに分けて検索する必要があるでしょう。

しかし、MUMではこういった「何回かに分けて検索しなければいけない複雑なタスク」を一気に処理することができます。

2つの山を比較していることから、標高や登山道の情報が関係することを理解し、「日本では富士山は秋が雨季なので、レインコートが必要かもしれない」といった情報を提示することが可能。さらに、ハイキングの準備には適切な道具を見つけることだけでなく、フィットネスのトレーニングなども含まれることまで理解して、トレーニング方法等のサブトピックまで掘り下げることも。マルチモーダルに対応しているため、一流のギア(登山グッズ)やトレーニング方法を画像・動画で紹介してくれます。

以上のように、MUMを使うことでユーザーは少ない検索回数で必要な情報を得ることができるのです。このような性能を実現するため、MUMには「T5 text-to-textフレームワーク」と呼ばれる技術が採用されています。さらに、75の異なる言語と様々なタスクを同時に学習させることで、従来のモデルを超えた情報の理解・提示が可能になっています。

Googleは「そのうち、登山靴の写真を撮って、"この靴で富士山に登ってもいいか?”と聞くことができるようになるかもしれない」とも発表しており、ユーザーの情報検索にさらなる進化をもたらすために研究を進めていくようです。

参照:Google ”MUM: A new AI milestone for understanding information”
https://blog.google/products/search/introducing-mum/ [3]

まとめ

今回は、Googleの検索アルゴリズムの基本情報と、最新の自然言語処理アルゴリズム「MUM」についてまとめてきました。

MUMは数ヶ月から数年をかけて実装されていくとのことですが、いつ本格的に実装が始まるのか、今から待ち遠しいですね。まるで友達に聞くような感覚で情報を調べることも、そのうち可能になるかもしれません。

将来どんな技術を用いてどこまで進化していくのか予想もつきませんが、引き続きニュースを追っていきたいと思います。

リンク

[1]Google「Google 検索の仕組み」
https://www.google.com/intl/ja/search/howsearchworks/algorithms/

[2]Google ”Understanding searches better than ever before”
https://www.blog.google/products/search/search-language-understanding-bert/

[3]Google ”MUM: A new AI milestone for understanding information”
https://blog.google/products/search/introducing-mum/

採用情報

ESTYLEは、「コウキシンが世界をカクシンする」という理念のもと、企業のDXを推進中です。経験・知識を問わず、さまざまな強みを持ったエンジニアが活躍しています。

未経験文系からデータサイエンティストへ

弊社では、スキルや経験よりも「データを使ってクライアントに貢献したい」「データ分析から社会を良くしていきたい」という、ご自身がお持ちのビジョンを重視しています。

ご応募・問い合わせはこちら

この記事が気に入ったらサポートをしてみませんか?