GoogleはAIにマルチタスクを学習させているが、意外にも苦手!?

画像1

DesignTAXIは2021年11月02日に、AI(Artificial Intelligence/人工知能)は、あらゆる場面で目覚ましい発展を遂げている。

しかし、AIには大きな欠点がありる。それは、非常に特定のことを行うように訓練することはできても、一度に1つのことしか処理できないという。Googleはこの問題に対処するために、「Pathways」という新しいアプローチを考えている。

https://time-az.com/main/detail/75527

これは、Googleのシニアフェロー兼グーグルリサーチ担当SVPのジェフ・ディーン(Jeff Dean, Google Senior Fellow and SVP of Google Research)が説明するように、「次世代のAIアーキテクチャ」であり、「1つのモデルを訓練して、何千、何百万ものことができるようになる。」というものであると言う。新世代のモデルは、1つの「感覚」だけに反応するのではなく、複数の「感覚」に同時に反応できるようになる。

ジェフ・ディーンは、Googleのブログで「Pathwaysは、視覚、聴覚、言語理解を同時に網羅するマルチモーダルモデルを可能にするでしょう。」と説明している。

彼は「ヒョウ」を例に挙げて、このモデルは、「ヒョウ(leopard)」という言葉を処理しているのか、誰かが 「ヒョウ」と言っているのか、「ヒョウ」のビデオを処理しているのか、どちらでも構いません。なぜなら、最終的には「ヒョウ」という概念という同じ反応が生じるからです。
ジェフ・ディーンは、このモデルは「より洞察力があり、間違いやバイアスがかかりにくい」と言う。

オーディオ、ビジュアル、テキストなどの「身近な感覚」でも動作しますが、より抽象的なデータも扱うことができ、最終的には「気候力学などの複雑なシステムにおいて、人間の科学者が逃れてきた有用なパターンを見つける。」ことに役立つ。

Googleが「Pathways」で取り組んでいるもう一つの問題は、大規模なネットワークを必要とする既存モデルの「密度」である。その代わりに、必要なときにネットワーク内の小さな経路のみを起動する、「疎」に起動できるものを構築することを目指している。

また、モデルは、特定のタスクを得意とするネットワークの部分を関連付けることも学習する。
人間が学校で良い成績を取るために、それぞれの学習スタイルを活用しようとするのと同じようなものだと言う。

「Pathways」は、「パターンを認識するだけの単一目的モデルの時代から、世界をより深く理解し、新たなニーズに適応できる、より汎用的なインテリジェント・システムの時代へ」とジェフ・ディーンは結論づけている。これにより、さまざまな状況を乗り越えるための推論能力も身につけられるようになると思われる。

人工知能はさらに知的になりそうですね。

ただし、実用的か?

例えば、www.DeepL.com/Translator(無料版)とGoogle Translator(無料版)を比較すると、確実にGoogle Translator(無料版)が負けている。

これは、残念ながら、人工知能の差である。

いいなと思ったら応援しよう!