見出し画像

DX再考 #17 自動化(その2)

ディープラーニング

 前回紹介した焼きたてパンやきゅうり、廃棄物の識別に使われている技術がディープラーニング(深層学習)である。
  ディープラーニングは、機械学習の一つの手法であり、この分野の第一人者である東京大学大学院工学系研究科の松尾豊教授は、「人工知能研究における50年来のブレークスルー」だと評価している技術である。1

 ディープラーニングは、脳の神経回路の一部を模したニューラルネットワークに大量のデータ(テキスト、画像、音声など)を入力することによって学習を行う。ここでは詳細な説明は省くが、さまざまな分野で実用化が進んでおり、一部では人間を超える認識精度に到達している。2

ニューラルネットワークのイメージ(筆者作成)

 2012年にGoogleが猫を認識できたと発表したのもディープラーニングの成果だし、2016年に「世界最強」の棋士イ・セドルに4勝1敗したAlphaGoもディープラーニングを利用している。

 ちなみに猫の認識に使われたニューラルネットワークは9層で、入力層のノードは12万(200×200のピクセルのRGB値)、入力はYouTubeにアップロードされた動画からランダムにピックアップした1000万枚の画像で、学習時間は1000台のコンピュータを使って3日間を要したと言われている。

AlphaFold2

 ディープラーニングはさまざまな領域で利用が進んでいる。実用化されたものもあれば、実用化寸前のものも、自動車の完全な自動運転のように予想されていたより実用化が遅れているものもある。
 製造プロセスでの異常検知や外観検査、バラ積み部品を判別できるピッキング・ロボット、CTやMRI等の医療画像の診断、アニメの自動着色、キャラクター画像の自動生成、自動翻訳、音声認識、手書き文字の読み取り、音声や音楽の生成、自律型ロボット、自動車の自動運転、ドローンの自動操縦など、あらゆる分野でディープラーニングの利用が進みつつある。
 
 たとえば、2020年11月にDeepMind社が発表した「AlphaFold2」というシステムは分子生物学や生命科学の領域で革命的な変化をもたらしているが、これもディープラーニングの応用事例である。
 AlphaFold2は、タンパク質のアミノ酸配列からその立体構造(3次元構造)を高い精度で予測することができるソフトウェアである。
 タンパク質は生命には不可欠な物質で、20種類のアミノ酸が数十個から数千個連なった大きくかつ複雑な分子である。筋肉を動かすミオシンも、血液中で酸素を運ぶヘモグロビンもタンパク質である。このようにタンパク質は、その種類によってさまざまな機能を持っているが、その機能はそれぞれのタンパク質の独特の立体構造に依存している。その立体構造は、アミノ酸配列によって決定されるのだが、アミノ酸配列からタンパク質の立体構造を推定することは極めて困難だと思われてきた。
 このアミノ酸の鎖がどのように折り畳まれて立体構造を作るのかを高い精度で予測可能にしたのがAlphaFold2である。
 このAlphaFold2は、2021年7月にソースコードがGitHub上で無償公開され、誰でも自由に利用することが可能になっている。 また、AlphaFold2によって予測された2億以上ものタンパク質の立体構造が、AlphaFold Protein Structure Database上で公開されている。

ChatGPT

 この原稿を書いている時点で最もホットな人工知能(AI)は、ChatGTPである。ChatGTPは、AIの研究所であるOpenAIが2022年11月にプロトタイプを公開したチャットボットで、利用者が入力した自然文の質問に対して、まるで人間が書いたような自然な文章で回答してくれる機能を持っている。ただし、重大な問題が一つある。
 それは、事実とは異なる回答をすることがあるという点である。つまり息をするように嘘をつくAIなのである。もっとも、ChatGPTは人間ではないので、嘘をついているという意識はない。そもそも正しい情報と間違えた情報の区別はなく、ただ学習したデータの基づいて自然な文章を作成しているにすぎない。

 たとえば、「ChatGPTについて教えてください」という質問を投げかけたところ、以下のような回答が返ってきた。

 ChatGPTは、OpenAIによってトレーニングされた大型の自然言語生成モデルです。
 このモデルはTransformerと呼ばれる深層学習のアーキテクチャを採用し、大量のテキストデータを学習しています。このため、自然言語処理タスク(例えば、対話、文書生成、文書のサマリー生成など)を実行することができます。
 ChatGPTはAPIとして提供されており、開発者はこのモデルを活用して自分のアプリケーションやサービスを構築することができます。また、OpenAIはChatGPTを使っていくつかのデモアプリケーションを提供しています。
 知識カットオフは2021年であり、現在の日付は2023年2月13日です。

出典:ChatGPT(https://chat.openai.com/chat)の出力

1 松尾豊『人工知能は人間を超えるか』KADOKAWA、2015年3月、p.147
2 2019年にGoogleとメディカルスクールのチームが発表した研究成果によれば、CT画像による肺がんの診断において、ディープラーニングを利用したシステムは、その正確性において放射線科医と同等かそれ以上であった。


いいなと思ったら応援しよう!