生成AIで世界はこう変わる
もう少し全般的な生成AIの知識をつけたいと思ったので、本屋で山積みになっている全般的な本を買ってきました
生成AIは新たに文章や画像、音声などをつくり出すことができる人工知能技術の一種。
ディープラーニング(深層学習)は、機械学習という人工知能の要素技術のなかでも、特に人間の脳を模倣した深いニューラルネットワークを学習する手法を指し、現在の生成AIはこのディープラーニングによって実現されている
生成AI、特にChatGPTのような言語生成AIは、「汎用技術(GPT:General Purpose Technology)」と考えられる
ChatGPTの名前にある「GPT」は汎用技術の GPTではなく、「Generative Pre-trained Transformer」を略したもの
AI研究者の究極目標は、汎用人工知能(AGI:Artificial General Intelligence)の実現、AGIとは、人間の知能と同じく汎用的な知能処理ができる人工知能を指す
「人工知能」という言葉は、1956年にアメリカで開かれたダートマス会議において、コンピュータ科学者のジョン・マッカーシーが使ったのが初出とされている
第三次ブームでは、大量のデータを与えながら、機械が自動的に問題の解き方を学習する「機械学習」のアプローチが主流になる
機械学習を、人間の脳をコンピュータ上で再現した「深い(Deep)」人工ニューラルネットワークで行うのが、「ディープラーニング」
AIは学習に使ったデータ自体をデータベースのような形で保持しているわけではない。あくまでデータは、ニューラルネットワークのパラメータの調整に使われるだけ
最も一般的な機械学習は「教師あり学習」人間が正解データをつくり、そのデータをもとに学習する手法。2つ目は「教師なし学習」機械がデータのなかから自動的に特徴を発見し、グルーピングなどを行う手法
圧倒的な性能の実現に必要なニューラルネットワークのパラメータ数が膨大であることから、このような言語モデルをまとめて「大規模言語モデル(LLM:Large Language Model)」と呼んでいる
ChatGPTなど最近の超高性能な言語モデルを実現する核となった最後のコア技術が「人間からのフィードバックに基づく強化学習(RLHF:Reinforcement Learning From Human Feedback)」
「スケーリング則(Scaling Law)」
トランスフォーマーを使った言語モデルの性能は、モデルサイズ(パラメータ数)、学習に使用するデータセットの量、学習に使う計算量」で決まる。3つの変数を同時に大きくする(スケーリングさせる)ことで、言語モデルの性能は上がっていくという法則
言語モデルは一般的に論理的・数学的なタスクが苦手なのですが、なぜかモデルサイズを大きくするとある階段で能力が開花して、今までできなかったことが突然できるようになる
画像と言語を入力するマルチモーダルモデルなどでは、画像内で注目すべき部分を表す情報を(画像内でペンで丸をつけるなどして)与えたり、入力画像を複数与えることで性能が上がるような、新しいプロンプトの技術も出てきている
画像生成AIが一般に広く知られ、利用されるようになったきっかけは、2022年中盤にStability AI社から公開された画像生成サービス「Stable Diffusion」とMidjourney社の「Midjourney」品質が非常に高く、利用方法も簡単
言語モデルをベースに、AIが問題解決のために必要な行動を決定し、それに必要なツールを選択、実行して目的を達成するような手法は「AIエージェント(あるいは自律エージェント、LLMエージェント、生成的エージェントなど)」と呼ばれている
言語生成AIに対して、外部の知識を参照させて回答させる技術をRAG(Retrieval Augmented Generation/検索によって強化した生成)と言う
端的に言えば、人間ではなく、AIが使う検索エンジンの技術
「ボランニーのパラドックス」
人は言葉で表現できる以上のことを知っている
言葉で表現できる以上のことを「暗黙知」と言う
人間の創造的な作業とされてきたものの大半は、実は「過去の経験のなかから、価値のある新しい組み合わせを見つけること」
生成AIなどの技術による労働への影響を考える場合、その技術が「労働補完型」の技術なのか、「労働置換型」の技術なのか、分けて考える必要がある
マッキンゼーの報告では、生成AIにより670兆円以上の経済効果が世界にもたらされる。イギリスの国内総生産が450兆円でイギリスの1.5倍もの経済効果が世界にもたらされる
ルネサンス期の文化人が活躍できた歴史などが示すように「自由な時間」は人間が創造性や独創性を発揮させ、新たな発見や発明、芸術的な表現を創出する源泉となる
日本は著作権法30条の4によって、原則としてインターネット上の著作物を、著作権者の許可を得ずにAIの学習などの情報解析目的の場合は著作権者の権利が制限され、許諾を得ずに著作物を利用してもよい
人以外の生物が賢くないということではなく、知能というものが相対的な概念だということ。人間からは生物の知能には大きな差がないように見えるが、それぞれの生物間では、その知能の差には大きな意味がある
生成AIが単に「すごく使いやすいもの」「手放せないもの」として認識されるようなレベルになるには、やはり5年くらい、ハードウェアを伴わない生成AIの技術だとしても、2〜3年かかる
勝負に勝つには、人ができない努力を淡々とやり続けたり、勝負どころを見極めて「ここだ」と思ったら一気に仕掛けたりすることが必要
「自分が活躍するためにはどうしたらいいか?」という問いを立てたほうがいい。どんな時代、どんな社会でも、活躍する道はあるし、実際に活躍している人はいる
基礎的な内容も含めて生成AIを理解するにはとても良い新書で、基礎を固めておきたい人にはおすすめの1冊です
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?