2024年の注目トレンド：2022～2023年の生成AI動向の考察

2024年8月22日 23:00

2022年は生成型人工知能（AI）が急速に一般の意識に浸透した年でしたが、2023年はその技術がビジネスの世界に本格的に根付き始めた年となりました。研究者や企業がこの技術を日常生活に実用的に統合する方法を模索する中、2024年はAIの未来にとって極めて重要な年となることが予想されます。

生成型AIの進化は、コンピュータの発展に似ているものの、そのスピードは遥かに速いです。少数の企業が開発した大型メインフレームが、徐々に小型で効率的なマシンに置き換えられていったように、生成型AIも「趣味」の段階から進化を続け、今やより小型で高性能なモデルが次々と登場しています。2023年には、MetaのLlaMaファミリーを皮切りに、StableLM、Falcon、Mistral、Llama 2など、オープンライセンスによる高効率の基礎モデルが増加しました。これらのモデルは、オープンソースコミュニティによって開発された微調整手法やデータセットで強化され、ベンチマークで高いパフォーマンスを発揮するようになっています。

進化のペースが加速するにつれ、メディアの注目を集める最先端のモデルが登場する一方で、企業とエンドユーザーにとって、生成AIの信頼性や持続性、アクセス性を向上させるためのガバナンスやトレーニング手法、データパイプラインに重点を置いた開発が、今後のAIの発展において重要な役割を果たすでしょう。

2024年の注目トレンド

現実的な期待の再確認

生成型AIが初めて大衆の注目を集めた際、多くのビジネスリーダーは、マーケティング資料やニュース報道に基づく過剰な期待を抱いていました。たとえば、「AIがすぐに全ての業務を自動化し、劇的に効率を上げる」という考え方です。しかし、実際にAIを導入してみると、期待ほどの成果が得られなかったケースも多く、AIの限界や課題が明らかになりました。

例えば、AIチャットボットを顧客対応に導入した企業の中には、初期の期待に反して、複雑な問い合わせには十分に対応できないことが判明し、顧客満足度が低下するという結果を招いた例があります。

これにより、企業はAIを補助的なツールとして活用し、複雑な対応には人間のサポートを組み合わせることで、より現実的な期待を持ってAIの活用を進めるようになりました。
このように、2024年には、AIの実力を正確に理解し、誇大な期待に基づく投資を避け、現実的かつ効果的な活用方法を模索する動きが強まると考えられます。

マルチモーダルAIの台頭

次世代の生成型AIは、テキストだけでなく、画像やビデオなど、複数のデータタイプを扱えるマルチモーダルモデルに重点が置かれています。これにより、ユーザーはより直感的で多用途なAIアプリケーションを利用できるようになり、AIの活用範囲が広がります。

従来のAIモデルは、テキスト、画像、音声など、単一のデータタイプに特化していました。しかし、現実世界の問題はこれらが複雑に絡み合っていることが多く、単一のデータタイプだけでは十分に対応できません。マルチモーダルAIは、例えば、ユーザーが画像を見せながら質問したり、ビデオを再生しながらその内容に関して指示を受けたりするような、より自然で直感的なやり取りを可能にします。

マルチモーダルAIは、テキスト、画像、ビデオ、音声など複数のデータタイプを同時に扱うことで、より深い理解を実現します。例えば、医療分野では、患者の診断において、画像診断データ、患者の病歴（テキスト）、診療の音声記録などを統合して判断する必要があります。マルチモーダルAIは、これらの異なるデータソースを統合することで、より精度の高い診断や治療計画を提供できる可能性があります。

小型化とオープンソースの進展

より小型で効率的な言語モデルが、今後も進化を遂げるでしょう。オープンソースコミュニティによって開発されたモデルやツールは、AIの民主化に寄与し、より多くの企業や個人がAIを活用できる環境を提供します。これにより、エッジコンピューティングやIoTなどのシナリオにおいて、AIの利便性が向上します。

「小型化とオープンソースの進展がAIの民主化に寄与した」と言い切れる具体的な要因は、
①リソースの制約を超えるアクセスの広がり
②オープンソース化による知識と技術の共有
③教育やトレーニングのバリアを下げる
④コミュニティによる改善と適応
⑤法的およびプライバシーの配慮

これらの要因がAIの利便性を向上させていると言えます。

GPU不足とクラウドコストの増加

AIの普及に伴い、ハードウェアの需要が高まり、GPU不足が深刻化しています。この状況下で、より小型で効率的なモデルの開発が進む一方で、クラウドコンピューティングのコストも増加しており、企業は柔軟な対応が求められています。

AIモデル、とくに大規模なディープラーニングモデルのトレーニングや推論には、膨大な計算能力が必要です。この計算能力を提供する主要なハードウェアがGPU（グラフィックスプロセッシングユニット）です。NVIDIAはこの分野で圧倒的なシェアを持ち、同社のGPUはAI研究者や企業にとって不可欠なものとなっています。

しかし、2020年代初頭から中頃にかけて、AI技術の爆発的な成長に伴い、GPUの需要が急増しました。この需要の急増に対して、供給が追いつかない状況が続き、結果としてGPUの不足が深刻化しました。特に、パンデミック中のサプライチェーンの混乱や半導体の供給不足も、この状況をさらに悪化させました。

AIをクラウドで運用する企業は、必要な計算リソースをクラウドプロバイダーから借りることが一般的です。しかし、GPUの供給不足に伴い、クラウドプロバイダーも必要なハードウェアを確保するのが難しくなり、その結果、クラウドサービスのコストが上昇しました。

たとえば、2023年には、主要クラウドプロバイダー（Amazon Web Services、Google Cloud、Microsoft Azureなど）がGPUを提供するサービスの価格を引き上げる事態が見られました。これにより、AIを利用する企業の運用コストが増加し、特にスタートアップや中小企業にとっては大きな負担となりました。

カスタマイズされたローカルモデルとデータパイプライン

2024年には、企業が特注のモデル開発を通じて差別化を図る動きが加速すると予想されます。オープンソースモデルをベースに、独自のデータでトレーニングされたAIモデルが、法務や医療、金融などの特定の業界において重要な役割を果たすでしょう。

「カスタマイズされたローカルモデルとデータパイプライン」に関する最新の動向として、エッジコンピューティングの進展があります。
エッジコンピューティングの台頭により、AIモデルをクラウドではなく、デバイス上や企業のローカル環境で実行する動きが強まっています。これにより、データがデバイスの近くで処理されるため、リアルタイムでの応答や、ネットワーク遅延の削減が可能になります。たとえば、スマートフォンやIoTデバイス上でAIを実行するケースが増え、データのプライバシー保護や低遅延のメリットが注目されています。

大規模モデルのトレーニングには大量のリソースが必要ですが、軽量化されたモデルは少ない計算リソースで高いパフォーマンスを発揮できます。特に、LoRA（低ランク適応）や量子化技術（モデルを圧縮して効率を向上させる手法）などの手法が、軽量モデルの性能をさらに向上させています。これにより、企業や研究者はカスタムAIモデルを比較的容易にトレーニング・デプロイできるようになりました。

また、複数のデバイスや環境でAIモデルをトレーニング・推論する分散型アプローチも進んでいます。これにより、大規模な計算リソースが不要となり、リソースが限られた環境でも効率的にAIを運用することが可能になっています。

強力な仮想エージェントの普及

より洗練されたツールと1年分の市場フィードバックを活用することで、企業は単純なチャットボットを超えた仮想エージェントの活用を進める準備が整っています。マルチモーダルAIの進化により、仮想エージェントがタスクの自動化やシームレスなインタラクションを実現する可能性が高まります。

仮想エージェントの活用を進める準備には、企業はまずデータインフラを整備する必要があります。これには、データの収集、保存、整理、そしてアクセス可能な状態に保つことが含まれます。特に、仮想エージェントが顧客対応や業務プロセスをサポートする場合、関連する過去のデータやリアルタイムのデータに迅速にアクセスできる仕組みが重要です。

仮想エージェントを特定の業務やサービスに適応させるためには、AIモデルをトレーニングし、カスタマイズします。企業は、自社のニーズに合わせたトレーニングデータを用意し、AIモデルを訓練することで、エージェントが適切な応答やアクションを提供できるようにします。また、ドメイン固有の知識や業界の専門用語に精通させるための微調整が必要とすることによって仮想エージェントを創り出す仕組みです。

規制、著作権、AI倫理に関する懸念

AIの進化と普及に伴い、規制や倫理に関する議論が一層重要になっています。特に、著作権やプライバシー、偏見の永続化に関する問題が浮上しており、企業はこれらの課題に対処するための戦略を策定する必要があります。

1. 著作権に関する問題

生成型AIモデルは、トレーニングデータとして膨大な量の既存コンテンツを使用しますが、その中には著作権で保護された作品が含まれていることが多く、この点が問題視されています。

例1: アーティストとAIの対立 オープンAIのDALL-EやMidjourneyのような画像生成AIは、トレーニングデータとしてインターネット上にある無数の画像を使用しており、その中には著作権で保護されたアート作品も含まれています。これに対し、アーティストたちは「AIが自分たちの作品を無断で使用している」として抗議しており、いくつかの法的措置が検討されています。アーティストの中には、自分の作品がAIに学習されることで独自性が失われると主張する者もおり、AIによる「盗作」が問題視されています。
例2: 作家とAIの法廷闘争 2023年には、作家や出版社が生成型AIのトレーニングデータとして自分たちの作品が無断で使用されたとして、AI開発企業に対して訴訟を起こす事例が出てきました。特に、OpenAIがトレーニングに使用したデータセットに著作権で保護された文章が含まれていたとされ、これが著作権侵害にあたると主張されています。

2. プライバシーに関する問題

生成型AIが個人データを処理する際のプライバシー問題も深刻です。AIが個人のプライバシーを侵害するリスクが増大しています。

例1: 音声アシスタントによるプライバシー侵害 AmazonのAlexaやGoogle Assistantといった音声アシスタントは、ユーザーの音声コマンドを収集し、これをトレーニングデータとして活用していますが、誤ってプライベートな会話を記録してしまう事例が報告されています。このデータがどのように保管され、使用されているかが不透明であるため、ユーザーのプライバシーが脅かされる懸念があります。
例2: データセットにおける個人情報の無断使用 ある研究者が、SNSから大量の個人情報を無断で収集し、それをAIのトレーニングデータとして使用したケースがありました。このような無断のデータ収集は、ユーザーのプライバシーを侵害する可能性が高く、データ保護規制に違反する恐れがあります。

3. 偏見の永続化に関する問題

AIモデルは、トレーニングデータのバイアス（偏見）をそのまま学習してしまい、その結果、偏見を助長したり、固定化したりすることがあります。

例1: 採用プロセスにおけるAIのバイアス ある企業が採用プロセスにAIを導入したところ、過去の採用データに基づいてトレーニングされたAIが、性別や人種によるバイアスを学習し、特定の性別や人種を不当に評価する傾向を示しました。結果的に、このAIを使用した採用プロセスでは、女性やマイノリティが不利な立場に置かれることが判明し、問題となりました。
例2: 顔認識技術の偏見 顔認識AIが、特定の人種や性別に対して不正確な判断を下す例も問題視されています。例えば、黒人や女性の顔を正しく認識できず、誤った識別が行われるケースが多く報告されています。このような偏見は、法執行機関による誤認逮捕や、不適切な監視行為につながる可能性があります。

シャドーAIと企業ポリシー

生成型AIツールの人気とアクセス性の高さが、企業にとって新たな課題をもたらしています。従業員が職場で非公式にAIを使用する「シャドーAI」は、セキュリティやコンプライアンスのリスクを引き起こす可能性があり、企業はこれに対処するための明確なポリシーを制定する必要があります。

現在、多くの生成型AIツールがインターネット上で無料または低コストで提供されています。これらのツールは簡単に利用できるため、従業員が業務を効率化したり、独自のプロジェクトに活用したりするために個人的に利用するケースが増えています。例えば、テキスト生成ツールや画像生成ツールは、特別な技術知識がなくても簡単に利用できるため、承認を得ずに使われることが多いです。

多くの企業では、AIの利用に関する明確なガイドラインやポリシーが定められていないことがあります。このような状況では、従業員がどのツールを使ってよいのか、どのように使うべきかが不明確になり、結果的にシャドーAIが発生しやすくなります。

技術に精通した従業員は、新しいAIツールやサービスを試してみたいと考えることが多く、企業の許可を待たずにこれらを使用することがあります。特に、最新の技術動向を追求したいという意欲が強い従業員において、シャドーAIの発生率が高くなります。

そのため、企業が行う対策としては、AIツールの使用に関する明確なポリシーやガイドラインを策定し、それを全従業員に周知する必要があります。ポリシーには、どのツールを使用してよいか、どのような状況で使用が許可されるか、データの扱いに関するルールなどを含めるべきです。従業員がAIツールを利用する際に、何をすべきかが明確になれば、シャドーAIの発生を抑制できます。

前進するために

2024年は、AIの進化において極めて重要な年となるでしょう。新たなトレンドを理解し、適応することで、企業はAIの潜在能力を最大限に引き出し、リスクを最小限に抑えつつ、責任を持って生成型AIを導入することが求められます。

企業側の立場から
1. 明確なAI戦略とガバナンスの確立
2. 技術インフラの整備と人材育成
3. イノベーションを促進する文化の構築

従業員側の立場から
1. AIに対する理解と責任ある利用
2. 継続的な学習とスキルの向上
3. オープンなコミュニケーションとコラボレーション

これらのことを企業と従業員が協力し、AIの進化を取り入れながらリスクを管理し、責任ある利用を実現することが重要です。これにより、AIの潜在能力を最大限に引き出し、組織全体で持続可能な成長を遂げることができるのではないでしょうか。