生成AIの新たなインフラスタック:企業が必要とする新たなツール
新世代のAI、特に生成AIは、テクノロジー業界を席巻しています。しかし、その実現には新たなインフラツールが必要となります。Cowboy Venturesの記事「The New Generative AI Infra Stack」では、この新たなインフラスタックについて詳しく解説しています。この記事では、その要点を抽出し、生成AIの全体像を理解するためのガイドとして提供します。
生成AIの新たなインフラスタック
生成AIは、ChatGPTやGitHub CoPilotのようなアプリケーションを数百万人が利用するなど、2023年第1四半期には17億ドルが投資されるなど、テクノロジー業界を席巻しています。しかし、その実現には新たなインフラツールが必要となります。以下に、その主要な要点を箇条書きでまとめます。(一部のスタックのピックアップ)
基盤モデル
大規模なデータセットで訓練され、幅広いタスクを実行できる基盤モデルは、ChatGPTのような強力な生成AIアプリケーションの基礎となります。基盤モデルを選択する際の重要な考慮事項は、オープンソースとクローズドソースの選択で、それぞれの利点と欠点があります。
オープンソース:カスタマイズが容易で、訓練データへの透明性が高く、コスト、出力、プライバシー、セキュリティに対するユーザーのコントロールが強い。一方で、デプロイメントの準備や微調整、訓練にはより多くの作業が必要となる可能性があります。
クローズドソース:管理されたインフラストラクチャと計算環境を提供し、モデルの機能を拡張するエコシステム拡張を提供することがあります。しかし、訓練データへの洞察が少なく、出力の説明と調整が難しい。
ファインチューニング
既存のモデルのパラメータを調整して特定のユースケースに対する「専門知識」を構築するプロセスです。ファインチューニングは、パフォーマンスを向上させ、訓練時間とコストを削減することができます。
データストレージと取得
長期的なモデルメモリとデータ取得のためのデータストレージは、複雑で高コストなインフラ課題であり、スタートアップがより効果的なソリューションを構築する機会を提供します。
モデル監督:モニタリング、観察可能性、説明可能性
モデル監督は、モデルがプロダクションでライブになってから評価するための異なるステップを説明する用語で、モニタリング、観察可能性、説明可能性を含みます。
モニタリング:モニタリングはパフォーマンスの追跡を含み、故障、停電、ダウンタイムの特定などを行います。
観察可能性:観察可能性は、パフォーマンスが良いか悪いか、またはシステムの健康を評価するプロセスです。これは、システムの内部動作を理解し、問題の診断や予防を可能にします。
説明可能性:説明可能性は、モデルが特定の決定に至った理由を説明することについてです。これは、モデルの出力がどのように生成され、どの特徴が決定に影響を与えたかを理解するために重要です。
モデルの安全性、セキュリティ、コンプライアンス
企業がモデルをプロダクションに移行するにつれて、モデルの安全性、セキュリティ、コンプライアンスはますます重要になります。企業が生成AIモデルを信頼するためには、モデルの公平性、バイアス、毒性(安全でないまたは憎悪的なコンテンツを生成する)の正確な評価を提供するツールが必要です。
生成AIモデルがプロダクションに移行に伴う機会:コンプライアンスミドルウェアの機会
生成AIモデルがプロダクションに移行するにつれて、モデルの安全性、セキュリティ、そして特にコンプライアンスがますます重要になります。企業が生成AIアプリケーションを信頼するためには、モデルの公平性、バイアス、毒性(安全でないまたは憎悪的なコンテンツを生成する)の正確な評価を提供するツールが必要です。
このため、コンプライアンスミドルウェアには大きな機会があります。企業は、生成AIアプリケーションがコンプライアンス基準(著作権、SOC-2、GDPRなど)を侵害しないことを保証する必要があります。これは、金融やヘルスケアなどの厳格に規制された業界でビルドしているチームにとって特に重要です。
スタートアップからのイノベーション、そして既存企業からのイノベーションを見ることを楽しみにしています。例えば、Cowboy Venturesの企業であるDrataは、生成AIモデルのコンプライアンスに対して機能を統合するか、または機能を構築するために適しています。
示唆
生成AIは企業にとって大きな効率化をもたらし、インフラにおいて大きな新しい企業の機会を生み出します。採用の最大のボトルネックはコストとセキュリティであり、これらのコアバリューを提供するインフラスタートアップは成功する位置にあります。また、オープンソースは生成AIインフラにおいて重要な役割を果たすと考えられます。オープンソースモデルを使用するスタートアップは、ユーザーとの信頼を得やすく、オープンソースコミュニティからのイノベーションとサポートを受けることができます。