ChatGPTとナレッジストラテジー
ChatGPTが世界を席巻していますね。どこにでもあるのです。私の友人たちは、ChatGPTが行った素晴らしいこと、予想外のことの例を常に私に送ってきます。ChatGPTは、わずか5日間で100万人以上のユーザーに到達しました。
私はChatGPTがどれほど優れたものになったかに驚いているわけではありません。しかし、この2ヶ月の間に、こうしたツールの認知度が驚くほど高まったことに驚いています。そして、ChatGPTと大規模言語モデルが、ナレッジ戦略全体とナレッジワーカー全員のための認知アシスタントを構築する能力にどのような影響を与えるか、皆さんに理解してもらうことを後押ししています。
多くの読者は、私をエンタープライズナレッジグラフの採用戦略の専門家だと思っています。しかし、友人のRavi Kondadidiが2019年にその可能性について私を説得して以来、私は数年にわたり大規模言語モデルを密接に追いかけてきました。私は、教師がSTEMの授業計画、用語集、多肢選択問題を生成するのを助けるために、GPTとBERTについて書き始めました。そして、リリースするたびに、GPTはより良くなっていきました。単純なプロンプトから正しいコンテンツを生成することが容易になったのです。
そして今、OpenAIは強化学習をワークフローに追加し、再びモデルを微調整しています。その結果は素晴らしいものでした。そして、生成AIは、私が可能だと思わなかったレベルまでハイプカーブに乗りつつあります。しかし、ここで一旦立ち止まって、何が起こっているのか、そしてジェネレーティブAIが知識労働者の生産性にどのような影響を与えるのかを考えることが必要です。重要なのは、GPTは、ナレッジワーカーが行う特定の反復タスクのための一般的な知識の上に認知エージェントを構築するために、コスト効率よく迅速に微調整することができることを理解することです。
ライブラリと検索
私がアプローチしたいのは、生成的AIをインターネット検索に例えることです。GoogleやBingのような検索エンジンができる前は、知識を見つけるのに長い時間がかかりました。図書館に車を走らせ、図書館の司書に助けを求めなければならなかったのです。図書館の司書は、私たちの提案を検討し、それについて考え、明確な質問をし、そして図書館の正しい本棚に私たちを導いてくれるのです。
検索
検索エンジンが登場してからは、地元の図書館や司書さんに頼ることが少なくなった。Googleにキーワードを入力すると、ウェブ上で見つけた最も関連性が高く、人気のある文書の要約ランキングが返されるのだ。そして、その文書をスクロールし、適切な文書を見つけ、その文書を開いて情報を見つける必要がありました。
多くの企業が社内検索ツールを備えていましたが、正しい文書を検索することはあまり得意ではありませんでした。10分前にチェックした内容が、検索結果では100文書も下に埋もれていたりするのです。そのため、社員はまずGoogle検索を行い、Sharepoint検索は最後の手段としてのみ行うのが常でした。
ChatGPT
ChatGPTのようなツールで、私たちの世界は再び変わりました。もはやファイルを開いて、適切なテキスト断片を見つける必要はないのです。
ChatGPTは、私たちのために詳細な物語の答えを生成してくれます。ChatGPT は多くの異なる知識源を統合し、箇条書きのリスト、サンプルコード、そのコードを使うために必要なライブラリのインストール方法の説明を含む、首尾一貫したテキストを形成します。さらに、より詳細な情報が必要な場合は、次のプロンプトでさらに詳しく説明してもらうことができます。
検索の限界
では、公開されている検索エンジンの根本的な問題点を見てみよう。
組織や個人の文書が含まれない。メモや個人のナレッジグラフを利用することができない。
検索結果を新しいコンテンツに合成することができないのです。
ジェネレーティブAIは、膨大な量のドキュメントを対象に学習します。しかし、高速検索のための逆インデックスを構築するだけではありません。ニューラル・ネットワークを構築し、文書の埋め込み情報を生成するのだ。この埋め込みは、キーワードだけでなく、概念に基づいて知識が一貫して保存されるように設定されています。
ジェネレーティブAIができること
OpenAI GPTのようなツールは、ここで役に立つのでしょうか?答えは、最も確実なイエスです。ChatGPTは、今日、あなたの会社のドキュメント上で微調整する方法がありませんが、OpenAI GPTシステムは簡単に微調整することができます。社内文書からプロンプトとレスポンスのペアのセットを作成することで、データが多いほど賢くなる生成AIのカスタマイズバージョンを作ることができます。
認知アシスタントのコストを下げる
どうやってそんなことをするのでしょう?各ビジネスユニットと連携し、その主要な課題を理解します。そして、ドキュメントを収集し、ナレッジグラフを構築します。そして、質問がある場合は、自然言語インターフェースに入力させます。簡単な文書を生成することで質問に答えることができれば、それがステップ1です。クエリーを実行する必要がある場合は、ドキュメントからパラメータを抽出し、グラフクエリーを実行し、結果をテキスト、テーブル、チャートなど適切なメディアで返す必要があります。
どのTech Forward組織でも、数年後にはナレッジワーカーを助けるコグニティブアシスタントを何百人も抱えていることでしょう。従業員がGoogleにアクセスできることを期待しているように、彼らはChatGPTのようなツールを期待していることでしょう。しかし、ここで大きな違いがあります。ChatGPTの将来のバージョンは、彼らの内部および個人の知識グラフで微調整されるでしょう。
Microsoft AzureシステムでのGPT微調整費用は、現在約84ドル/時間となっています。8HBUの強力な新ハバナ・ガウディ・サーバーを13ドル/時間で利用できることを考えると、84ドル/時間は高いように思われます。他の組織がGTPファインチューナーを構築すれば、コストは下がるでしょう。
まとめ
これまで、ナレッジワーカーは、知識を統合・合成しない検索エンジンを使うことを余儀なくされていました。現在では、組織内のすべてのナレッジワーカーは、自然言語の質問を取り込み、首尾一貫して合成された知識を返す認知アシスタントを使用して、ビジネスプロセスを合理化することができます。