生成AIを活用したい企業が次に取り組むべき「RAG Readable」という考え方
はじめに
私は普段、ソウルドアウト株式会社で生成AI推進のリーダーをしています。
社内向けに、生成AIの情報発信を単に行っていたころから、今ではソウルドアウトグループ全体の生成AIに関わる普及推進の責任者になるまで、様々な企業現場での生成AI活用推進を行ってきました。
初心者向けの生成AI勉強会の開催から、プロンプトの勉強会、生成AI活用マニュアルの作成、生産性向上のためのGPTs開発、NotebookLMを活用した業務効率化など、この1年で弊社の現場では生成AIがかなり身近になったのではないかと感じています。
勿論、身近になっただけであり、私が達成したいビジョンはまだまだ先にあります。もっと世の中を牽引できるような、インパクトのある事例をソウルドアウトから生み出したいと、本気で毎日考えています。
私は社外の個人的な活動として、NewsPicks 生成AIトピックス"IKIGAI.lab"モデレーターを務めていたり、国内最大級のAI活用コミュニティ"SHIFT AI"の公式パートナーとして、ウェビナーやイベント登壇、コンテンツ作成などを行いながら、生成AIの情報収集・発信に力を入れています。
IKIGAI.labでは名古屋まで足を延ばし生成AIイベントを開催したり、議員会館 国際会議室で教育関係者向けに生成AIワークショップを行うなど、ビジネス以外の側面からも生成AIと人間との関わり方についても日々思考を巡らせています。
そういった、特定の企業、ビジネスに囚われず、日々楽しく生成AIのことを考え、ソウルドアウトという企業の現場でどう生成AIを広めていくかを考え、行動に移していくことが今の私の人生です。
そんな中、今週はGenerative AI Business Day Xという生成AI企業推進者向けのイベントがありました。このイベントは私も去年からウォッチしており、毎回学びがある非常に大好きなイベントなのですが、去年と比べ自分の立場も変わり、生成AIの普及推進をどうしていくべきか毎日考えるようになってから参加した今回のイベントで、とても多くの気づきや学び、自分の考え方がアップデートされました。
この記事では、一旦自分の中での整理も込めて、次に企業が取り組むべき「RAG Readable」いう考えについて、noteにまとめます。
私の感じる「生成AI活用の現在地」
23年4月ごろにGPT-4が登場し、早1年半が経とうとしています。
ChatGPTに続き、テキスト生成AIだけでもGemini、Claude、Copilotなどさまざまな生成AIツールが登場し、今ではChatGPTが最強ではなくなってしまいました。個人的にはGeminiの進化スピードが凄まじく、派生形のNotebookLMや、Gemsなどが短期間のうちにリリースされ、生成AI推進者としては日々知識のアップデートに追われています。
そんな中、現在地としての私の認識は、以下の通りです。
まず生成AI活用のトップ層ですが、これはRAGを活用し、これまで蓄積していた非構造化データを武器にして、自社の価値を高めている企業です。
非構造化データとは、これまで既存の「AI」には入れられなかった社内データのことをざっくり指します。例えば、広告の成果分析レポートや、商品に対する顧客からのレビュー文章などのことです。生成AIとRAGが結びつくことで、非構造データの活用はこれまで厳密に質問と回答を紐づける必要があったなどの課題に対し、それらの情報の連携がしやすくなりました。これをうまく活用できている企業が、現在の生成AI活用におけるトップ層だと私は見ています。
またボトム層でも、生成AIを禁止したり、興味がない企業もまだまだ多いですが、地方企業においても少しずつ、「生成AI」を活用するべきだ、と考える企業も増えてきているのではないかと感じています。
これが私の考える現在地です。
生成AI推進者の役割は「ギャップを埋めること」
これは生成AI推進者の中ではよく言われている事なのですが、企業における生成AI活用で重要なことは「トップダウンで上から使わせていくこと」と言われています。これは一定の真実であり、上層部が生成AIに興味がなかったり、否定的である中で、ボトムアップで現場普及させようと試みても、セキュリティーやリスク部門との調整がうまくいかず、なかなか進みにくいでしょう。
ただし、トップダウンだけで生成AIが広まり、活用につながるかというと、必ずしもそれだけでは不十分です。そこで重要になってくる存在が、生成AI推進者であり、人間とテクノロジーの間にあるギャップを埋める存在です。
生成AIはとても急速に発達し、かつ世の中にものすごいスピードで普及しました。1年前ならまだしも、「企業では生成AIをどう使うかがカギ」という考え方は、NewsPicksを見ていてもSHIFT AIにいても、noteを書いていても、割とメジャーになってきつつあるのではないかと感じています。
ではなぜ、企業現場でなかなか活用が進まないのか。それは生成AIというツールが持つ、便利であるがゆえに巻き起こる段階的な複数のギャップが原因だと考えています。このギャップを埋めることが、生成AI推進者の役割だと考えています。
私は下記のように、企業における生成AI活用は現在地を含め大きく4段階に分けることができると考えています。
第一のギャップ「そもそも使う気にならない」
1つ目の埋めるべきギャップは、生成AIは何でもできるがゆえに、「使え」と他人に促されても、どう使ったらいいかわからない。という人が多数だということです。
たとえばChatGPTのUIは非常にシンプルで、適当なチャット文章を打ち込めばエラーも吐かず返してくれます。
しかしそれゆえに、チャット欄に打ち込みたいことがない人は、「何を打ち込んだらいいのかわからない」のです。
別に怒られたり、恥ずかしい目に合うわけでもないのに、何を打ち込んだらいいかわからないから、いつまでたっても触れないのです。
これは生成AIだから起きている現象ではありません。例えば、経営陣が「ビジネスマンはアートを理解することが重要だから、社員は全員油画を書いてください」とお触れが出ても、多くの人は何を書いたらいいかわからずいつまでたっても手を付けられないでしょう。
この時重要なのは、「なんか面白そうだからとりあえず描いてみよう」と思える人であり、言い換えれば「絵を描く意思」を抱くことが重要です。ここではうまく描く必要も、誰かより優れる必要もないので、その意思を持つだけでいいのです。
個人的に生成AIも同じようなものです。「なんか聞いてみよう」と、ChatGPTに聞いてみるという意思を持てるかどうかが重要なのです。
ただし厄介なことが、これは他人に強制されるだけでは定着しないということです。先ほどの絵の例だって、仮にノルマとして罰則を設けて無理やり筆を従業員にとらせても、その期間が終われば継続して描き続ける人はほとんどいないでしょう。これでは組織に定着したとは、到底言えません。
重要なことは、自分から「やってみようかな」という気にさせることです。しかも相手は、絵を描くよりも何か難しそうな「AI」なんて名前をしています。今までの人生でAIに関わりが少なかった人間のほうがはるかに多いので、聞くだけで、難しそうとか、自分には関係なさそうとか思ってしまい、やってみようという気になりにくいというデバフがかかった状態からスタートします。
生成AI推進者のまず最初の仕事が、この「難しそう」というギャップを埋めることです。この時、プロンプトの高度なテクニックは必要ありません。
簡単に使えて、なんか使った方がよさそうだぞと思ってもらうことが重要です。
第一のギャップを埋めるコツ
このギャップを埋める方法は複数あります。
ここでは私の考える3つの方法を紹介します。
1つ目は、啓蒙活動です。私がよく行う、「初心者向け生成AI基礎勉強会」などがそれです。そこでは、生成AIと従来AIの違いや、なぜビジネスでこんなに注目されてるのかや、簡単な仕組み、うまく使えばこんなことができるというユースケースを共有します。
「AI」と聞くだけで「難しそう」という考えから解き放ち、中身を簡単に解説し、身近なユースケースに繋げることで、「ちょっとさわってみよっかな」という気持ちを誘発します。
仕組みと、使い方と、使い道を簡単でもいいので示せるだけで、生成AIへの見方は大きく変えることができます。
2つ目は、便利なツールを直接渡すことです。GPTsなどがそこに当たります。「これを入力すれば、これが返ってきます」を整えるだけで、使い方と使い道がわかります。また、企業現場で私が展開するGPTsはニーズに合わせて作成するので、困っている人が確実に存在し、GPTsで解決を図ることができます。なんでも聞けるのがLLMの売りですが、何を聞いたらいいかわからないという状況を逆手に取り、「この内容に関することしか聞けない」と限定してあげる方が、現場の活用が進むという面白い現象を私はよく観測します。
3つ目は、生成AIにキャラクター性を持たせるということです。それは、キャラっぽい名前でもいいですし、架空の人物の名前でもいいでしょう。「それ、ChatGPT使ってみたら?」よりも、「それ、○○君(GPTsの名前)に聞いてみたら?」という会話に繋がる方が、生成AIツールと「使う」というハードルから、キャラクターに「聞いてみる」という行為に変化します。これだけで、生成AIを活用するハードルが1段階下がるのです。
啓蒙し、ニーズに合ったものを現場に導入し、キャラクター性を持たせること。これが第一のギャップを埋めるコツだと私は考えています。
第二のギャップ「自分で使ってみたけど思ったように使えない」
生成AIが業務に馴染んできて、試しにChatGPTに聞いてみる人が増えたとしましょう。次にぶつかる壁が、「ちょっと使ってみたけどほしい答えが返ってこないから、結局人力でやった方が早い」というギャップです。
ここで次に重要になってくることが、「プロンプト」です。
このギャップは、「生成AIを使う意思はあるが、うまく使えない」という事象ですので、解決方法としてプロンプト作成能力を向上させることが有効です。
他にも、特定の生成AIツール単体で解決させるのではなく、他の生成AIツールと組み合わせる使い方を広めたり、Difyのようにワークフローを組めるツールを展開するなどの手もありますが、プロンプトの知識定着を全く抜きにして、これらを現場に導入し、普及はせるのはハードルが高いでしょう。
第二のギャップを埋めるコツ
1年前とは違い、プロンプト作成のコツはさまざまなところで展開されています。大手企業が公表していたり、noteの記事でも、無料でさまざまなところに落ちています。生成AI推進者はそれらを駆使して、「プロンプトを身につければ誰でも高度な使い方ができる」ということを組織に周知し、その学び方やコツを展開することで、このギャップに立ち向かうことができます。
このギャップの解決方法として、社内で使えるプロンプトのデータベースを作成する、という方法を考える人が多いかと思います。これは一定の真実ではあるものの、ベストアンサーではないと私は考えています。
生成AIの良いところの一つは、ピンポイントに狙った個別の状況でも、確率的に高い最適解のアイデアをいくつも生み出せるという点だと思います。ゆえに精度のいい高度なプロンプトは、その精度を発揮する固有の状況にかなりパーソナライズされており、文脈の異なる他人が使うことには特化していないという特徴があります。そのため、プロンプトを溜めていけば、全従業員が使いまわせるというのは、なかなか実現しにくい側面があると私は考えています。
一定の真実と私が思っている点は、フレームワークのプロンプトであれば、使いまわすことが簡単だからです。"前提条件、ゴール、手順、制約条件"など、「これを埋めればOK」というフレームワーク系のプロンプトは、転用しやすく使いやすいでしょう。
そのため、このギャップを乗り越えるには、一定のラインまで人間側が生成AIに寄り添う必要があります。これまで書いたことないような、マークダウン形式で情報を網羅的にわかりやすく、AIのためにわざわざ書いて、AIにかわりに考えてもらう必要があります。
毎回プロンプトを書く必要はありませんが、生成AIをうまく使うための知識を、人間が新たにインプットする必要があります。多くの人に生成AIを普及する上で、これは一つの大きなハードルです。なぜなら、成果に直結するかわからないのに、インプットにはまあまあ頭を使うハメになるので、シンプルに面倒だからです。
この点に関しては、社内の詳しい人が教えるもよし、専門の外部機関に発注するもよし、プロンプトの考え方だけ広めて、私のように代わりにプロンプトを書いてくれるGPTsを広めるもよし、様々な方法でアプローチすることが可能ですが、すべての従業員に一律に、数回の勉強会やカリキュラムだけで身につけさせることは非常に難しいでしょう。
例えとして、Excelは多くの企業に普及していますが、全従業員が関数を組んで効率化できているというわけではありません。似たような構図が生成AIでも起こります。便利だから使おうと思ったのに、むしろAIのために人間側が寄り添う必要がある矛盾という点が、第二段階において乗り越えるべきギャップです。
第三のギャップ「普段の業務がハイコンテクスト過ぎて、プロンプトだけでは解決できない」
プロンプトのコツが社員に広がり始め、だいたいどのようなことに気を付ければ生成AIがうまく使えるかについて組織に定着し始めたころ、次に発生するギャップがこのハイコンテクスト問題です。
実際に日々の我々のような人類は、様々な背景知識や利害関係、言語外に気を付けるべき多種多様な条件の中で、特定の業務を曖昧な実行命令の中で遂行しています。
生成AIを企業で活用しようとまず考えて、業務の棚卸しをして生成AIと相性がよさそうなところを見つけるのは効率が良くておススメですが、それではせいぜい「アイデア出し」「壁打ち」「メール作成」などで止まってしまいます。個別の条件によって回答が変わる複雑な問い合わせ業務やデータ分析業務などは、毎回プロンプトを書くより慣れた人間が探す方が明らかに効率的でしょう。
生成AIの活用可能性を追求し、普段の仕事を細かく業務分解していけばいくほど、自分の仕事が実は高度なものだったと判明し、AIにはまだまだ奪われないな、と安心する人もいくらか見てきました。これは一定真実で、このようなプロセスを経て人間が得意な領域、生成AIが得意な領域を見極めていくことが重要だと私も考えます。
しかしながら、世で騒がれている生成AI活用の限界点が「アイデア出し」「壁打ち」「メール作成」かといわれれば、全くそうではありません。次にこのギャップを乗り越えるために必要な要素が、RAGという技術と考え方です。
第三のギャップを埋めるコツ
RAG(Retrieval-Augmented Generation)は、情報検索(Retrieval)と生成(Generation)を組み合わせた技術です。この技術は、特に大規模な言語モデル(LLM)を用いた自然言語処理(NLP)の分野で、より正確で有用な回答を生成するために使われています。
簡単に言うと、仕事の遂行に必要な背景データを追加でLLMに与え、検索して回答させることで精度を上げようという技術です。
大量のテキストデータをRAGのソースとして追加することができるので、特定の領域に特化した情報源を企業が用意することができて、RAGと連携してうたく引き出すことができれば、ハイコンテクストな業務でも生成AIで対応することがだんだんと可能になっていきます。
では、開発リソースがないとRAGは実現できないかと言われれば、そんなことはありません。GoogleのNotebookLMは無料で利用できるわかりやすいRAGを活用したツールですし、GPTsもknowledgeとして追加ソースを登録することができます。「仕事で必要な背景情報を生成AIに与えれば、ハイコンテクストでも解決していける」ということを、生成AI推進者は次に広めていく必要があります。
しかしここで大きな壁が2つ立ちはだかります。
1つ目は、セキュリティーやリスクの問題。
2つ目は、RAGとして活用できるデータが自社で整っていないという点です。
1つ目の問題を解決するには、自社で開発リソースをかけて作り上げていくか、法人向けのRAGを活用したSaaSを取り入れるかなどで解決することができます。すでにそのようなサービスは多く世の中に出てきており、必ずしも巨大な資金力がなければ手を出せないかと言われればそうではありません。
問題は2つ目の、RAG活用できるデータが整っていない点です。
まず、RAGを使って何をしたいかということを決める必要があります。社内の問い合わせなどは、かなりわかりやすい例かと思いますし、機密情報を取り扱いにくい分野のため、実装しやすい特徴があります。
しかし求められているのは、企業の競争力を高めるような、利益を生み出す使い方です。これにはまず、自分たちの競争力を高めるにはどんな要素が必要かを定義し、生成AIで解決できるのか、またそのためにはどんな情報を集めるかを検討し、外部に流出しないよう細心の注意を払いながら、集約していく必要があります。
競争力を高めるのですから、企業独自のノウハウが重要です。そしてこれは機密情報とかなり近い領域に分布しています。
そのため、リスクをきちんと守りながら、競争力を高める方法に転用するには、ここまでの壁をすべて従業員のリテラシーとして乗り越えたうえで自分たちの価値を再定義し、生成AIを活用することを決め、なんなら生成AIがないと仕事が回らないまで頼り切るスタンスで設計したうえで、安心でRAGの精度が高性能なツールを見つけ/開発して企業独自のものとして作り上げる必要があるのです。
この点がクリアできた企業から生まれている事例が、冒頭で私が定義したトップ層であり、現在地だと私は考えています。
本題:RAG Readableという考え方
ではこの活用方法を実現できている、現在のトップ層が企業における生成AI活用の最大到達点でしょうか?
私は、現在のトップ層をさらに突き放し、活用を大きくリードしていく企業の条件として、RAG Readableな情報を揃えている、ということが重要なのではないかと考えています。
RAG Readableとは、その名の通りRAGとして読み取りやすいテキストのことです。言ってしまえば、AIが読みやすい文章のことです。
現在、企業現場でRAG活用されている多くのテキストは、生成AI登場以前の「人間が読みやすい」文章です。RAGという技術自体も進化していくでしょうが、単純比較として人間用に書かれた文章と、AI用に書かれた文章をRAGとしてAIに渡した時に、精度がいいのはきっと後者でしょう。研究機関のような厳密な比較をしたらどうかわかりませんが、少なくともAI活用を前提としていない社内データの方が多いので、企業現場においてはRAG用に整えたテキストとそうでないテキストを比べると大きな差が生まれるのではないかと私は考えています。
わかりやすい例がマークダウン形式のプロンプトです。あれは人間も読むことができますが、効率的にLLMを挙動させるうえで「AIが読みやすい文章」と言えるでしょう。
こういったことが、RAGの文脈でも起きてくると予感されています。そのため、RAGの活用を前提とした「RAG Readable」なデータ蓄積こそ、企業での生成AI活用を次のステップに進める大きなカギになると私は考えています。
重要なことは、既存のデータをRAG Readableに書き換えようと言っているわけではないということです。一定の効果はあるかもしれませんが、どこまでいっても生成AI登場以前のデータは、RAGを前提として作成されてはいません。そこに固執するよりも、生成AIやRAGという技術が今後のビジネスで重要なのだから、企業の生成AI活用のビジョンをどこにおいて、そこに向けてどうデータを溜めていくのか。また、RAG Readableなテキストとはどんな形式をしているのか、それらについて時間をかけて、目的をもって、企業戦略として向かっていくことが重要になってくると考えています。
まとめ
長くなりましたが、以上が今現在、私の考えている生成AI推進の現在地とこれからの考えです。企業競争力を高めるためにどこに向き合うべきか、次にそのカギを握るのはRAG Readableというポイントだと考えています。