経営者のためのChatGPTを使った独自チャットボットの仕組み解説(前編)
こんにちは。株式会社ゼタントでCEOをやっている久保です。イベントに登壇してちょっとChatGPTのことを話すことになりました。ふんわりとでも仕組みを知っていると、ビジネスや業務に導入するかどうか検討や判断がしやすくなると感じました。技術解説の情報はたくさんありますが、なんとなく「詳しくわかった気になれる」ような情報は意外と少なそうです。ChatGPTの大雑把な仕組みと、それを利用した独自チャットボットを作るにはどうすればいいかを、2回に分けて「詳しくわかった気になれる」ように説明します。
ChatGPTとか生成AIとか
ChatGPTについては、もはや説明はいらないと思います。また生成AIという言葉もいろいろなところで見かけるようになりました。ChatGPTは生成AIを用いたチャットサービスです。ということは、生成AIが何なのかがわかると、ChatGPTやそれに関連する技術やサービスを自分たちが取り込めるかどうか検討できそうです。ということで、ここから生成AIについて説明してみます。
生成AIとは
wikipediaによると以下のように説明されています。
まあそうなのですが、これだと詳しくわかった気にはなりにくいですね。もう少しイメージを掘り下げてみます。生成AIというのは、インターネット中に散らばっているたくさんの文章(Webページや文書ファイル)を集めてきて、「こういう言葉がきたら、次はこんな言葉がくる」というのをひたすらパターン分析したシステムです。例えば、
わたしはスマホを
に続く言葉はいろいろ考えられますが、もしネット上に「わたしはスマホを買いました」という文章が書かれた記事がたくさんあったとしましょう。そうすると、生成AIのシステムに、「わたしはスマホを」という言葉を入力すると、「買いました」という言葉を答えます。ものすごく単純にしましたが、要点はこれだけです。
もちろん、「わたしはスマホを落としました」とか「わたしはスマホを売りました」とか、ネットにはそういう文章もたくさんあるはずです。また、「わたしはスマホを購入しました」のように表現は違ってもほぼ同じ意味の文章もたくさんあるはずです。なので、たくさんの文章をその前後関係とともに分析して、一番ありそうなパターンを答えます。文章をたくさん集めてパターンを分析することを「学習する」と言います。またパターン分析を終えたシステムのことを「モデル」と呼びます。
AIではない仕組みだと、キーワードとそれに紐づく文章をデータベースに入れておいて検索するようなものがあります。データベースを使わなくても、エクセルでもできます。A列にキーワードを、B列にそのキーワードに関連する文章を書いておいて、キーワードをA列から検索してB列の文章を取り出すようなものです。これはいわゆる検索システムです。
それに対して、生成AIというのは、文章そのものを覚えておいてそれを検索しているわけではありません。与えられた言葉や文章に続く次の言葉をどんどん選んで、文章を作っているのです。あらかじめ答えの文章がどこかに保存されているのではなく、都度都度言葉をつなげて作り出しているから「生成」という名前が付いています。
だから嘘もつく
この生成AIシステム(=モデル)は、人間のように言葉の意味を理解しているわけではありません。もし、子育てされている方がいらしたら、子供が国語の文章読解の問題で、答えは正解なのに文章の意味が全然わかっていない、ということに遭遇したことがないでしょうか。彼ら、彼女らに言わせると、「これ(=指示語)の近くにある言葉でそれっぽいものを選んだ」とのこと。何だかよくわからないけどこれじゃない?みたいな感じです。イメージとしては生成AIも同じようなものです。ただし莫大な情報の中からそのようなパターンを見つけているところが、子供とは違うところでしょうか。
ただし、そもそも学習の元となったインターネット上の情報が全て正しいわけではありません。また、情報量にも濃淡があり、あまり出回っていない情報もあります。いろいろな情報に翻弄されて変なパターンを見つけてしまうことも多々あります。そういった理由で、生成AIから吐き出される情報には嘘が混じりがちです。ですが嘘をつこうとしているわけではなく、単に「入力された文章に対して、こういう言葉を連ねた文章にすると、インターネットから学習したパターンによく合う」というだけなのです。
また、生成AIがパターン分析する(=学習する)のには膨大な時間とお金がかかります。そのため、毎日情報を更新するようなことはまだできません。ChatGPTの場合はこの記事の執筆時点では2021年9月の情報までしか反映されていないので、それっぽい文章が生成されたとしても、それが本当である保証は全くありません。
もっと特化した生成AIはないのか?
ChatGPTは、社内情報のように公開されていない情報や、公開されている量がとても少ないマイナーな情報に対して、うまく文章を生成できません。それは、先にも説明したように、参考になる情報がなくてパターンを見つけられないからです。お客様とのやりとりの履歴や社内文書のような情報に基づいて文章を作ってくれるチャットボットサービスは作れないのか?と思われる方もいらっしゃるでしょう。今回は長くなったので、次の記事で説明します。
さいごに
この記事では、文字の文章だけを対象に説明しましたが、画像や音声も似たような考え方です。専門家からみるとツッコミどころはたくさんあるかもしれませんが、大枠を理解する上ではそれほど問題はないと思います。この次の記事で、ChatGPTを利用して独自のチャットボットを作るにはどうすればいいかを、これまた経営者目線(?)で説明します。
この記事が気に入ったらサポートをしてみませんか?