見出し画像

生成AIの最新トレンドを、できるだけ嚙み砕いて、分かりやすくご紹介!

こんにちは。
清々しい天気の中、毎日の散歩が楽しみな柳澤です。

さて、本日は世間でも話題がもちきりの、生成AIの最新トレンドについて紹介したいと思います。

実は電子契約サービスCoffeeSignを運営するSDT株式会社は、生成AIのビジネスにも取り組んでいます。
そこで溜まってきた知見を、ぜひ皆様にご紹介し皆様のビジネス等に役立てて頂ければと考えています。

生成AIの現状について

人工知能(AI)開発を行うアメリカの企業OpenAIが、2022年11月にChatGPTを公開してからまもなく1年が経ちます。このChatGPTの驚くべきところは、これまでのテクノロジーサービスと比べて、めざましい速さで利用者を増やしていることです。

例えば、LINEは1億人のユーザーを獲得するために19ヶ月、Instagramは30ヶ月かかりましたが、ChatGPTは約2ヶ月で1億人のユーザーを獲得しました。

ちなみにSDTでは、生成AIを活用して価値創造をしていく世界に向けて、3つのフェーズがあると考えており、現在は②の「活用・定着フェーズ」にあると考えています。

①使用開始フェーズ
②活用・定着フェーズ
③価値創造フェーズ


今は、企業や自治体で生成AIを具体的にどう実用化するかというフェーズ。期待も最大限に高まっている状態です。

この後、改良を重ねることで徐々に価値が認められていき、2026年頃には企業の80%以上が生成AIを活用していくようになるのではないかと考えられています。(※2023年10月にGartner社が発表した未来予測による)

生成AIの今後の大きな流れは?

今後の生成AIの動きを理解するために、大きく2つの流れがあると把握しておくと良さそうです。ここでは、その2つについて説明します。

①マルチモーダルAI

最近、話題がもちきりなのが、9月末にChatGPTに画像解析機能と音声入出力機能が追加された「マルチモーダルAI」です。

ちなみに「マルチモーダルAI」とは、これまで行っていたテキストでの情報処理だけでなく、画像や音声、動画など、異なる情報を組み合わせて処理できるAIのことです。平たく言えば、AIが目や耳も手に入れたというようなイメージでしょうか。

例えばChatGPTに写真を読み取らせると、画像を認識して、それを文章で説明することができるようになりました。

例えば、下のような写真(実はうちの息子の小さい頃の写真)を読み取らせ、「この写真を、子どもにも分かるように説明してください」とお願いすると、以下のような説明をしてくれました。

状況説明だけでなく、最後の文「彼はとても興味津々に何かを…」などの、感情も入ったような読み取りもできていることに驚きます。
少し惜しいなと思ったのは、実際には彼は手に持ったものを見ているわけではなく、地面に落ちている何か虫のようなものを、熱心に見ていたのでした。この辺り、読み取りが難しいところですが、手のひらき具合や状況などから、人ならばそれを分かってくれたかな……と思ったりします。

また、「マルチモーダルAI」では、画像を見て音声で説明したり、テキストから動画をつくったり、データを読み取った上でプログラミングを書いて分析する等も可能です。今後は、これらの機能を活用したサービスの開発が進んでいくと思われます。

ちなみに、SDTのメンバーが以下のように、AWS構成図の画像を読み取らせたところ、「セキュリティ強化の提案」や「一定の前提に基づいて、松竹梅の費用見積もり」ができることを確認し、とっても驚いていました。すごいですね!

②多くのLLM(大規模言語モデル)を知ることと、その選択

実は、生成AIのLLM(大規模言語モデル)というと、あまりにOpenAI社のGPT-4が有名ですが、実は他にも多くのLLMが存在しています。

2018年頃から一気に開発が進み、ざっと下の図のようなLLMが存在しています。GPT-4は数多くあるLLMの一つなのです。

また各LLMにはそれぞれに得意な分野や特徴があり、それをよく把握した上で、自分たちの目的に合ったLLMを見極めて使うことが大切になります。

出典 A Survey of Large Language Models


ちなみになぜ、各LLMに特徴があるのかというと、LLMの学習に使用されたデータソースが違うからです。

例えば、下のグラフにあるように、GPT-3の学習に使用されたデータの8割以上がWebページからのもので、科学データ等は含まれていないため、科学分野の専門的な質問に、正確な回答を出すことは難しいのが現状です。

逆に同じく下のグラフを見てみると、Meta社が公開している「Galactica」というLLMは、データソースの8割以上が科学系のデータです。そのため、このLLMは科学技術に関する知識が詰まっていて、学術分野での使用に適したLLMだと言えるのです。

出典 A Survey of Large Language Models


SDTの生成AIサービス

ちなみにSDTでも、大学や自治体向けに生成AIを活用した独自サービスを展開しています。

大学向けには、生成AIを用いた「先進医療教育支援プラットフォーム」の開発を進めています。具体的には、医療論文DB(PubMed)の翻訳やキーポイントの抽出、学習を深めるための追加情報の提示ができるプラットフォームを展開予定です。

「先進医療教育支援プラットフォーム」のイメージ図

また自治体に向けては、生成AIを活用したチャットボットを活用し、市民向けのサービスを向上させたり、職員の業務負担を軽くしたりといった実証運用に取り組んでいます。こちらは来年1月に公開予定になります。


実は、CoffeeSignのデジタルマーケティングにも、生成AIを活用しています。その方法や結果も、来月頃こちらのnoteで公開できればと考えています。

現在は、生成AI活用の過渡期です。うまく仕事に活用し、仕事の価値を増大できるといいですよね。

今回の記事が、皆様の生成AIへの理解に少しでもお役に立てたら嬉しいです。


この記事が参加している募集