ChatGPT・Large Language Model(LLM)概要解説【前編】

2023年5月26日 22:40

こんにちは！Hi君です。
いまさらではありますが、今回はChatGPTと呼ばれる対話サービスと、その背景で使われているLarge Language Model (LLM) と呼ばれる技術について、前編（ChatGPT）・後編（LLM）にわけてそれぞれの概要を自分への備忘録的にまとめてみました。

ChatGPTについて

■概要

・ChatGPT: https://chat.openai.com/
・無償で使えます。
・便宜上、ChatGPT上の対話エージェントを以後"AI"、AIに質問を投げる際のテキストを"プロンプト"と呼称します。

■何が出来るか

・自動文章生成、対話システム、機械翻訳、文書要約、質問応答、文書分類/添削、コード生成、問題作成、英語学習等ができます。
　▶ChatGPTのできること16選

■事例集

・ChatGPTに「冷蔵庫の余り物で何が作れる？」。提案されたレシピを試した結果
・【永久保存版】ChatGPT と Google Spreadsheet を連携した自動リサーチツール作成マニュアル※テンプレコード付き
・現役ライターの「ChatGPT文章作成術」9選｜ライティングをどこまで効率化できるか？
・【使ってみた!】ChatGPTとは？始め方と使い方を徹底解説
　└"ExcelやGoogleスプレッドシートといった表計算ソフトの関数の作成"も含まれています。
・ChatGPTにテストコードを書いてもらった
・ユニットテストをGitHub CopilotとChatGPT使って書いてみたらやばかったです
・ChatGPTでMermaid構文を出力してみた（シーケンス図、ガントチャート、フローチャート作成の実践例）
・[DevOps]How to 10x yourself using ChatGPT — DevOps Developers with these 5 tips

■使い始めるにはどうしたらよいか

・下の記事・動画内にブラウザ上でChatGPTの利用方法について説明があります。
　▶ChatGPTの基本的な使い方
　▶(Youtube)ChatGPT❶...初心者向けに解説（使い始め・使い方など）
　　└11:34~がChatGPTへのアクセス・ログイン方法の説明部分です。

・エンジニア向けのコメント: 上の情報はOpenAIのChat APIまたはChatGPT APIの利用方法ではない点に注意して下さい。
　▶API経由の利用方法は例えば次の記事を参考にして下さい。
　　└遂に公開されたChatGPT APIとは？利用するまでの流れ【ハンズオンで徹底解説】

■利用上のコツ

・フォーマットをある程度定めて、指示が具体的で解釈の曖昧さをできるだけ削減した形でコメントをすると良いです。
　▶俗に言う"深津式プロンプト"を参考にするのが良いと思います。（下に関連記事を添付します）
　　└ChatGPTの精度を上げる、あらゆる質問の最後に置く「命令」優秀な壁打ち相手を作る、「チャットAI力」の高め方
　　└AIで仕事効率アップ！深津式プロンプト•システム1と2を駆使してチャットAIを最大限に活用する方法【3月28日更新】
　▶Prompt Engineering Guide
　　└和文でプロンプト作成のコツについて書かれています。ただし多少テクニカルタームが多めかもしれません。
　▶また、公式のBest Practice Noteもあります（但し英語です）。
・例えばプログラミングコードのみを貼った場合、返答が英語になる場合があります。その場合は書き始めに”日本語で返答して”などの指示を予め書くと良いです。
・AIからの返答が途切れた場合、"続きを書いて"等のプロンプトを入力すると（大抵の場合は）続きを出力してくれます。
　▶ChatGPTで文章が途切れる時の対処法をわかりやすく解説
・Google Chromeを利用している場合は下のExtentionをインストールすると使いやすいです。
　▶Superpower ChatGPT
　▶例えばAIからの返答が途切れた際の"続きを書いて"のプロンプト入力をボタンクリックで簡単に行う事ができます。チャット履歴の吐き出し等も対応しています。

注意点・リスク

■情報の不正確さについて
・ChatGPTのような対話的サービスでは、AIがしれっと嘘をつく事がままあります("hallucination"とも言います)。
　▶例えばBing AIのような検索結果複合型・事例提案型のサービスを利用する場合、多少ユースケースによっては緩和される場合もありますが(検索結果という事実に基づく面もあるので)、基本的には直近で解決される可能性が薄い問題だと考えた方が良いと思います。
　▶嘘は嘘であると見抜ける、一定の情報リテラシーを持つ人でないとChatGPTやLLMを使う上で実用上の困難さやリスクを伴うモノと考えた方が良いです。
　▶特に法律・医療等の専門的な情報について、AIからの返答を完全に信頼はしない方が良いです。
・ChatGPTは、2020年5月から2021年10月までの間に収集されたWebページのテキストを訓練データとして使用している。つまりそれ以降の情報は現時点では持っていない点に注意。

■情報漏えいリスクについて
・例えば下の記事で記述されているようなリスクが伴います。
　▶ChatGPTに潜むAIリスクと今求められるAIガバナンス
実際、2023年に入ってからChatGPT利用での機密漏洩が何件かニュースになっています。
　▶Samsung、ChatGPTの社内利用で3件の機密漏洩
・"OpenAIは非APIのChatGPTについて、提供されたデータをモデル改善のために使用する可能性がある"としています（下のリンク参考）。
　▶データ利用を不許諾するには、下ページのフォーム入力を行う必要があります（承認されるのに1週間ほどタイムラグがある点にも注意）。
　▶https://help.openai.com/en/articles/5722486-how-your-data-is-used-to-improve-model-performance
　▶関連ツイート群: https://twitter.com/imos/status/1627975957591232517?s=20
　▶関連記事: 情報漏えいが心配！｜ChatGPTの利用ルール
・企業で利用する場合はAzure OpenAI Serviceといったサービスを使うのも一つの手です。
　▶https://twitter.com/imos/status/1627975957591232517?s=20
　▶企業利用ならChatGPTよりおすすめ！Azure OpenAI ServiceにおけるAI活用の始め方

■一部海外圏での法的取扱について
・また、EU圏においてはEU一般データ保護規則(GDPR)といった個人情報保護のための規則があり、その兼ね合いで2023年4月現在では下のような騒動も多少起こっています。
　▶イタリア当局、人工知能チャットボット「ChatGPT」を一時的にブロック
　▶ドイツもChatGPTの使用差し止め原則可能､データ保護巡る懸念で－報道
　▶日本での、ブラウザ上でのChatGPTの利用においてはこういったトピックは実用上差し支えは無いですが、ChatGPT APIを利用したサービスを公開する場合（あるいは第三者のアクセスを許す場合）、EU圏からのアクセスをブロックしたり本人許諾や透明性のあるGDPRポリシー公開等の処置は必要になる可能性はあります。

■国内での法的取扱
・以下の記事を参照
　▶大規模言語モデル（LLM）に関連するビジネスを展開する際に留意すべき法規制・知的財産権・契約, 柿沼太一

今回は以上です！
後編ではそもそもの大本となるLarge Language Model (LLM) についてまとめてみます。

文：Hi君
協力：inaho株式会社