【2023年振り返り】AIの進化に伴うプロンプトの変化
Belated Happy New Year🎍🎌🌅 肩書きは「プロンプトエンジニア」、実体は「ジピちゃん(ChatGPT)飼育員」の Sayah (@sayah_media)です🆗🤖👈👩💻👉🤖🆖
今年もよろしくお願いいたします👩💻💓🤖(3年連続、喪中です…🥺)
2023 年、GPT シリーズをはじめとする LLM(Large Language Model:大規模言語モデル)の急速な進化は、世界を揺るがす社会現象を起こし、人々のライフスタイルに大きなインパクトをもたらしました。
AI の急速な進化に伴い、私たちプロンプトエンジニアの働き方やアプローチも、この1年で大きく変化しました。
2024 年初となる本記事では、2023 年の GPT シリーズ の進歩 を振り返りつつ、著しく変化したプロンプトエンジニアリングについて、わかりやすく解説します。
🌐 「生成AIブーム」に世界が揺れた2023年
ちょうど約 1 年前の2022年11月30日に、OpenAI がリリースした、生成 AI サービス「ChatGPT」。
同サービスは、わずか2ヶ月以内に月間推定 1 億人のユーザーを獲得し、ユーザー数の最速成長記録を打ち立てました(Malik, 2023)。
AI 研究の権威である松尾豊教授(東京大学 松尾研究室)は、もはやこの現象について「もはや AI は第4次ブームに突入した」と述べており、日本でも100万人ものユーザーが ChatGPT を利用しているといわれています(Sekiguchi, 2023)。
2023年11月に、ソフトバンクグループ株式会社が、ビジネスパーソン約 2,000 名を対象に実施した『2023年 IT トレンド調査』では、数々のワードの中で「生成 AI 」が全票の 91.0% を獲得し、ダントツの 1位に輝きました(Future Stride Editorial Team, 2023)。
これは、2位以下のキーワードや流行語に圧倒的な大差をつける結果となっており、生成 AI に対する圧倒的な注目度や関心の高さ、ビジネスにおける影響力の大きさを物語っています。
🏆 2023年「今年のCEO」にサム・アルトマン氏が選出
米『TIME(タイム)』誌の「CEO of the Year 2023」では、ChatGPT を生み出した OpenAI のサム・アルトマン(Sam Altman)CEO が選ばれました🎉🎉🎉
2023年の ChatGPT の世界的な大成功を見れば、これは納得の結果であり、当然の受賞だと多くの人が感じるのではないでしょうか。
サム・アルトマン氏も、以下のように 2023 年を振り返っています。
👩💻 プロンプトエンジニアの2023年振り返り
2022 年から「AI Prompt Engineer(AI プロンプトエンジニア)」として、従事している私。
この職業自体がまだまだ新しいうえ、2023 年は特に、生成 AI の進歩や関連情報のアップデートが目まぐるしく、大きな学びと新たな発見をたくさん得た 1年でした。
日に日に AI やプロンプトエンジニアリングへの理解や知見、経験が蓄積されていく喜びも、計り知れないくらい大きかったです☺️
さまざまなプロジェクトに携わらせていただいたお陰で、仕事の幅が広がり、より多角的な視点が持てるようになったり、AI の活用によって自身のニガテや課題を解決につなげる術が身に付いたりと、お陰さまで自分の人生にとっても「Game-Changer」な 1年となりました🙇♂️
ここでは、2023 年におけるプロンプトエンジニアとしての日々や OpenAI の動向について、特に印象的だったイベントをいくつかピックアップし、振り返ってみたいと思います。
不可能だったことが実現可能となり、自分の中に秘めていたアイデアやインスピレーションを、誰もが容易にカタチにすることができるようになった 2023 年🎨
AI の可能性は無限大で、まだまだ未知の領域が残っています🌈
そんな私も、2023 年は多岐にわたる革新的なプロジェクトに携わらせていただきました✨以下は、その一部です。
🔷【ひろゆき公認】AI ひろゆき
2023年3月:CoeFont 社運営の AI アバター「【ひろゆき公認】AI ひろゆき」共同プロジェクトで、プロンプト作成に携わらせていただきました。
🔷 Jaddo GPT
2023年4月:鹿児島弁への翻訳が可能な「Jaddo GPT」の開発に、プロンプトエンジニアとして携わらせていただきました。
🔷 韓国の書籍にインタビュー掲載
2023年4月:韓国で出版された書籍に、日本人プロンプトエンジニア代表として、数ページにわたって私のインタビューが掲載されました。
同書籍は、プロンプトエンジニアリングの重要性や、ChatGPT をはじめとした生成 AI の活用方法、効果的な使い方について解説されている書籍です。ありがたいことに、裏表紙にもコメントを掲載していただいています。
🔻 詳細は、韓国のAmazon・楽天市場との呼び声高い「Yes24」からご覧いただけます。
「Yes24」の該当ページはコチラ。
タイトル:『챗GPT가 쏘아올린 신직업 프롬프트 엔지니어(ChatGPTが打ち上げた新職業:プロンプトエンジニア)』《※筆者訳》
🎛️ 2023年のプロンプトエンジニアリングの変化
2023年、生成 AI の技術革新の急速さは、私たちプロンプトエンジニアにも多大な影響をもたらしました。
実は去年の 2月末まで、プロンプトエンジニアには「英語力」が必要不可欠でした。GPT-3 までは、英語のデータセットを中心に学習されており、英語でプロンプトを書く必要があったためです。
また、OpenAI の Playground にも、GPT-3 までは「Complete Mode(補完モード)」と呼ばれる「非対話式」のモードしかありませんでした。
ChatGPT のような「対話式」の「Chat Mode(チャットモード)」が Playground に実装されたのは、GPT-3.5-Turbo からです。
ここでは、各モードや各モデルの特徴や違い、それらのリリースが与えたプロンプトエンジニアリングの影響や変化について解説します。
🤖 非対話式(Complete Mode)時代のプロンプト
前述のとおり、3月1日に GPT-3.5-Turbo がローンチされるまで、Playground (OpenAI API)には「Complete Mode(補完モード)」と呼ばれるモードしかありませんでした(上の画像参照)。
同モードは「Completion Model(補完モデル)」と呼ばれることもあります。
「Complete モード」時代は、現在のような双方向のコミュニケーションではなく、一問一答のようなコミュニケーションだったため、プロンプトも1回限りの応答を想定し、丁寧かつ慎重に設計しなければなりませんでした。
AI から望む結果が得られない場合、プロンプトエンジニアは、自身でプロンプトの欠点を検出して書き直し、再試行する必要があったためです。
また、GPT-3 時代は、1つのプロンプトで質が高く理想の文章を生み出す必要があったため、1度に多くの詳細(ルールや制約など)をプロンプト内に含めていました。
しかし、プロンプトが長すぎると、GPT-3 はプロンプトの前半部分を優先し、後半部分にある指示は切り捨ててしまう傾向があります。
現行の対話式モデルと比べ、GPT-3 はコンテキストウィンドウ(一度に処理できるテキストの長さ)やトークン数(AI モデルの処理能力の限界)も少なく、情報を維持・記憶する能力が乏しかったためです。
AI も人間と同じく、一度に多くの情報を完璧に処理することには限界があります。特に、プロンプトに多くの情報や複数の指示が詰め込まれている場合、AI がすべての要素を正確に理解して反映することは容易ではありません。
複雑で情報過多のプロンプトは、AI の処理能力を過剰に要求します。そのため、期待通りの結果が得られないことが起こり得るのです。
つまり、指示が多ければ多いほど精度が高まるわけではないため、GPT-3 時代は余計に、プロンプトの長さと含める情報量のバランスを、上手く図る必要がありました。
理想の文章を、1回のプロンプトで出力してもらうためには、必要・不要な情報の整理や、効果的なプロンプトを作成するコツを事前に把握しておくことも、プロンプトエンジニアにとって重要な任務でした。
🤖 対話式(Chat Mode)時代のプロンプト
一方で「Chat モード」は、ChatGPT のような対話式で、足りない情報や不明確な点があれば、GPT の方からユーザーに質問し、必要な情報を引き出してくれます。
対話を通じてプロンプトを精密化し、段階的に理想のアウトプットに近づけられるため、初心者や不慣れなユーザーでも使いやすい点が魅力です。
「Complete モード」と「Chat モード」に関しては、以下のようにイメージしていただければ、わかりやすいかもしれません📨
AI とのコミュニケーションにおいても、対話式インターフェースが「物知りな友人とのランチ」なら、Complete モード時代は「聞かん坊で気まぐれな幼稚園児の子育て」くらいの差があります😇
ちなみに「Complete モード」は、現在 Legacy(旧型)とみなされており、代わりに、最新版の「Assistant モード」または「Chat モード」の利用が推奨されています。
🧠「GPT-3」時代のプロンプト
GPT-3 時代、プロンプトエンジニアは、GPT に特定のタスクを正確に実行させるため、できるだけ詳細で具体的な指示やガイダンスを与える必要がありました。
現行モデル(GPT-4)よりも、言葉の意図や感情、文脈を読み取ることが苦手で、聞かん坊&気分屋なジピ様を正しい方向に調教 …導くためには、詳細な内容・フォーマット・ルール・制約・トーン・文字数など、より明確で細かい指示が不可欠だったのです。
1️⃣ プロンプト例:
※上記では文字数を指定していますが、現在の AI 技術では、指定された文字数を完璧に守ることはできません。
各文字が異なるバイト数を持っており、特に日本語は文字のバリエーションが多いため、文字数の厳密な制御は難しいのが現状です。
2️⃣ プロンプト例:
また、GPT-3 時代は、英語でプロンプトを書く必要があるだけではなく、内部で翻訳ツールを介して一度和訳させてから、日本語でアウトプットさせていたため、トーンの指定には限界がありました。
他にも、GPT-3 は、英語中心のデータセットでトレーニングされているため、アウトプットには非常に偏りがあり、英語圏の情報や文化、習慣、マナーなどが色濃く反映されてしまう点も、プロンプトエンジニアにとっては大きな課題でした。
どうしてもジピちゃんがメールの最後に「敬具」を付けたがるので、どう指示すればジピちゃんが「敬具」を付けなくなるかを工夫し、アウトプットに「敬具」が 100% 入らないプロンプトに持っていくまで、苦労したのを覚えています😂
AI が急速な進化を遂げたこともあり、よく誤解されてしまいがちですが、AI モデルは決して完璧ではありません。
そのため、AI モデルの限界やニガテを把握したうえで、AI モデルから最大限の能力を引き出せるよう、プロンプトを調整して問題解決をすることも、プロンプトエンジニアにおける重要課題の1つです。
🧠「GPT-3.5-Turbo」時代のプロンプト
3月1日に GPT-3.5-Turbo がリリースされてからは、プロンプトの作成方法が劇的に変わりました。
前述のとおり、日本語の精度が向上し、日本語でプロンプトが書けるようになったためです。
また、GPT-3.5-Turbo から、OpenAI の Playground 上で対話式(Chat モード)が選択可能になるなど、よりユーザーフレンドリーなインターフェースになりました🎉
新機能や変更点の多さから、リリース直後は新しく搭載された「System」「Assistant」「User」という 3つの「Role(役割)」に関して調べたり、「System」と「User」の使い分けについて検証したりと、ひたすらリサーチ➡️検証➡️リサーチ➡️検証➡️リサーチ➡️検証 ×∞ の日々でした。
また、日本語でプロンプトが書けるようになったとはいえ、GPT-3.5-Turbo は GPT-4 に比べてトーン(口調)のバリエーションが少なく、生成したい文章のトーンをコントロールしにくいという課題もありました。
試しに今、ChatGPT の GPT-3.5 に「タメ口」で話すようにお願いしてみたところ…
「敬語は避けてタメ口でお話しいたします」と、ひたすら敬語(しかも謙譲語)を使われ続けました😂
私には何度見ても敬語にしか見えないのですが、ジピちゃん本体いわく、タメ口でお話ししているそうです👀
一方で、GPT-3.5-Turbo は、RLHF を使用して開発されているため、GPT-3 と比べ、より堅牢で正確な回答が可能になった点は、非常に大きな進歩でした👏
🧠「GPT-4」時代のプロンプト
GPT-3.5-Turbo のリリースから 2 週間という速さで爆誕した GPT-4 は、GPT-3.5-Turbo よりも多くのトークンを処理でき、より複雑なタスクを高い精度で解決できるようになりました。
何よりも、日本人プロンプトエンジニアとして嬉しかったのは、日本語においても、文章生成時のトーン指定がより精確になったことです。
戦国武将、アイドル、ラッパー、酔っ払いのサラリーマン、みつを、ヤンキー、川端康成、ギャル、ゾンビ、チャラ男、猫、ロボット、安倍総理、赤ちゃんのモノマネだって、お手のもの!👏
というわけで、早速 ChatGPT-4 に、さまざまなキャラクターのトーンで、以下の文章をリライトしてもらいました。
モノマネ芸人もビックリのなりきり度…🧐 個人的には、ゾンビが用意している「食べ物」が何なのかが気になります…😨🍖
ちなみに、ジピちゃんに英語でプロンプトを与えて、実在の海外ラッパーになりきってラップをしてもらうと、ラップスタイルや口グセ、口調、リリックの特徴などを上手く捉えていて、クオリティがやたらと高いです😂
話がそれまくりましたが、このように(?)、言語能力も一気にパワーアップした GPT-4 ですが、5月には、Web ブラウジング機能の「ChatGPT Browse with Bing」が搭載され、最新情報にもアクセス可能となりました。
この機能により、引用元が信頼性高いサイトであるかの確認や、ハルシネーション(AI の知ったか・でっちあげによる誤情報)が起きていないか、信ぴょう性の高い情報か、などの人間によるファクトチェックができます。
また、GPT-4 に最適な事例や定量データを探してもらい、それらを掲載することで、より説得力や信頼性の高い記事や資料の作成が可能となりました。
🆚「GPT-3.5-Turbo」と「GPT-4」の違い
ここでは、GPT-3.5-Turbo と GPT-4 の特徴を比較し、それぞれのメリット・デメリットについて解説します。
🤖 GPT-3.5-Turbo
ちなみに、「OpenAI Developer Forum」などを見ていると、ChatGPT の「GPT-3.5」において、ChatGPT Plus(有料版)よりも無料版の方が生成が遅く感じるという声がしばしば見られます。
これに対し、一部のユーザー間では「有料版は『GPT-3.5-Turbo』で、無料版は標準バージョンの『GPT-3.5』なのでは?」という疑惑まで出てきているようです。
無料版と有料版における生成速度の違いに関しては、まず、無料版と有料版でのリソース割り当てやサーバーのパフォーマンスに差がある可能性があります。
対して有料版は、通常、より優れたサーバーリソースと最適化が施されていることが多いです。この仕様が原因で、有料版の応答速度が速くなることが予想されます。
また、無料版はより多くのユーザーに対応する必要があるため、これによって応答時間が長くかかってしまう可能性も考えられるでしょう。
🤖 GPT-4
GPT-4 は、より大規模なトレーニングデータセットと高度な学習パラメータを持っており、複雑な文脈を読み取れる高い理解力とよりクオリティの高いテキスト生成が可能となりました。
また、GPT-4 は、より長いコンテキストを処理でき、より複雑なコード生成や画像認識にも対応しています。特に、日本語を含む多言語の処理能力が強化され、より多様なトーン・口調での対話や文章生成が可能になりました。
GPT-4 の唯一の欠点は、GPT-3.5-Turbo に比べて生成スピードが遅く、コストが高い点です。
この生成速度は、GPT-4 が持つ大きなトークンウィンドウや、高度な機能、複雑なタスクへの処理能力に起因しています。
「きっとクオリティの高い文章を生成してくれてるんだ…我慢我慢我慢…」と、イチゴの種の数でも数えながら、気長に待ちましょう🥹🍓
APIでツールを作成する際は、多くのトークンを要するツール(記事作成など長文のもの)では、タイムアウトによるエラーが発生してしまう場合があるため、プロンプトエンジニアと開発者で上手く連携を図ることも、必要不可欠です💪
🤯 AIの進歩とプロンプトの変化に翻弄された2023年まとめ
プロンプトエンジニアの世界は、毎日が新たな発見の連続です。2023 年は、いちプロンプトエンジニアとして、いち従業員として、いち人間としても、多くのことを学び、経験した1年だったと思います。
特に、プロンプトエンジニアになって幸せを感じる瞬間は、以下のように、自分で新たな何かを発見をしたり、それを共有することで誰かの役に立てたりしたときです。
「文章生成 AI」から「画像生成 AI」「動画生成 AI」「音声生成 AI」まで、生成 AI ブームに世界が揺れた2023年。
特に3月は、GPT-3.5-Turbo と GPT-4 のリリース、大切な身内の急な不幸が重なるなど、脳も心も体も忙しい1ヶ月でした。
アメリカの大学(時差14時間)で経営学を学んでいるのに加え、その時期はまだフリーランスでクライアント5社と契約していたため、メンタル❤️🩹は詰んでいるけど、脳🧠は超絶アクティブ、性格👯♀️はハイテンション(元々)というチグハグ🌀な状態で、何とか生き延びておりました🧟♀️(睡眠2時間…)
今思えば、ちょうど怒涛の GPT リリースラッシュで、情報収集や全ツールのプロンプト変更、メンバーへの指示や教育など、止まる暇なく大好きな仕事や勉学に勤しんでいたからこそ、何とか豆腐メンタルを保てていたのだと思います。
前述のとおり、2023年は人生トップ3に入るほど辛くて苦しいお別れもありましたが、その分たくさんの大切な出逢いもありました。新しい景色にもたくさん出逢い、大好きな自然にいっぱいパワーをもらいました🌺
3月の出来事がダメージ大きすぎて、現実を直視できず。。。自然がないと自分を保てなかったため、4月以降は旅行という名の現実逃避をしまくりました。University も 3 terms お休みさせていただきました🙇♂️
去年は、周りの人々にたくさん理解・サポートしてもらい、感謝いっぱいの 1年だったので、2024年はお世話になった人々や会社に、もっともーーーーっっっと貢献・還元したいです。
でも、誰かを支えるには、まず自分がヘルシーで余裕がないといけないので、2024年は心と体をきちんと自己管理できるようがんばります(苦手)💪
また、少しでも多く社会や自然環境に貢献できるよう、そして新たな発見や有益な知識を皆さんにたくさん共有できるよう、一歩一歩がんばります🐾 私という人間が生きた証を、少しでも残せるように…✨
本年も引き続きどうぞよろしくお願いいたします🌈
※1. 本 Note では、読者の皆さまにとって理解しやすく、正しく解釈できる記事の制作に努めています。自然な日本語で原文のニュアンスを忠実に再現するため、直訳ではなく意訳させていただくことが多いですが、ご理解いただけますと幸いです🙇♂️
※2. また、参考文献(References)の引用フォーマットは、American Psychological Association(アメリカ心理学会)が定めている「APA Style 7th Edition」に則っているため、本 Note に掲載している日時は、すべて米国太平洋標準時(PST)で統一させていただいています。
📚 References
Altman, S. [@sama]. (2023, December 21). it’s been a crazy year. i’m grateful that we put a tool out in the world that people really love... [Post]. X. https://x.com/sama/status/1737880834651422975?s=20
Bajekal, N., Perrigo, B., & Pugliese, J. (2023, December 6). Sam Altman. TIME. [Image]. https://time.com/6342827/ceo-of-the-year-2023-sam-altman/
Future Stride Editorial Team. (2023, November 30). Generative AI Ranks First! Survey Results of 2023 IT Trends Among Business People. SoftBank. https://www.softbank.jp/biz/blog/business/articles/202311/it-trend-2023/
Sekiguchi W. (2023, June). ChatGPT calling for a fourth AI boom. The Japan Economic Research Institute. https://www.jeri.or.jp/survey/%E7%AC%AC4%E6%AC%A1%EF%BD%81%EF%BD%89%E3%83%96%E3%83%BC%E3%83%A0%E5%91%BC%E3%81%B6chatgpt/