見出し画像

美少女AIエージェントを作ってます

こんにちは、ニケです。
今回は私が開発している美少女AIエージェントの話をしつつ、今まで開発してきたプロダクトを紹介していきたいと思います。

※ 私の開発歴とかプロダクトを話すだけなので、AIエージェントを知りたい!という方向けではありません。

※ 2024/8/27 に大幅な加筆・修正を加えています。
※ 2025/1/8 にさらに加筆・修正しました。


AIエージェントとは?

「その仕事、AIエージェントがやっておきました。 ――ChatGPTの次に来る自律型AI革命」の著者であり、AIエージェントを開発しているジェネラティブエージェンツ社の西見氏によると下記のような定義になるそうです。

ざっくりAIエージェントを定義すると、「人がいちいち指示しなくても、自分でやることを考えて、様々なツールを活用して目標に向かってタスクをこなしていくAI」をAIエージェントと呼んでいます。

AIエージェント沼にハマるためにこの辺を見ておけば良いと思われるリソースまとめ

要は1つ指示したら色々実行してくれるAIプロダクト/サービスみたいな感じで理解してもらえればよいと思います。
AIエージェントを自律型のAI、対してChatGPTなどの人が細かく指示しないと動いてくれないAIを指示待ちAIと呼ぶらしいです。

最近はAIエージェントについての記事も増えてきたので、さらに知りたい方は調べてみましょう。
上述の書籍もオススメです。

こちらに解説動画もでているのでぜひ。

私が作ったそのままの意味の造語ですが、つまり 美少女AIエージェントとは、美少女の内面や外面(Live2DやVRMなど)を持ったAIエージェントのことを指します。

作成に至る経緯

突然ですが、私がAIの魅力に気付いたのはChatGPTにGPT-4が実装されてから、つまり2023年の4月くらいです。
AIの強力な性能を知った時、最初に私が思ったのは「AIを使って仕事量が2倍になれば給料も2倍になるじゃん!」でした(ちなみにまだなってません)。

ここからAIについていろいろ調べ始めるわけですが、その最中にサルドラさんが運営している「あいちゅーばーわーるど」に参加し、AITuber という存在を知ることになりました。

「なるほど、AITuberというのがあるのか。確かにChatGPTとは会話が成立しているし、Youtube配信に限らず、AIにキャラクターのガワを付ければいろいろ面白いことができそう」

このときから私は、美少女 x AIエージェント の魅力にハマり、プロダクト開発を継続して進めていくことになります。

※ もしより詳しい経緯が知りたい方がいたら、私の振り返り記事を読んでみてください。

それでは開発した順に私の美少女AIエージェントプロダクトを説明していきます。

過去のプロダクト

AITuber

最初のプロダクトはAITuberです。
2023年の5-6月頃に配信していました。

とりあえずAIキャラのプロダクトをやるなら、皆んなもやっているAITuberから始めてみよう、という気持ちから作りました。
中身はコメント拾ってAIに回答を生成してもらって返すという単純なものです(正直これだけでAIエージェントと呼べるかは疑問ですが…)。

最初こそ「お〜」という感じで見ていましたが、すぐに壁にぶつかります。

「これ、つまんないぞ」

そう、コメントに対してそれっぽい回答を返すだけのAITuberは面白くありません。

当時はこの形式のAITuberがほとんどだったと思います。
チャットに反応するというユーザー体験も感じられるし、実装もそこまで難しくない、確かにこれはある種「AITuber」の正解だとは思います。

ただ、このようにコメントに回答するだけのAITuberは、視聴者に配信のテンポを委ねているため発話量もかなり不安定で、強く惹かれるような魅力を作り出すことができませんでした。
当時はAIモデルの性能がそこまで良くなかったのものあると思います。

そもそもYoutubeで再生数稼いでやろう!という情熱もなく、とりあえずやってみようという一発企画で始めたので、1 ~ 2ヶ月ほどで切り上げることになりました。

現在はコメントにただ返すだけではなく、AIキャラが自発的に発言する機構を取り入れたり、様々な斬新な取り組みを展開しているAITuberも続々と登場しているので、気になる方は調べてみてください。

AITuberのリストは下記の個人サイトにまとめています。

最近また私個人のAITuberプロジェクトを稼働しようと画策中です。

美少女OPInterpreter

美少女Live2DとOpen Interpreterを結合したプロダクトです。こちらは2023年9月作。
Open Interpreterは簡単に説明すると対話しながらプログラムを実行してくれるライブラリですが、このプロダクトではその機能をそのまま美少女が実行してくれます。

先ほど経緯のところで、私は「仕事を効率化させること」がAIに一番求めていることだと説明しましたが、美少女AIがこれを実現してくれるならそれに越したことはありません。

美少女 x プログラミング = 最強 です。

では、これは成功作だったでしょうか失敗作だったでしょうか?

正解は失敗作です。

まず一に使い心地が悪い。
Open InterpreterはターミナルやPythonで実行することができ、ログも出力されます。
出力速度はAPIの出力速度そのままなので、もちろんAIキャラが喋って説明するよりも断然速いです。

ましてや仕事の効率向上を求めていたのに、美少女を導入したせいで効率が落ちた、となったら美少女にも失礼です。

二つ目に、 AIエディタの登場です。

それまではプログラミングの疑問はChatGPTにしていました。質問するだけで回答してくれるのは大変便利でよかったのですが、既存コードの場合はコピペする必要があり、体験はあまり良くなかったです。

ここでCursorが現れました。
CursorはAIを搭載したエディタで、コードの隣にChatGPTが付いたようなもので、コピペせずにコードの質問ができます。革命です。

美少女OPInterpreterと完全に用途を比較することはできませんが、あえて使うほどの上位機能は持っておらず、Curosor登場後の12月以降は完全に使わなくなっていました。

美少女OPInterpreterは個人的に思い入れもあり、好きなプロダクトだっただけに残念でしたが、ただ美少女ガワがあるだけではダメだとを気付かさせてくれる良い経験を提供してくれました。

美少女ガワが付いている意味がないといけない。
そこで作成したのが以降のプロダクトです。

完全自動AIゲームプレイ&実況

2023年11月末に開催された Game Character Meetup というAI x ゲームのミートアップで発表するためにASAさんとの共作として作成しました。

ゲームの自動プレイ自体は2023年8月頃にできていたのですが、それにAIキャラによる解説をつけてアップグレードしたプロダクトです。

試合に開始から終了までの動画もあるのでぜひ見てみてください。
テンポが悪いのでカット編集していますが、処理自体は最初から最後まで完全自動です。

プロダクトの特性的にリアルタイムにガチャガチャ動くアクション系のゲームは相性が悪いですが、ポケモンのようなターン制ゲームではかなり可能性があると感じています。

これを改良したバージョンを2024年11月の『生成AIなんでも展示会 Vol.2』でも展示しました。

現在は開発を止めていますが、AITuberとして配信するのも面白そうですし、いつかまた着手したいジャンルでもあります。

外国語勉強用エージェント

なんてことはない外国語勉強用のAIエージェントです。
私自身が利用することを想定して、2024年2-4月に開発していました。

システムとしてはおおよそこんな機能が盛り込まれてます。

  • 応答に合わせた口パク・表情

  • 短/長期記憶

  • タスク管理

  • 好きなお題でシチュエーション対話作成

  • 言語に合わせてTTSサービス切り替え(VOICEVOX / elevenlabs / Google)

  • 言語に合わせてSTTサービス切り替え

また、外国語勉強用と説明しましたが、主機能がそれというだけで Function Calling 的に会話の流れから以下のような対応もよしなにしてくれます。

  • 天気を教えてくれる

  • ゴミの集荷日を教えてくれる

  • 卓上アプリのONOFFを切り替える

  • 実は美少女OPInterpreterの機能残ってる

  • etc…

こちらは日常使いするほどの実用性が出せるまで完成していませんでしたが、かなり惜しいところまでできていたと思います。

少し壁にぶつかってしまったのと、次に解説するプロダクトに時間を割くようになってしまったので開発を停止しました。

AITuber with ろてじんさん

ろてじんさんと開発しているAITuberです。

ろてじんさんはAITuberのキャラの魅力を引き立たせる演出の作り方が素晴らしく、特に音声合成(Text to Speach)のレベルに関しては私が知る限りでは最高だと思っています。

私はエンジニアとして、このキャラクターがAITuberとしてより魅力的になるように、プログラム部分のサポートをさせていただいていました。

開発中のプロダクト

AITuberKit

2024年4月〜現在で開発中のプロダクトです。これ経由で私のことを知っていただいた方も多いと思います。

誰でも簡単にAITuberを作れる! という触れ込みのプロダクトで、初心者の方でもすぐにAITuberを試せるような設計になっています。

AITuberと謳っていますが、AIキャラチャットとしても使用可能で、スライド発表機能など様々な追加開発を継続して行っています。

ニケシステム

先ほど紹介した「外国語勉強用エージェント」をベースによりAIエージェントらしく拡張したプロダクトです。
こちらは未公開・開発中のプロダクトになります。

美少女のガワを保ったまま私の日常的に発生するタスクを肩代わりしてくれるAIエージェントの作成を計画しています。
ただ、このままではただ見た目が美少女なだけのAIエージェントです。

ニケちゃんプロジェクトでは、AITuber開発で培った性格の出し方や記憶の持たせ方などのノウハウを詰め込み、"彼女"にキャラクター性を与えます。

正に 美少女AIエージェント です。
私はもう一人の自分が欲しい。

終わりに

まとめてから気づきましたが、この数年で思っていたよりも美少女AIエージェント関連でいろいろやっていて自分でも驚いています。

最初のAITuberから始まり、様々なプロダクトを通じて多くの学びがありました。
特に印象に残っているのは、単に美少女のガワを付けるだけでは不十分で、AIエージェントとしての機能性と魅力的なキャラクター性の両立が重要だと気付かされたことです。

自己満足で終わらないためにも、この点は常に気にして開発を続けていく必要があると思いました。

現在進行中のAITuberKitや未公開のニケシステムなど、これからも美少女AIエージェントの可能性を追求し続けていきたいと思います。

今後の展開にもぜひご期待ください。


いいなと思ったら応援しよう!

ニケちゃん
いただいたサポートは主にOSSの開発継続費用として役立てます。