![見出し画像](https://assets.st-note.com/production/uploads/images/125713966/rectangle_large_type_2_ed0bf85a57f3054fe678c914db99d45e.png?width=1200)
AITuber開発者として振り返る2023年 & 次の目標
こんにちは、ニケです。
書き始めた割に別にログを残していたわけではないのでうろ覚えですが、ツイートを遡って振り返りたいと思います。Twitterは日記。
4月
突然4月ですが、1~3月はAITuberどころかAIにすら触れてない、なんならChatGPTもまともに触ってなかったので割愛します。
一緒に仕事していた知人から「AIキャラクター作ってみない?」と誘われたことがすべての始まりです。この一言からAIに興味を持つ事になりました。
「AIですか? あんまり意識してなかったけど、確かにTwitterのTLにAI関連の内容増えてきましたよね」
そんな会話をしたのを覚えています。
この程度の認識だったので、もちろんAITuber自体ほとんど知りません。
何となく neuro-sama と しずくちゃん の存在は聞いたことあるくらいです。
そんな状態でこの知人からサルドラさんの『あいちゅーばーわーるど』を紹介してもらい参加しました。
この時すでにコミュニティは大きく、気づいてなかっただけで多くのAITuberが誕生していることを知りました。
やるやらないにしても動かしてみないことには何もわからないということもあり、とりあえず作ることを目指します。
当時はAI自体に疎かったこともあり、AIキャラがどうやって動いているのか、モデルから言語、環境などをあいちゅーばーわーるどで質問しまくりました。
ちなみに、ChatGPTに課金し、本格的に使い始めたのもこのときです。
その知人に「これを使ってないのは人生の半分損してる」と言われて使い始めましたが、マジで「人生の半分損するパターン」あるんだってなりました。
晴天の霹靂とは正にこのことですね。
5月
pixiv社より ChatVRM が登場します。
これは現在の私のフロントアプリのベースにもなっています。
これまではUnityで実装しようとしていたのですが、始めて触る言語ということもあり、かなり苦戦していました。
ChatVRMはブラウザベース(React)で動いているので、Webエンジニアの私にとってこのリポジトリの公開は光明です。
すぐに乗り換えたのを覚えています。
とにかく出遅れるのが良くないと思ったので、Youtubeコメントに反応するようにChatVRMを改造して、すぐにAITuberを公開しました。
キャラは何でも良かったので、当時から自身のアイコンに設定していたNFTをモデルとして採用しています。
この後も少し機能を追加してはライブ配信、というのを数回繰り返しました。
2キャラで会話みたいなのもやってましたね、懐かしい。
数回配信したところで、重大なことに薄々気づき始めます。
そう、AITuberの配信は面白くない。
ただ配信のコメントを返すという単調なシステムであったことも問題あったと思いますが、じゃあこれから発展したとして普通のVTuberみたいなことできて、それで人が集まるのか?となったら、そんな単純な話でもありません。
珍しさはあるもののエンターテインメント性を持続して提供し続けるのは可能なのか?
そしてそこまで行ったとして、マネタイズできるのか?それならそもそもVTuberで良くないか…?
知人も共通の認識のようで、いろいろ話し合ったのですがビジネスとして展開するのは無理があるという結論に至り、AITuber開発の話は頓挫しました。
そういった背景もあり、これ以降の配信は一旦ストップします。
ただ、個人としてAITuberというキャラに魅力は感じていたので、開発することを続けます。
エンタメとは別の方向で何かできないのか?と模索し始めたのもこの時です。
ここで目標設定
この挫折を経て改めてAITuber、いや、そもそもAIで何を実現したいのかを考えるようになります。
(エンタメ路線は上述の理由でなし、やったとしても技術力の勝負になったらライバルに勝つのは相当大変。そうなると、やっぱりネタ勝負になるのか? どうにかして面白いAIキャラを作る…?
というかそもそもだけどAIキャラを作って、私は本当にVTuberみたいなことしたいのか?
…一旦キャラは置いといて、じゃあAIは何に使えるんだ?
AIなんだから、AIが得意なことをさせれば良いのでは?
仕事を任せられるAIを作って、それのインターフェースを美少女にすれば良いのでは?)
とまあ当時はいろいろウダウダ考えてたわけですが、最終的に落ち着いた目標は下記のような感じです。
実用性を兼ね備えたAI技術で仕事を楽にすること
これのインターフェースを美少女モデルにすること
ざっくり言うと、AI美少女に仕事を手伝ってもらうことです。
これなら実現できたら素直に嬉しいし、開発自体も楽しいだろうし持続できそうです。
その経過を配信することで反応をもらえたら、承認欲求も満たされるのでなお良しです。
これ以降は、脱線はするもののこの大きな軸はぶらさずに活動してきたと思います。
6月
思い立ったら即行動、ということでとりあえず制作したものがこちらです。
指示通りにhtml, css, javascriptを吐き出してもらったものをリアルタイムで描画してもらうだけですが、当時はそこまでアプリ生成プロンプトは流行っていなかった(と思う)ので我ながらよくできたなあと思ってます。
もちろんこれが私の仕事を助けてくれることはないですが、コードを実際にAIに書かせてその経過を表示する、というのは今のシステムでも活かされているポイントです。
そしてこれが動画初編集で、その大変さを痛感したのも初めての体験でした。
あとは、何か案を思いついたらすぐに着手できるように、Live2Dモデルの発注と動作環境の構築だけは進めていました。(ちなみに、あえてVRMからLive2Dモデルに切り替えたのは、VRMよりも安価で可愛いを作れると思ったからです)
AITuberから話が脱線しますが、当時マインクラフトをAIが操作する動画が少し流行りました。
一緒にゲームをできるAIとか夢そのものですよね。
これを漠然とやってみたいという気持ちをツイートしたら、意気投合してくれたフォロワーの方がいたので、『AITuberゲーム部』というDiscordサーバーを立ち上げました。
このサーバーは今でもAI情報をフランクに共有し合う場としてとても役に立っています。
7月
Live2Dモデルのイラストが完成しました。
次はモデラーさんを探して動きを依頼します。
Live2Dの完成まであと2ヶ月くらいかかりそうなので、それまでは3Dニケちゃんでお楽しみください
— ニケちゃん@終生陰ジニア (@tegnike) July 3, 2023
改めて見るとのっぺりしてるなあ!! pic.twitter.com/uwNqrXdRth
![](https://assets.st-note.com/img/1703547962449-91hWAbgMgg.png?width=1200)
モデルが出来上がるまで手持ち無沙汰ですし、とりあえず簡単に動かせるLLMアプリを作りたかったため、Discord bot AIニケちゃんを作成して稼働を開始させました。
Twitterなどで募集を出したら、日頃顔出ししていたいくつかのサーバーに置かせてもらえることになりました。
機能は少ないとはいえ、誰かに使ってもらえると自分では気づけない不具合を見つけられるのでよい機会ですよね。
discord chatbot完成…
— ニケちゃん@終生陰ジニア (@tegnike) July 26, 2023
- 特定チャンネルに常駐
- 簡易記憶あり
- ユーザ名認識可能
- 会話から自分が返答すべきかを自動判断
- モデル別API呼び出し回数制御
眠ってる間にバグったら怖いので起きたら追加します
8月
AITuberゲーム部のメンバー かつ フォロワーのASAさんと共同で自動化AIゲームを開発することになりました。
元々は6月のところで説明したようにマインクラフトを自動化するために発足したわけですが、いろいろ試した結果頓挫してしまいゲームAIの開発は一旦中断していました。
とはいえせっかく作ったコミュニティだし、とりあえず何か形になるものを作りたいということで、最終的にNintendo Switchのポケモンスタジアム2を自動化することになりました。
理由は、ターン制であること、画面からすべての情報を取得できること、画面パターンが少ないこと、ポケモンはすでにGPTがある程度の知識を持っているので考慮することを減らせること、などです。
とりあえず形になるものを8月内に完成させるぞ!、とかなり切羽詰まって頑張った記憶があります笑(メインシステムの実装は主にASAさんに対応いただきました!本当にありがとうございます…!)
8月の進捗です、お納めください#AIニケちゃん
— ニケちゃん@終生陰ジニア (@tegnike) August 31, 2023
AIにゲームをプレイしてもらうシステムを作りました!! - YouTubehttps://t.co/H5glHlbWfM
AITuberの進捗としては、Live2Dのモデラーさんが見つかってモデリングを依頼していたところです。
9月
おそらく私にとって一番影響が大きかったのがこの月です。
まず、ついにLive2Dモデルが完成しました。
これでいつでも可愛い女の子を動かす準備ができたわけです。
そして2つ目、Open Interpreterが登場しました。
AI界隈の皆さんはもちろん御存知だと思いますが、簡単に言うとローカル環境で動かせるChatGPT Code interpreterです。
自分のシステムに組み込める版Code Interpreterですから、私の「AIを使って仕事を楽にすること」という目標にピッタリです。
UIと繋げることで「美少女に開発してもらう」というのを実現できます。
そうとなればとりあえずやるしかないということで公開から4-5日で作成したのがこれです。我ながら仕事が早い。
名付けて『美少女OPInterpreter』です。
Open Interpreter x 美少女のプロトタイプです
— ニケちゃん@終生陰ジニア (@tegnike) September 12, 2023
これからUI側から入力できる機能とか、文節に区切ってすぐに発話させる機能とか追加していきます💪#OpenInterpreter #AIニケちゃん pic.twitter.com/w00kQGnply
この後はこのプロダクトを継続して育てていくことになります。
10月
10月も変わらず美少女OPInterpreterの開発を続けます。
簡易版のリポジトリと紹介記事なども公開しました。
Open Interpreterの開発者であるKillianの目に止まってややバズしたのは良い思い出です。
Killianパワーでリポジトリのスターが100超えたのにはビビりました。
(その後、機会があってKillianとビデオ通話したのはまた別のお話…)
uhh there's a VTuber powered by Open Interpreter you can chat with over YouTube Live
— killian (@hellokillian) October 8, 2023
there are billion dollar companies that haven't come this close to the "minority report" AI vision lmao.
open source is eating the world pic.twitter.com/Ns3gvJAVAw
それ以外では、ずっとやろうやろうと思っていたローカルLLMに触り始めたのもこの月です。
現在のローカルLLMの回答精度ではGPT-4の比較にもならないので、個人的にはあまり注目していませんでした。
しかしながら、Open Interpreterライクな機能を日常的に使用するとなると、API費用が馬鹿になりません。
その点、ローカルLLMであれば初期費用に目を瞑れば費用は実質タダなので、これが試してみようと思ったきっかけでした。
あいちゅーばーわーるどと同じくサルドラさんが運営している『ローカルLLMに向き合う会』サーバーには大変お世話になりました。
youri-7Bで初めてのローカルLLMサーバーを立てて美少女OPInterpreter(要改名)から接続しました!!
— ニケちゃん@終生陰ジニア (@tegnike) October 31, 2023
見た目は同じでわかりづらいですが、わかる人にはわかる解答の中身です、ご確認ください🫰
streamじゃないからやや回答が遅いのはご愛敬… pic.twitter.com/1wOEHvzB4C
11月
OpenAI DevDayがあった月です。発表日(5日)はその情報量の多さにかなり疲弊したのを覚えています。
それでも美少女OPInterpreterの開発は止まりません。
OpenAI DevDayの発表がすごすぎてもう誰も興味ないと思いますが、美少女化したLinuxの動画が撮れたので電車の待ち時間にでも見てもらえたら嬉しいです
— ニケちゃん@終生陰ジニア (@tegnike) November 7, 2023
外部PCから指示でdockre-compose実行 => APIサーバー立て
→ 外部PCから指示でエンドポイントを追加してもらう
→ 外部PCで追加エンドポイント実行 pic.twitter.com/m8h21kWb9H
DevDayでは画期的なサービスがいくつも発表されましたが、個人的に一番気になったのはAssistants APIでした。
これは、ドキュメントを読む限りでは、AIニケちゃんの魂をそのままAssistants APIに移行できると思ったからです。(GPTsもすごいサービスではありますが、あくまでChatGPTの拡張で私のアプリに接続できないですしね)
streamモードがないということなので、とりあえずDiscord botに実装することにしました。
こういうときすでに動いているサービスがあると簡単にお試しできて大変良いです。
まあこのときはこれが地獄への片道切符だとは知らなかったわけですが…。
また、この月は月末にAI x Game Character Meetupがあるということで、8月に公開していたAI自動ゲームをこの日までに進化させておこうという話になりました。
最初は公開したら会場で誰かがネタにしてくれるかな〜くらいのテンションで進めていたのですが、この件をツイートしたら運営のようさんに声をかけてもらって展示させてもらうことになりました。
そのこともあって中途半端な形では終わらせられないので、ギリギリまで頑張ってなんとか目標であったAIプレイ x AI実況の完全自動化を間に合わせることができました。
(今回もASAさんにはかなりご協力いただきました…!)
AI自動ゲームプレイシステムがパワーアップして帰ってきた!!??
— ニケちゃん@終生陰ジニア (@tegnike) November 25, 2023
精度向上!!そしてAITuberによる実況付きの大幅進化です💪
本日のAI x Game Character Meetupでも紹介予定✨
Youtubeリンクはリプ欄からご確認ください〜〜
共同開発者:ASAさん(@haruka_AITuber) pic.twitter.com/56ginPWmNy
12月
時間が経過するのは早いものでもう2023年最後の月です。
この月は新しくOSS活動と転職活動?を始めました。
OSS活動としては、Open Interpreterのコミュニティやそれ自体にお世話になったので、何か貢献できれば良いなと思い少しずつcontributerとして活動させてもらっています。
転職活動(フリーなので言い方間違ってるかも)は、できたら仕事でもAI関連に携われたら良いな〜くらいの気持ちで始めました。まだまだ活動中です。ご連絡お待ちしています。
ちなみに、この月はほとんど美少女OPInterpreterの更新がありません。
理由は上記の活動を始めたというのもありますが、少し目標が迷走してきたのもあります。
半年前に立てた目標では、AI美少女に仕事を手伝ってもらうこと、でしたがこれがけっこう難しい。
Open Interpreterとの接続は成功したわけですが、ぶっちゃけあまり普段の開発でこれを使うことはないです。
部分的には使える場面はあると思うのですが、個人的にあまりハマる用途がなかったんですよね。
また、元も子もないですが、Open Interpreterを使うなら美少女介さずにターミナル上で経過見たほうが早いです。読み上げの分、時間をロスするので。
非情ですが、美少女を介してまでやる必要がない。
あと追い打ちをかけたのはCursorの登場です。
CursorはVSCodeをフォークして作られたAIエディタで、簡単にメリットを挙げるとChatGPTよりも楽にAIに質問を投げることが可能です。
しかも有料版($20)を使用すると、実質無制限で使用することができます。
ローカルLLMのところでも話しましたが、私のシステムを使用する場合は、どうしてもAPI費用がかかってしまうので常用的に利用するのは金銭的にも心理的にも困難です。
美少女がプログラミングをしてくれる、だけでも差別化点といえばそうなのですが、やるからには実用性を兼ね備えたいところ…。
何をさせるにしても、Cursorより優れた点を見つけないことには始まりません。
自分で作っておいてなんですが、AIインターフェースがキャラクターであるメリットってなんなんだ…
— ニケちゃん@終生陰ジニア (@tegnike) December 5, 2023
コンソールの方が早いからなぁ…
やっぱ見なくても対話で勝手にやってくれることか🤔 https://t.co/3KoMAy60mi
現在もなお、どうにかして活路を見いだせないかといろいろ模索している最中です。
2024年
※ 下記は2024/1/6に追記・修正しました。
1. プロダクト開発
振り返りでも紹介していますが、私のシステムはOpen Interpreterに始まり、AIゲーム解説など色々なことに対応させています。
このような感じで、私はこのAI美少女システムを、美少女OPInterpreter 改め ニケシステム(nikesystem)と呼び、今後様々なプロダクトや案を実現するための窓口として利用していきたいと思っています。
もちろんこれと並行し、元々の目標である「AI美少女に仕事を手伝ってもらう」を実現できるユースケースの模索 および その実現も目指します。
2. 情報キャッチアップの維持
2023年は4月からAI界隈のキャッチアップや個人開発など、飽き性の私には珍しく止まることなく突っ走ってこれたので、2024年もこれを継続したいです。
言うは易しですが、去年はほぼプライベートな時間をAIに費やしてたので、おそらく脱線したら戻ってくるのは相当しんどいはず…。
2024年も力尽きずに色々やっていきたいです。
- プロダクト開発
- note執筆
- YouTube投稿
- OSS活動
- 驚き屋 etc...
3. ポーランド語喋れるようになりたい
数年住んでますが喋れません。
スキルは意識的に勉強しないと身につかないんだなあと身をもって実感しています。
いい加減喋れたほうが色々と都合いいのでなんとか日常会話できるくらいには持っていきたいです。
一見AI関係ないですが、せっかく私自身が生成AIを触っているエンジニアなので、良い感じに活用して楽しく勉強できるんじゃないかなと思ってます。
ニケシステムと組み合わせて継続して勉強できる環境を作れないか考え中です。
4. 海外案件獲得
円安のせいで年次収入が20%減りました。
笑えません。
いつ復活するかもわからないので海外の仕事を持ってるに越したことないかなと…。
というかそもそもポーランドにいるのに日本からお仕事もらう必要ないですしね。
アウトプットは継続しつつ、ここら辺も調査していきたいと思います。
…というわけで、長々と拙い文章を読んでいただきありがとうございました。
ここまで読んでくれた方はきっとすでに私と関わりのある方だと思いますので、2024年もどうぞよろしくお願いいたします🙇♀
(もしそうでない方がいらっしゃったらぜひ絡んでください…!)
いいなと思ったら応援しよう!
![ニケちゃん](https://assets.st-note.com/production/uploads/images/166043980/profile_8ebb66b76d11b301b3d8ea5f6eee6220.png?width=600&crop=1:1,smart)