
【AI Tuber見学ツアー】どこまでAIにやらせる?現状分析と個人的な最適解
(2/19追記) これはAI Tuber制作の雰囲気を感じてもらう記事です
思想が強めになってしまいましたが、これはAI Tuber制作の雰囲気を感じてもらおうと書いた記事です。
私、アニメ制作の裏側とか見るの好きなんですよね。公式Twittereから絵コンテとかが投稿されると大興奮するような人です。
AI Tuberにもそんな裏側を感じられる記事があってもよいのではと思い書きました。
今のAI Tuber界隈に一石を投じようとか全く思ってません。
私はこんな事を考えて作ってます的なことを書いた記事です。
他の開発者さんとかに私の思想を押し付けたいわけではありません。
はじめに
こんにちは。私はAI Tuber開発者のふぐおです。
私は普段からAI Tuberの開発をしている方々を探しては、自分のAI Tuberを作る上での参考にしています。
今日はそのノリで、一緒にAI Tuberを見ていきつつ、どこまでAIにやらせるかということを考えていきたいと思います。
AI Tuberにとって難しいこと得意なこと
AI Tuberを見て回る前に、AI Tuberにとってハードルが高いこと、得意なことを考えてみましょう。
私の考えではAI Tuberが得意な配信内容は以下の通りです。
雑談配信
歌配信
落ち着いたゲーム配信(やや難あり)
AI Tuberが苦手な配信内容は以下の通りです。
アクションゲーム配信
現状LLMは文章や画像を入力として受け取り、文章を出力します。このため、雑談配信や落ち着いたゲームはある程度こなせます。また、音楽や画像生成AIも発達しているため、歌配信も可能です。
一方で人間並みに大量の情報を短時間で処理するというのは、AIにとっては難しいことです。そのため、アクションゲーム配信は難しいと言えます。
色々なAI Tuberを見て回ろう
Neuro-sama
先ほど、AI Tuberがアクションゲーム配信が苦手という話をしましたが、Neuro-samaはアクションゲームを配信しています。
Neuro-samaは元々Osu!というリズムゲームをプレイするAIというのが始まりです。その腕前は凄まじく世界チャンピオンを倒すほどです。
他にもMincraftなど様々なゲームをプレイしています。
MOTHERv3
MOTHERv3さんもTwitchのフォロワー数11万人と人気です。
こちらの方もゲーム配信をしています。
この動画を見てもらうと分かるのですが、めちゃくちゃゲームプレイが自然なんです。
現状のAIだとこのゲームプレイを実現するのは難しいと思います。
実際に、RedditでもMOTHERv3はAIではなく、人間がTTS(テキストから機械音声を生成するAI)を使って配信をしていると話されています。
https://www.reddit.com/r/MOTHERv3/comments/10m46m7/i_cant_get_a_straight_answer_online_so_is_mother/

Neuro-samaのゲームプレイ
一方で、Neuro-samaのOsu!のプレイを見てみると、およそ人間とは言えない挙動をしています。

Osu!はノーツをマウスでエイムすることでプレイするゲームなのだが、画像中のマウスカーソルの挙動がかなりぐちゃぐちゃであり、人間がこのような挙動をすることはありえない。
誤解して欲しくないこと
「AIと名乗っているのに、AIがプレイしてないじゃないか。けしからん」ということを私は言いたいのではありません。
私は多くの人がその配信を見て楽しめることが一番だと考えており、実際にAIがプレイしているかいないかはあまり重要ではないと思っているからです。
しずく
日本人のあき先生が開発しているAI Tuberさんです。
メインは雑談配信なのですが、過去に一度だけAPEXをプレイしていました。
雑談配信はAIがしているのは明らかなのですが、APEXのプレイは人間がやっていると思われます。
概要欄にも「AItuberのしずくです!今日はあき先生と一緒にAPEXに挑戦してみようと思います!」と書かれています。
とはいえ、言動から察するにAIが会話をしているのは間違いないと思います。恐らく、あき先生がつぶやいている言動やゲーム画面のスクショをLLMに入力しており、それをもとにAIが会話をしているのだと思われます。
AIが会話人間がプレイ担当ということですね。
見学させていただいた人たちまとめ
Neuro-sama
ゲームプレイも会話もAI
MOTHERv3
ゲームプレイも会話も人間
しずく
ゲームプレイは人間、会話はAI
今日の見学はこのくらいにしておきます。
全部AIにやってもらうことと私の目標の整合性
さて、見学を終えて私は考えます。AIに全部やってもらう必要はないのだなと。
私の目標は、AI Tuberで面白い配信をすることです。AIに1から10まで全部やってもらうことは、私の目標には関係ないのです。
どこまでAIにやらせるか
会話
これは私のシステムでは必ずAIにやってもらいます。
「AIが配信をしています」というのを見て配信に来てくれた人は「AIとの会話」を楽しみにきていると思います。もちろんその会話が楽しければ裏側が人間かAIかは関係ないのですが、私は相手がAIだからこそできる会話を楽しんでもらいたいと考えています。
ゲームプレイ
私が一般的なゲーム実況をするようなAIを作るかは置いておいて、このようなシステムを作るときにAIを使うかどうかについては、別に人間が裏側でプレイするようなシステムにしてもいいかなと思います。
私がやるならAIに完全にAIにプレイさせるor
「AIは会話だけだよ」ということが明確な企画内容で配信をするという形をとると思います。
コメントの拾い方
ここまでの話はAI Tuberを開発したことがない人でも比較的馴染みのある話だと思いますが、AI Tuberを作る側になると悩ませられるのが、「コメントの拾い方」です。
「コメントの拾い方」はたまに話題になりますね。
危ないコメントを拾い、それにそそのかされて、AI Tuberが危ない発言をすることでBanされたとか怒られたとか。
やはり、ここは人間がチェックするのが一番です。
私のシステムでは、AIはコメントを拾わないです。
発言タイミング
「発言タイミング」は特に人間とAI Tuberが会話をするときに重要になります。
イメージが湧かない人用に人間とAI Tuberが会話をしている動画を置いておきます。
AI Tuberちゃんが凄い勢いで話しちゃったり、逆に全然喋らなかったりとならないように空気を読むのが大事になります。
でもこの空気を読むというのを実装するのは大変ですし、見ている視聴者さんも発言タイミングがAIか人間かというのは、あまり気にしないと思います。
なので、私のシステムでは`発言タイミング`は人間が決めるシステムになっています。ただ、毎回私が決めるの面倒なので、一部自動化しています。
まとめ
AI TuberさんによってAIがやっていること、人間がやっていることは様々なことが見学していてわかりました。
AIが得意なことや難しいことがあります。
視聴者さんがどこを見ているかを加味しつつ、私のシステムではAIと人間の割り振りは以下の通りにしています。
会話: AI
ゲームプレイ: 人間でもAIでもどちらでも
コメントの拾い方: 人間
発言タイミング: 人間
宣伝
普段ニコ生でAI Tuberや配信ツール作る配信やってます。
見に来てね。
コメント欄でSpotifyの流したい曲のurlを打つと、次流れる曲になる機能復旧しました。
— ふぐお/AI Tuber開発中 (@boxfish_jp) February 1, 2025
(キューに追加しました。と邪神ちゃんが言ったら、キューに追加されてる。エラーだった場合指摘してくれます) pic.twitter.com/yrdhhbagIv