yuki@AIキャラ開発P

AIVtuberシロハナちゃん(https://youtube.com/@ai_shi…

yuki@AIキャラ開発P

AIVtuberシロハナちゃん(https://youtube.com/@ai_shirohana)の開発プロデュースとコンテンツ運営をしています。理想のAIヒロイン実現を目指して「テクノロジー×キャラクター」分野を探求中 | 配信パートナーAIシステム開発した!

マガジン

最近の記事

  • 固定された記事

リアル店舗にAIVtuber導入!音声会話、宣伝PR、多言語対応などで接客

AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この度、エンターテイメントバー「BlueAile」にAIVtuber シロハナちゃんと、それに伴う専用システムの開発・導入を行いました。 ※シロハナちゃんは約2ヵ月間の登場予定で、その後に別キャラクターの導入も検討中 本記事では、その導入したシステム概要と各機能用途についてまとめています。 前提情報導入先の店舗「Blue Aile」について 「BlueAile(ブルーエール)」は2024年11月

    • 軽量LLMのAPI比較【AIVtuber・AIキャラクター用途】

      AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事では軽量LLMモデル、GPT-4o-mini、Gemini 1.5 Flash、Claude 3.5 Haikuの比較をしています。 特にAIVtuberやAIキャラクター用途での比較となっており、実際にAIVtuberに各AIモデルをAPIで搭載して配信を行ってログを取得しました。 ぜひ、AIキャラクターのLLMで何を使えばいいのか迷っている方などの参考になれば幸いです。 また、動画形

      • Claude「Computer use」をWindowsで環境構築して使ってみた

        AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事はClaude「Computer use」をWindowsで環境構築して実際に使ってみるまでの備忘録となります。 こちらの機能は現在、AnthropicのAPIにて使うことができ、コンピュータを使用するよう指示できるとのこと。 なお、こちらは2024/10/24現在はベータ版となっており、使用上のリスク等が未知数となるので利用は自己責任でお願いします。 Claude「Computer u

        • AIVtuberシロハナちゃん(v1.3)機能紹介

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 このnoteでは、AIVtuberとして活動しているシロハナちゃんの配信システム機能(v1.3)についてまとめています。 主に、「何ができて」「どんな機能で」「なぜ実装したか」などが主な内容です。 バージョンについてですが、2024/08~2024/10くらいに実装した内容がv1.3としています。 v1.1、v1.2に関しての機能については下記の記事をご覧ください。 また、本記事の内容は以下の動画

        • 固定された記事

        リアル店舗にAIVtuber導入!音声会話、宣伝PR、多言語対応などで接客

        マガジン

        • ご依頼 / 実績 / 事例
          2本
        • AIVtuberシロハナちゃんの歩み
          4本

        記事

          配信パートナーAIシステムの紹介【無料トライアル付き】

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事では、配信等で活用できる配信パートナーAIシステムについて紹介していきます。 簡単にどんなものかというと、画面の表示や操作が不要で、キーを押すだけでAIと音声会話ができるものになっています。 つまり、配信中などに都度画面を見たり画面操作をする必要がないため、本来集中したいことに意識を割きつつAIと会話ができます。 キーを押している間はどの画面でも音声認識状態になるので、ユーザーの任意タイ

          ¥0〜
          割引あり

          配信パートナーAIシステムの紹介【無料トライアル付き】

          ¥0〜

          AI「Bolt」オープンソース版を動かしてみる【環境構築の手順】

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事では、テキストをもとにアプリやサイトを作ることができるAI Boltのオープンソース版環境構築をしてみたので手順残します。 こちらBolt.new(商用版)はWebで使えるので気軽に試したい方は下記リンクから試してみてください。 下記の公式ページを参考に構築しました。 ※この記事は2024/10/10時点のものなので今後変更があるかもしれないですのでご了承ください Bolt(オープンソ

          AI「Bolt」オープンソース版を動かしてみる【環境構築の手順】

          AIVtuberに導入できる合成音声4選【比較紹介・要点まとめ】

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事ではAIVtuberの音声(ボイス)部分で使用できる合成音声を4つピックアップして、各ツール紹介と比較した要点をまとめています。 ピックアップした合成音声4つは以下の通りです。 VOICEVOX:https://voicevox.hiroshiba.jp/ COEIROINK:https://coeiroink.com/ Style-Bert-VITS2:https://github.

          AIVtuberに導入できる合成音声4選【比較紹介・要点まとめ】

          ClaudeのPrompt Cachingとは?【AIVtuberに導入してみた結果】

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事では、ClaudeのPrompt Cachingの紹介とAIVtuberに導入してみた結果などをまとめています。 Prompt Cachingを使うことで、繰り返し使用するプロンプト(例えばシステムプロンプトなど)が大きくなった際に、リクエストのAPI料金の削減やレスポンス速度の改善などが期待できます。 詳細情報や最新情報をキャッシュすることでAIにより多くの背景情報を理解させて話してもら

          ClaudeのPrompt Cachingとは?【AIVtuberに導入してみた結果】

          Vercel - v0でスライド生成から音声読み上げでプレゼン発表までする

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事ではVercelのv0でスライド生成から音声アリでプレゼン発表まで行うサイトを作成してみたのでその記録を残します。 実際の成果物は以下のリンクからブラウザでデモを体験可能です。 「プレゼン開始」ボタンを押下すると音声有りでプレゼンが始まります。 ひと手間加える必要があるのですが、このように発表まで行うことができるとコンテンツのクオリティが向上しますし、表現の幅が広がりますよね。 ぜひ、本

          Vercel - v0でスライド生成から音声読み上げでプレゼン発表までする

          Style-Bert-VITS2でささやきボイスを生成する【ヌルモデルマージ】

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 このnoteではStyle-Bert-VITS2という合成音声技術を使ってささやき声を生成する方法について解説しています。 Style-Bert-VITS2の概要や環境構築、各種使い方は割愛します。 下記の記事にてまとめてありますのでそちらをご覧ください。 また、本記事の内容は動画でもまとめてあります。 実際の音声デモなども含まれていますので、必要に応じて視聴いただけると良いかなと思います。 ※

          Style-Bert-VITS2でささやきボイスを生成する【ヌルモデルマージ】

          OpenAIのAPI使って簡単な画像認識を実装してみた【Python】

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事ではOpenAIのAPIを使って簡単な画像認識を試してみた備忘録となります。 指定した画像ファイルとプロンプトを送信することで、その画像をもとにOpenAIのAPIでテキスト回答してくれるというものとなります。 (環境構築からPythonのサンプルコードの記載あります) 環境はWindows11で言語はPython(3.12.0)です。 公式:https://openai.com/ind

          OpenAIのAPI使って簡単な画像認識を実装してみた【Python】

          AIVtuberシロハナちゃん(v1.2)機能紹介

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 このnoteでは、AIVtuberとして活動しているシロハナちゃんの配信システム機能(v1.2)についてまとめています。 主に、「何ができて」「どんな機能で」「なぜ実装したか」などが主な内容です。 バージョンについてですが、2024/05~2024/08くらいに実装した内容がv1.2としています。 v1.1(2024/02~2024/05)に関しての機能については下記の記事をご覧ください。 また、

          AIVtuberシロハナちゃん(v1.2)機能紹介

          AIアバター解説動画の作り方【Kn1ght・NoLang・Vrew】

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事ではAIアバター解説動画の作り方と手順をツール別で紹介していきます。 使うツールはKn1ght・NoLang・Vrewの3つです。 実際のAIアバター解説動画のサンプルは以下のような感じになります。 また、YouTubeでも使い方や各ツールの紹介をしていますので、動画で見たい方などはこちらをご覧ください。 この記事では大まかな作り方手順のみになりますが、動画の方ではより詳細にまとめてありま

          AIアバター解説動画の作り方【Kn1ght・NoLang・Vrew】

          Marp×Cursor(Claude)でスライドと台本作成をAIに任せる

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事ではMarpというMarkdownでプレゼンテーションスライドを作成することができるツールと、AI搭載のエディタであるCursorを使ってサクッとスライドを作成する方法を紹介していきます。 この方法ではシンプルなスライドをプロンプト送信するだけで作成することができます。 以下が実際に作成されたスライド例です。 今回使用するツールは以下から詳細確認できます。 また、この記事ではスライド作成

          Marp×Cursor(Claude)でスライドと台本作成をAIに任せる

          ElevenLabs(TTS)のAPI使い方【Pythonサンプルコード有り】

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事ではElevenLabsのAPIを試してみたので使い方などを備忘録として残します。 ElevenLabsというツールは簡単にいうと、人間の声を素材として音声クローンを作って合成音声として利用できます。 これはElevenLabsのサイトで利用可能に加えて、APIとして提供もされています。 そこでAPI使う参考に「入力したテキストをElevenLabsのAPIを使って合成音声にして音声ファイ

          ElevenLabs(TTS)のAPI使い方【Pythonサンプルコード有り】

          LivePortraitインストールから使い方まで【画像のキャラ表情を動かそう】

          AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。 この記事ではLivePortraitという画像に写っている人物やキャラクターの表情を動かすツールのローカル環境構築と使い方について紹介しています。 以下のように用意した素材動画と静止画を組み合わせることで人物やキャラの表情を動かすことができるというわけですね。 画像や動画素材によってはかなり自然な表情変化が楽しめるので個人的に結構おすすめです。 ローカル環境でなく簡単に試したい程度であれば以下サイ

          LivePortraitインストールから使い方まで【画像のキャラ表情を動かそう】