![見出し画像](https://assets.st-note.com/production/uploads/images/162728256/rectangle_large_type_2_cc48353e4de5bfc2bea76c32c5a1d94c.png?width=1200)
【ElevenLabs】独自音声の会話型AIエージェント使い方解説【Conversational AI】
AIVtuberシロハナちゃんの開発プロデュースをしているyukiです。
この記事ではElevenLabsのAIエージェントであるConversational AIを解説するのと、活用方法を紹介していきます。
Conversational AIでは、ElevenLabsで作成した音声モデル(例えば自分のクローンボイスやオリジナルボイスなど)をもとにしたAIと音声会話ができ、そのAIエージェントをリンクで共有したり、埋め込みをすることが可能です。
これらを活用すれば、開発したプロダクトやWebサイトに埋め込みリンクを設置するだけで設定してあるナレッジやキャラ要素をもとに応答するAI会話ツールを簡単に埋め込むことができます。
動画でも同様の内容を解説しています。
実際のAIエージェントとのやり取りなども見たい場合はこちらも是非ご覧ください。
※この記事は2024/11/22時点のものなので今後変更があるかもしれないですのでご了承ください。また、現状はBeta版となっています。
ElevenLabsについて
ElevenLabsは合成音声サービスで自分の所持してる音声素材をもとに音声クローンを作れることが特徴となっています。
Webサービスで手軽に使用することができるのと、音声モデル作成も簡単なものなら数分で作ることができます。
詳細は以前に動画とnoteにまとめていたのでそちらをご覧ください。
Conversational AI
Conversational AIはElevenLabsで作成した音声モデルのAIと会話ができます。
イメージで言うとChatGPTのAdvanced Voice(音声機能)で、音声は独自のモデルという感じです(感情表現や精度は少し劣るかも)。
AIエージェント作成と設定
それでは実際にどのようにAIエージェントを作成するのかという部分から解説していきます。
全ての項目を説明するのは情報量が多くなるのでAIエージェントとの基本的な会話をする内容以外は割愛しています。
詳細は公式ドキュメントもあるのでそちらご覧ください。
①Conversational AIのページに遷移してPlaygroundの隣にある「+」ボタンを押下
![](https://assets.st-note.com/img/1732110581-hCAz4XFBg6ZU8mjuvJqs1KTO.png?width=1200)
②AIエージェント名を入力して、テンプレートを選択
![](https://assets.st-note.com/img/1732111619-wA3k1KtyBhOr2sGcJ07TUQlg.png?width=1200)
③エージェント設定
![](https://assets.st-note.com/img/1732113466-iEaLozOpCTc8uZV19GmjJf2B.png?width=1200)
Agent Language:言語を選択(日本語だけど多言語対応してます)
First message:AIが最初に話しかける内容を設定。(空の場合は何も言わずにユーザーが話しかけるのを待ちます)
System prompt:システムプロンプト。どういう振る舞いをするのかなど。
![](https://assets.st-note.com/img/1732113777-USZw0jndaT74W2JfKbr3mLOX.png?width=1200)
LLM:AIのLLMを選択。現在のBeta版では無料ですが将来的にはユーザーが負担とのこと。生成速度はGemini 1.5 Flashが最速。
![](https://assets.st-note.com/img/1732113966-ZswVFAOz06cKP1Nh2bY8J3fa.png?width=1200)
④ボイス設定
![](https://assets.st-note.com/img/1732116814-gA4jhO8T5FIqxUEk0saJu3D1.png?width=1200)
Voice:AIエージェントの音声を選択します。主に以下の選択肢があります。
既にElevenLabsにて用意されている音声モデルや公開されているモデル。
クローンボイス:ElevenLabsでは音声素材をもとにクローン音声モデルを作ることができます。そこで作成したモデルをAIエージェントに充てることもできます。(作り方など詳細はこちらの動画で解説済み)
Voice Design:ElevenLabsではプロンプトから音声モデルを作成することができます。そこで作成した音声モデルもAIエージェントに使用可能。
上記の音声モデル選択肢からAIエージェントに適用させたいボイスを選択します。
⑤AIエージェントをテストする
![](https://assets.st-note.com/img/1732115958-PcLanNXDt9TjZvly3Shpd8WF.png?width=1200)
![](https://assets.st-note.com/img/1732116012-ownJB9xRMfectDX73ZqIr1SG.png?width=1200)
これで設定した内容でデモのようにAIエージェントと会話ができます。
※他にも設定項目はありますが割愛。
リンク共有と埋め込み
![](https://assets.st-note.com/img/1732116994-Ol2ILbXkRrd6oUnf85mJKFst.png?width=1200)
Test AI agentの隣にある共有ボタンからリンクをコピーできます。
このリンクにアクセスすると先ほどの設定したAIエージェントと会話できるページに遷移します。
![](https://assets.st-note.com/img/1732117087-KnNezHrwqD70LEWb8Uh3lvfC.png?width=1200)
これで自分以外の誰でも作成したこのAIエージェントにアクセスして会話をすることができます。
![](https://assets.st-note.com/img/1732117427-cXSeAZUQvBTEnoPMNCLD31kl.png?width=1200)
また、Widgetタブから埋め込みコードを取得できます。
これをプロダクトやWebサイトに埋め込めば右下に表示されているようなものが出て設定したAIエージェントとユーザーは音声会話をすることが可能になります。
用途としては、プロダクトやサイトのFAQなどがあると思います。
また、多言語対応もElevenLabsはしているので、海外ユーザー向けにも相性は良いかもですね。
また、v0やLovable(旧GPT-Engneer)などのコード生成サービスにも埋め込むように指示すれば、生成されたサイトにAIエージェントを埋め込むことができました。
![](https://assets.st-note.com/img/1732270456-mrVRxU0iEXBegM75hQnuJZzL.png?width=1200)
また、AIエージェントのUI/UXも編集できるみたいで、以下のような項目があります。
![](https://assets.st-note.com/img/1732118143-Ytv1SEho6PT95aqGOXAFNR3y.png?width=1200)
![](https://assets.st-note.com/img/1732118190-HP459dwJgGWOqujMpZar7k1y.png?width=1200)
デフォルトでも基本的には問題ないので、好みや必要に応じて修正していく感じが良いかと思います。
さいごに
ElevenLabsのConversational AIで誰でも簡単に独自の音声で会話できるAIエージェントを作成でき、共有や埋め込みまで出来るのは純粋に凄いです。
個人的な感想としてElevenLabsは日本語の読み間違いなど精度はもう少しの印象はありますが、全然聞き取れますし多言語もできますからね。
ぜひWebページやプロダクトに埋め込むことも検討してみてください。
以上!それではまた👋
いいなと思ったら応援しよう!
![yuki@AIキャラ開発P](https://assets.st-note.com/production/uploads/images/160745266/profile_65af17920443e72fba313dd13e0b7ee3.jpg?width=600&crop=1:1,smart)