AivisSpeechのGPUサーバーをブラウザのみで構築する方法🚀

高品質でモデル共有のためのハブまで揃っている話題のAivisSpeechですが、これのGPUインスタンスをブラウザでぽちぽちするだけで数分で立てる方法をまとめました。

RunPodでGPUインスタンスを立てる

AivisSpeechではCUDA 12.4を使用しているらしいので、以下のテンプレートを使ってPodを作ります。

この際にテンプレートを編集して、起動時処理に以下を設定します。これは永続化されるストレージにAivisSpeechのインストール&起動用のシェル(非公式)を保存するための処理です。

git clone https://gist.github.com/45dc2c524d1a3d8f238121210d615cce.git /workspace/aivisspeech

また、ポート番号10101を公開するようにしてください。

テンプレートに値をセットして上書き

設定したらPodを起動します。すると、すぐにfatalなエラーメッセージが表示されますが、これは正常ですので、Podを停止します。

エラーになりますがこれであってます

AivisSpeechを起動する

Podの編集画面を開いて、先ほどのシェルを起動時処理に設定します。

先ほどのシェルをセット

設定したらPodを起動します。初回のみAivisSpeech Engineをダウンロードするため、少し長く時間がかかります。
2回目以降は初回より早くなりますが、cuDNNを毎回インストールするため1分くらいかかります。これはRunPodの仕様で、インスタンスを停止するとapt installした資源が削除されるためです。削除されないやり方ご存知の方おしえてください🙏🙏🙏

さて、以下のようなメッセージが表示されたらAivisSpeech Engineの起動完了です。

起動完了!

PodのConnectボタンから接続して、以下の画面が表示されれば成功です。

AivisSpeech Engineのルート画面。APIドキュメントから動作確認できる

簡単でしたね!🙌

キャラクター対話を楽しもう🥰

AivisSpeechの魅力的な声でAIキャラクター開発をしてみたい!という方は、ChatdollKitというフレームワークを使えばiOS/Android/PC/Web/VR/ARとあらゆるプラットフォームで音声対話型AIキャラクターを開発できます。
AivisSpeechのAPI仕様はVOICEVOXと互換性があるため、VoicevoxSpeechSynthesizerという音声合成部品がそのまま利用できます。

こんな感じで表情や身振り手振りを交えた会話、マルチリンガル対応ができたり、

自律運転可能なAITuberも作れます。

ではでは!👋


いいなと思ったら応援しよう!