Vol.7_ど素人でも作れる!Cursor・Python・VOICEVOXで音声アプリを作る。
こんばんは!先日、Vol.6の記事で紹介した、「AIを使った音声対話型アプリ作成」第2弾。今回は、LLMで生成した回答を音声ボットに喋らせてみます。Python(プログラミング)初心者でも、CursorとVOICEVOXを使えば簡単に音声アプリが作れてしまいます。
Cursorとは?→こちら!!
無料で使える音声合成ツール「Voice Vox」をPythonに組み込み、テキストを音声ファイルにする過程を解説する。
準備するもの
Cursor(公式サイトからダウンロード)
Python(公式サイトからインストール)
VOICEVOX(公式サイトからインストール)
インターネット接続(ライブラリのダウンロード用)
ステップ1:環境を整える
1. Cursorをインストール
・Cursor公式サイトからダウンロードしてインストール。
※初期設定は別途記事にする。
2. Pythonをインストール
・Python公式サイトで最新版をダウンロード。
3. VoiceVOXをインストール
・VoiceVOX公式サイトからソフトウェアをダウンロードしてインストール。
ステップ2:コードを書く
コードの中身までは詳細に記載しないが、手順を記載しているので、プロンプトを工夫してCursorのAIチャットを活用すれば、十分作りたいコードを生成してくれる。
※CursorのAIチャットはopenai のモデルがプランによって分かれるため、より多くの回答生成や高速モデルがよければ有料プランも検討すべきだが、最初は無料のgpt 3.5で十分かと。もしくはopen aiのAPIを持っていればそちらで個別に連携するのもありだろう。
ステップ3:アプリを実行する
Cursorでコードを保存して、ターミナルで実行する。
Chainlit上でテキストを送ると回答が音声形式で返ってくる。
認識されたテキストがVoiceVOXを使って音声に変換され、◯◯◯.wavとして保存されます。
ステップ4:保存した音声を再生
◯◯◯.wavをクリックして再生。
WindowsやMacの標準音楽プレーヤーで簡単に確認できます。
応用アイデア
この基本アプリに、下記のような機能も今後はつけてみたい。
音声コマンド機能:「天気教えて」と言ったら天気情報を取得。
多言語対応:英語や他の言語も認識・音声合成できるようにする。
連続会話モード:ユーザーと対話できる簡易AIアプリを構築。
まとめ
CursorとVOICEVOXを使えば、プログラミング初心者でも簡単に音声アプリが作れます!Cursorに頼りすぎない方が良いとよく聞くが、要は使い方だと思うので、基本的な要素もしっかり学びながら効率化できるところはしていく。それが本来の「AI活用」!!と開き直る!!笑
自分と同じ素人の方には入り口としてCursorから入るのが凄くおすすめです。