【Text to Podcast】 原稿生成の改善
この記事は【Text to Podcast】の開発ブログです。
Text to Speech で読ませる原稿の生成ロジックを改善しました。
変更点
従来は Zapier の OpenAI Zap で、 GPT-3.5-turbo-instruct を使って原稿を生成していました。
今回のアップデートで Google Cloud Functions を利用して ChatGPT の API を使って原稿を生成するように改修しました。Zapier から web hook を利用して Cloud Fuctions を呼び出して、原稿を生成するようにしています。
この変更により、モデルも gpt-3.5-turbo-0125 に変えました。
また、従来は原稿が長文になると続きを生成できずに途中で終わってしまう問題がありましたが、 今回の変更で、全ての文章が生成されるまでOpenAI の API をコールするようにして、原稿が途中で終わる問題を改善しました。
Model の変更に伴ったプロンプトの改善
元々使っていた GPT-3.5-turbo-instruct は、記事を渡すと程よく原稿っぽい文章を作成してくれていましたが、新しい Model はかなり記事を要約してしまう傾向にありました。
記事内容を要約するのは、ざっくりと内容を理解するのには良いですが、 音声ニュースとして情報収集する場合には、なるべく情報を落とさずに聞きたいためイマイチです。これを改善するために、プロンプトをかなり試行錯誤しました。
ただの機械翻訳や記事を読み上げるだけではなく、音声で聞いた時にわかりやすい文章でありつつ、なるべく情報は落とさせないというのが、なかなか難しかったです。
とりあえずは満足いく原稿が生成できるようになりましたが、まだ100点だとは思っていないので日々改善していこうと思っています。
おわりに
コツコツとアップデートをしていくので、Note の「記事をサポート」からご支援いただけると幸いです。