はじめに
以前、音声や動画から文字お越しするためのAIツールとして、Google AI StudioのGemini 1.5 Proをお勧めしました。
その中で、実際の話された内容を損なわずに、文字起こしするプロンプト(=トランスクリプト作成プロンプト)をお伝えしましたが、そのままでは、「えー」とか「あの」とかが残っており、とても読めたものではありません。
ましてや記録として残すべきものでもありません。
そこで、トランスクリプトを整形して文章化する作業が必要となります。
そこで前回も、文章として読めるようにするためのプロンプトについて、ごく簡単なものをご紹介しました。
以下のようなものです。
しかし、生成AIあるあるですが、長文の文字起こし文を、そのまま文章体の文にすると、内容を勝手に要約したり、勝手に省略したり、全く思い通りに仕上がらないことが多々あります。
前回ご紹介したプロンプトは、その意味でまだ不安定でした。
長文整形プロンプト
今回、色々試行錯誤しまして、現時点で自信を持ってお勧めできる、長文の文字起こしデータを文章化することに耐えられるプロンプトをご紹介します。
以下の通りです。
テスト
整形前の文章
音声をそのまま文字起こしした以下のトランスクリプトをこのプロンプトを使用して文章化してみましょう。
整形後の文章
今回は、短い文章なので、ChatGPT-4oにこのプロンプトを使用して実行させてみます。すると、以下の結果になります。
まとめ
文章を整形するだけで、なぜか、仕事ができる集団のディスカッションのように見えますね。
現時点での決定版として提供いたしますので、音声文字起こし文の整形でお困りの方はどんどんこのプロンプトを活用していただければと思います。
さらに
この記事のプロンプトを内蔵したGPTsを開発し、公開しました。以下に説明と使用方法を書きました。
このGPTに、文字起こししたテキストを貼り付けるだけで使えます。プロンプトを書く必要さえありません。ノープロンプトで行けます。
【重版出来】AIアプリをプログラミング不要で開発する書籍
ChatGPTでAIアプリを作って仕事で使いたい方と、それを世界に公開したい方へ!