【決定版】長文の音声文字起こし口語文を、AIに全く省略させずに、全文をきちんとした文章体にするためのプロンプト

2024年10月29日 14:43

はじめに

以前、音声や動画から文字お越しするためのAIツールとして、Google AI StudioのGemini 1.5 Proをお勧めしました。

その中で、実際の話された内容を損なわずに、文字起こしするプロンプト（＝トランスクリプト作成プロンプト）をお伝えしましたが、そのままでは、「えー」とか「あの」とかが残っており、とても読めたものではありません。
ましてや記録として残すべきものでもありません。

そこで、トランスクリプトを整形して文章化する作業が必要となります。
そこで前回も、文章として読めるようにするためのプロンプトについて、ごく簡単なものをご紹介しました。
以下のようなものです。

以下は{プロンプトエンジニアリング入門}というセミナー音声の文字起こし文です。内容を一切省略せずに、口語体から文章体にしてください。

しかし、生成AIあるあるですが、長文の文字起こし文を、そのまま文章体の文にすると、内容を勝手に要約したり、勝手に省略したり、全く思い通りに仕上がらないことが多々あります。

前回ご紹介したプロンプトは、その意味でまだ不安定でした。

長文整形プロンプト

今回、色々試行錯誤しまして、現時点で自信を持ってお勧めできる、長文の文字起こしデータを文章化することに耐えられるプロンプトをご紹介します。
以下の通りです。

以下のトランスクリプト（文字起こし文）を、出来るだけ原文の意味を変えずに、自然で読みやすい日本語の文章体に変換してください。
箇条書きや箇条書き風の表現は避け、段落を使って文章を構成してください。
話し言葉の特徴（例：「ええと」「あの」「えー」など）は適宜修正し、よりフォーマルな表現に置き換えてください。
ただし、話し言葉によって強調されているニュアンスは保持するようにしてください。
専門用語はそのまま使用してください。
また、文脈が明確になるように、適宜接続詞や指示語を追加してください。
変換後のテキストは、元のトランスクリプトの内容をすべて網羅している必要があります。
一度に出力できない場合は、複数回に分割して出力してください。
入力した一連の文の文章体への変換が全て終了した場合は、「終了」と出力してください。:
(ここに文字起こし文をそのまま貼り付け)

テスト

整形前の文章

音声をそのまま文字起こしした以下のトランスクリプトをこのプロンプトを使用して文章化してみましょう。

えーっと、それじゃあ、あの、まずは、えーと、進捗、ですね、はい、進捗状況から、えー、報告したいと思います。えー、まあ、そのー、なんですか、先週、えーっと、リリース予定だった、えー、あのバグ修正ですね、それが、うーん、完了しました。えーと、まぁ、ただ、あの、えっと、いくつか、まだ、残ってる、あの、バグがですね、あの、発見されてまして、えー、それを、今、対応中です。えーっと、んー、まぁ、今週中には、えっと、解決できるかなぁ、っていう感じですかね、はい。

えー、それから、あの、新機能の、うーん、なんでしたっけ、あ、えーっと、音声認識機能、ですね、えー、それも、あの、テストが、えー、進んでるところなんですけど、まぁ、まだ、精度がね、えー、ちょっと問題が、うーん、残ってるっていう感じで、あの、なんとか、その辺を、えー、改善する必要があるかな、と。えー、あの、今週、えー、エンジニアチームがですね、えー、精度の調整に、えーっと、入ってるので、まぁ、そこで、なんとか、うまくいくことを、えー、期待してるんですが、うーん、まぁ、どうなるかは、えーっと、まだ、わからないところですね、えー、正直。

あと、あー、なんだっけ、えーっと、デザインの、あの、UIデザインの、えー、最終チェックですね、それが、まぁ、だいたい、うーん、完了してるんですけど、えー、いくつか、細かいところで、あの、フィードバックが、えー、出てきまして、えー、それを、まぁ、今、修正してる、という、ところです。あのー、まぁ、これも、えー、なんとか、えーっと、来週までには、えー、完全に、えー、修正が、終わる予定です。

えーっと、ちょっと、雑音が多くて、すみません、えーっと、なんだっけ、あ、そうそう、あと、その、えー、新商品の、あの、マーケティングの、うーん、なんだっけ、あ、えっと、キャンペーンの、えー、準備が、えー、進んでまして、えー、まぁ、その辺は、あの、順調に、えーっと、進んでる感じですかね、はい。えー、まぁ、詳細な、えー、ターゲット層の、えー、分析とか、えー、あの、広告素材の、えーっと、作成とかが、まぁ、だいたい、あの、予定通りに、えー、進んでいるので、えー、問題ないかと、えー、思います。

えーっと、んー、まぁ、こんな感じで、えーっと、プロジェクト全体としては、まぁ、あのー、大きな遅れは、えー、今のところ、ないかな、というところですね。えー、ただ、まぁ、えー、さっき言ったように、えー、音声認識機能の、えー、精度の問題が、うーん、ちょっと心配なところでは、えー、ありますが、えー、これも、あのー、なんとか、えー、解決するように、えー、進めていきたい、と思います。

えー、じゃあ、えーっと、次に、あの、えっと、なんだっけ、あ、そうそう、あの、予算の話ですね、えー、これも、あのー、まぁ、ほぼ、あの、問題なく、えー、進んでるんですが、えー、ちょっと、あの、外注の、えーっと、コストが、うーん、少し、えー、予想より、えー、高くなってまして、えー、その調整を、今、しているところです。えー、まぁ、これについても、あの、今週中には、えー、解決する見込みです。

えーっと、まぁ、以上ですかね、えー、進捗については、えーっと、こんなところです、はい。えー、質問が、あれば、えー、どうぞ、という感じで。あの、うん、まぁ、いいですかね、えー、じゃあ、えっと、終わりに、えーっと、しますね、えー、ありがとうございました。あー、いや、えーっと、もうちょっと、えー、なんか、えっと、確認が、あの、あ、すみません、えー、まぁ、大丈夫です、はい、じゃあ、終わりに、します。すみません、はい。

整形後の文章

今回は、短い文章なので、ChatGPT-4oにこのプロンプトを使用して実行させてみます。すると、以下の結果になります。

まず、進捗状況についてご報告いたします。先週リリース予定だったバグ修正は完了いたしました。ただ、いくつか新たに発見されたバグがあり、現在その対応を進めている状況です。今週中には解決の見通しです。

次に、新機能である音声認識機能についてですが、テストが進行中です。しかし、まだ精度に問題が残っているため、改善が必要と考えています。エンジニアチームが今週中に精度調整に取り組む予定で、その成果を期待しているものの、現時点では完全な解決は見通せていない状況です。

また、UIデザインの最終チェックもほぼ完了しており、一部細かいフィードバックを受けて修正作業を行っています。こちらも来週までには完全に修正が完了する予定です。

続いて、新商品のマーケティングキャンペーンの準備についてですが、順調に進んでおります。ターゲット層の詳細な分析や広告素材の作成も予定通り進んでおり、大きな問題は発生していません。

総じて、プロジェクト全体の進行に大きな遅れはなく、順調に進んでいます。ただし、音声認識機能の精度問題は引き続き懸念点であり、今後も解決に向けて取り組んでいく予定です。

次に予算についてですが、こちらもおおむね問題なく進んでおります。ただ、外注コストが当初の予算よりも若干高くなっており、その調整を現在行っています。こちらも今週中に調整完了の見込みです。

以上が進捗の概要です。何かご質問があればどうぞ。また、特に追加の確認事項がないようでしたら、以上で報告を終了させていただきます。ありがとうございました。

まとめ

文章を整形するだけで、なぜか、仕事ができる集団のディスカッションのように見えますね。

現時点での決定版として提供いたしますので、音声文字起こし文の整形でお困りの方はどんどんこのプロンプトを活用していただければと思います。

さらに

この記事のプロンプトを内蔵したGPTsを開発し、公開しました。以下に説明と使用方法を書きました。

このGPTに、文字起こししたテキストを貼り付けるだけで使えます。プロンプトを書く必要さえありません。ノープロンプトで行けます。

【重版出来】AIアプリをプログラミング不要で開発する書籍

ChatGPTでAIアプリを作って仕事で使いたい方と、それを世界に公開したい方へ！