[ChatGPT] まったいらな文字起こしに血が通うTOMLプロンプトの実例3選
こんにちは、キン担ラボの本橋です。
前回の記事では複雑な『意図』を伝えやすいプロンプトとしてTOML形式を紹介しました。
今回はその具体例を紹介します。最近仕事で使ってみた中から3つを選んでみました。TOML形式のサンプルとして紹介していきます。
会議音声の書き起こし要約
講演録音の書き起こし要約
ラジオ収録の書き起こし要約
今回の記事はTOMLのコードブロックとChatGPTの回答の引用ブロックばかりなのでやや退屈かもしれません。
それぞれの書き起こしでしている工夫をポイントとして取り上げていますので、目次から気になったパートに飛んでみてください。
まずは会議議事録の書き起こしから。
[会議録音] の書き起こし要約
kintone Café 徳島 Vol.6が今週土曜日に開催予定です。そのユーザー会のメンバーとのオンラインmtgを録画して、そのまま議事録化してみました。こちらのTOMLを使います。
[replace]セクションと[dictionary]セクションに注目してください。
[information]
title="kintone Café 徳島 vol.6 事前mtg"
date=20240131
参加者=["蒲原", "角南", "本橋"]
language=日本語
[command]
書き起こしを元に構造化した議事録を作成して下さい。
replaceパートのkey値が登場した場合、value値に置換して下さい
dictionaryパートの単語は必要に応じて使用して下さい。
実行が必要なタスクが出現した場合は、TODOとしてまとめて下さい。
出力はmarkdown形式で行って下さい。
[replace]
キントン=kintone
[dictionary]
kintone Café
金剛
フードハブ・プロジェクト
[書き起こし]
後でAI書き起こしとチャットGPTのまとめをしたものを 皆さんに共有しますという形でいこうと思います はい ありがとうございます ありがとうございます 木村さん多分来れないと思うので もうこのメンバーでスタートしたいと思います なんとですね 参加者の申し込みが今すごい人数増えていて 24人とか もちろん我々スタッフも運営メンバーも 加わって
(後略)
ポイント1:認識エラーをChatGPTに修正させる
Whisperの書き起こしでも、人名や商品名など固有名詞は間違えることがよくあります。人間であっても知らない人の名前や地名を正しく聞き取ることなんて不可能ですから、もうそれは仕方のないことです。
せっかく便利なAIが使えるのだから、そういった書き起こし間違いはChatGPTに修正させましょう。表記ゆれの解消にも繋がります。
ChatGPTの出力を端折りつつ貼り付けます。こんなmarkdown形式を出力してくれました。
100%ではないにせよ書き起こしの精度向上が感じられるレベルで修正してくれました。Whisperでざっと書き起こして、ChatGPTにブラッシュアップさせる使い方です。
TODOリストも書き出してくれるのが嬉しいですね。
次のテーマに移りたいと思います。
[講演録音] の書き起こし要約
WEEK神山の神先君がSTUDY WEEKというイベントを企画しています。今回は神山塾を主催する祁答院さんのトーク会がありました。
ポイント2:イベント概要を与える
そもそもがトークイベントですので、トークイベントの告知ページが事前に公開されています。告知をそのまま概要としてTOMLに書いてみました。
[目的]
講演内容の書き起こしを構造化してまとめる
[information]
title="STUDY WEEK"
date=20240131
language=日本語
[command]
replaceパートのkey値が登場した場合、value値に置換して下さい
dictionaryパートの単語は必要に応じて使用して下さい。
実行が必要なタスクが出現した場合は、TODOとしてまとめて下さい。
主な話題について、それぞれ400文字程度でまとめてください。
講演者について教えてください。
[イベント概要]
今回は、新しくはじめる『STUDY WEEK』について。
内容としては、神山で起きている様々なプロジェクトをみんなで学ぶというコンセプトで、今回はそのキーマンに話を聞き、そのあと一緒にご飯を囲むという会です。
目的としては、1つは宿のスタッフ研修として、そして、町内の方向けに。なかなかそういったことを改めて知る機会がないのではないか思いはじめてみます。
そして、それぞれの会をまとめ、神山プロジェクトの年表をつくり、宿の壁に掲示していく計画です。
というわけで、開催のお知らせが直前になってしまいましたが、第一回目は僕が神山に来るきっかけとなった神山塾の塾長,祁答院さんがゲストです。
流れとしては、はじめの30分くらい神山塾の話を聞き、後半一緒に食を囲むようなイメージです。
参加者の対象は基本的に町内の方向けです。視察レクチャーのようなものではありません、予めご了承ください。
[replace]
ウィーク=WEEK神山
おとはし=本橋
[dictionary]
けどういん=祁答院
WEEK神山
[書き起こし]
(書き起こしを貼り付けてください)
イベント概要は以下の告知ページからのコピペです。
出てきた要約がこちら。
ここからさらに「話題1はどんな内容でしたか?」とか「講演者はどんな考えで活動をしていますか?」などの質問を重ねることができます。インタラクティブに情報を聞き出すことができます。
講演者について尋ねてみたところ、このような回答が返ってきました。
概要をまとめてもらった上で、気になったトピックを深掘りする使い方ができました。
ポイント3:インタラクティブ議事録としてのGPTs
これまで議事録と言えば『記録者が要点だと感じた部分をまとめたもの』でした。それに対してAI議事録は『AIによるまとめ』に加えて『詳しく知りたいところを質問できる』というインタラクティブ文書です。
まったいらな会議の書き起こしを与えて、その内容について回答するGPTsが議事録である、という使い方もできそうでした。
議事録のあり方が変わってきますね。
[ラジオ収録] の書き起こし要約
3つ目はラジオ収録の書き起こしです。ポッドキャストの要約としても同じ使い方になると思います。
ベースとしたのはこちらの記事で作成したWhisperによる書き起こしを使いました。
書き起こし全文をgistに置いておきました。
ラジオの本放送もspotifyから聞くことができます。
今回、まずは辞書を作るところから始めてみます。
ポイント4:辞書パートをChatGPTに作らせる
書き起こしをそのまま貼り付けて固有名詞を取り出します。Whisperの認識間違いがあれば、dictionaryかreplaceパートに取り上げていきます。
ピックアップされた単語は以下のとおりです。
『ディスコード』とか『リコード』がどうやらdicordのことのようです。TOMLプロンプトの辞書に登録しておきます。
[目的]
ラジオの収録書き起こしを構造化してまとめる
[information]
title="松坂智美の新しい働き方ラジオ"
date=20240105
language=日本語
[command]
replaceパートのkey値が登場した場合、value値に置換して下さい
dictionaryパートの単語は必要に応じて使用して下さい。
書き起こしの中からトピックを時系列順に取り出してください。
それぞれのトピックについて400文字程度でまとめてください。
[概要]
今回は、リモートワーク時代に半強制的に必要となった、リモート社員のマネジメントについて扱っていきます!
この番組は、多様な働き方が推奨される現代、正解のない新しい働き方について女性の目線で切り込んでいく経済情報番組です。ムツビエージェントが運営する徳島の転職支援サイト「いつか徳島」の提供でお送りしています。
ゲスト:株式会社モノサス 本橋大輔さん
前半・リモートワークの実態と求められるリモートマネジメントスキルついて、後半・リモートワークで働く当事者に働き方や仕事の工夫をお伺いします。
[replace]
ディスコート=discord
リコード=discord
スラック=slack
[dictionary]
いつか徳島
株式会社モノサス
kintone
[書き起こし]
(ここに書き起こしを貼ります)
ChatGPTは次のようにまとめてくれました。まとめ方がいまいち気に入らないときはリテイク(再生成)させてください。
収録をばっちり時系列順にまとめてくれました!
その他の用途
会議の書き起こし、講演の書き起こし、ラジオ収録の書き起こしそれぞれに対してTOMLプロンプトで議事録を作る例を紹介してみました。TOMLプロンプトにはまだまだ工夫のしがいがありそうです。
たとえばWhisperで書き起こしのときにタイムスタンプを入れておくようにすればpodcastのチャプターを自動生成することもできそうです。
今回は紹介していませんでしたが、車の運転中にボイスレコーダーに独り言を話して、あとで書き起こしをChatGPTにまとめてもらうという使い方もよくしています。
独り言の書き起こしでは、同じことを何回喋ろうが、どれだけ話題が行ったり来たりしようが、エーとかアーとかどれだけ間延びさせようが、ChatGPTがまとめてくれた時点でとてもスッキリ構造的に書き上げてくれます。ブログの下書きや考え事のまとめなどに重宝しています。
いずれのケースでも一旦録音を挟むことになります。Bluetoothヘッドセットだったり、ボイスレコーダーだったり、音質はさほど影響しないのでお使いの道具で試してみてください。
おまけ:Whisperによる文字起こしのやり方
Whisperによる書き起こしは、僕は手元のPythonスクリプトで動かしています。ちょっと検索してみたところ、インターネットWatchにこんな記事がありました。
後でこちらも試してみたいと思います。
こういう大人の自由研究は最高に楽しいですね! みなさんもテクノロジーをお楽しみください!
この記事が気に入ったらサポートをしてみませんか?