見出し画像

[ChatGPT] まったいらな文字起こしに血が通うTOMLプロンプトの実例3選

こんにちは、キン担ラボの本橋です。

本橋です

前回の記事では複雑な『意図』を伝えやすいプロンプトとしてTOML形式を紹介しました。

今回はその具体例を紹介します。最近仕事で使ってみた中から3つを選んでみました。TOML形式のサンプルとして紹介していきます。

  • 会議音声の書き起こし要約

  • 講演録音の書き起こし要約

  • ラジオ収録の書き起こし要約

今回の記事はTOMLのコードブロックとChatGPTの回答の引用ブロックばかりなのでやや退屈かもしれません。

それぞれの書き起こしでしている工夫をポイントとして取り上げていますので、目次から気になったパートに飛んでみてください。


まずは会議議事録の書き起こしから。

[会議録音] の書き起こし要約

kintone Café 徳島 Vol.6が今週土曜日に開催予定です。そのユーザー会のメンバーとのオンラインmtgを録画して、そのまま議事録化してみました。こちらのTOMLを使います。

[replace]セクションと[dictionary]セクションに注目してください。

[information]
title="kintone Café 徳島 vol.6 事前mtg"
date=20240131
参加者=["蒲原", "角南", "本橋"]
language=日本語

[command]
書き起こしを元に構造化した議事録を作成して下さい。
replaceパートのkey値が登場した場合、value値に置換して下さい
dictionaryパートの単語は必要に応じて使用して下さい。
実行が必要なタスクが出現した場合は、TODOとしてまとめて下さい。
出力はmarkdown形式で行って下さい。

[replace]
キントン=kintone

[dictionary]
kintone Café
金剛
フードハブ・プロジェクト


[書き起こし]
後でAI書き起こしとチャットGPTのまとめをしたものを 皆さんに共有しますという形でいこうと思います はい ありがとうございます ありがとうございます 木村さん多分来れないと思うので もうこのメンバーでスタートしたいと思います なんとですね 参加者の申し込みが今すごい人数増えていて 24人とか もちろん我々スタッフも運営メンバーも 加わって
(後略)

ポイント1:認識エラーをChatGPTに修正させる

Whisperの書き起こしでも、人名や商品名など固有名詞は間違えることがよくあります。人間であっても知らない人の名前や地名を正しく聞き取ることなんて不可能ですから、もうそれは仕方のないことです。

せっかく便利なAIが使えるのだから、そういった書き起こし間違いはChatGPTに修正させましょう。表記ゆれの解消にも繋がります。

ChatGPTの出力を端折りつつ貼り付けます。こんなmarkdown形式を出力してくれました。


# 議事録: kintone Café 徳島 vol.6 事前mtg

## 基本情報
- **日付**: 2024年1月31日
- **参加者**: 蒲原、角南、本橋
- **言語**: 日本語

## 議題と決定事項
1. **参加者増加について**
- 参加者が現時点で約24人。これにスタッフと運営メンバーが加わる。
- 県外からの参加者もいることを確認。

2. **送迎の手配**
- 渋谷さんと高橋さんの送迎を本橋が担当。
- 徳島空港に10時半に到着し、送迎を行う予定。

(中略)

## TODOリスト
- [ ] 参加者の最終数を確認し、送迎の手配を最終確定する。
- [ ] 懇親会の場所の予約と人数の最終確認。
- [ ] 木村さんへの議事録の共有と次回ミーティングの調整。

---

**注意**: "キントン"は"kintone"に置換されています。

100%ではないにせよ書き起こしの精度向上が感じられるレベルで修正してくれました。Whisperでざっと書き起こして、ChatGPTにブラッシュアップさせる使い方です。

TODOリストも書き出してくれるのが嬉しいですね。

次のテーマに移りたいと思います。

[講演録音] の書き起こし要約

WEEK神山の神先君がSTUDY WEEKというイベントを企画しています。今回は神山塾を主催する祁答院さんのトーク会がありました。

ポイント2:イベント概要を与える

そもそもがトークイベントですので、トークイベントの告知ページが事前に公開されています。告知をそのまま概要としてTOMLに書いてみました。


[目的]
講演内容の書き起こしを構造化してまとめる

[information]
title="STUDY WEEK"
date=20240131
language=日本語

[command]
replaceパートのkey値が登場した場合、value値に置換して下さい
dictionaryパートの単語は必要に応じて使用して下さい。
実行が必要なタスクが出現した場合は、TODOとしてまとめて下さい。
主な話題について、それぞれ400文字程度でまとめてください。
講演者について教えてください。

[イベント概要]
今回は、新しくはじめる『STUDY WEEK』について。
内容としては、神山で起きている様々なプロジェクトをみんなで学ぶというコンセプトで、今回はそのキーマンに話を聞き、そのあと一緒にご飯を囲むという会です。
目的としては、1つは宿のスタッフ研修として、そして、町内の方向けに。なかなかそういったことを改めて知る機会がないのではないか思いはじめてみます。
そして、それぞれの会をまとめ、神山プロジェクトの年表をつくり、宿の壁に掲示していく計画です。
というわけで、開催のお知らせが直前になってしまいましたが、第一回目は僕が神山に来るきっかけとなった神山塾の塾長,祁答院さんがゲストです。
流れとしては、はじめの30分くらい神山塾の話を聞き、後半一緒に食を囲むようなイメージです。
参加者の対象は基本的に町内の方向けです。視察レクチャーのようなものではありません、予めご了承ください。

[replace]
ウィーク=WEEK神山
おとはし=本橋

[dictionary]
けどういん=祁答院
WEEK神山


[書き起こし]
(書き起こしを貼り付けてください)

イベント概要は以下の告知ページからのコピペです。

出てきた要約がこちら。

# STUDY WEEKの講演内容要約

## イベント概要
- **タイトル**: STUDY WEEK
- **日付**: 2024年1月31日
- **言語**: 日本語
- **目的**: 宿のスタッフ研修と地元住民向けの啓蒙
- **内容**: 神山プロジェクトのキーマンに話を聞き、食事を共にする
- **目指す成果**: 神山プロジェクトの年表作成と掲示

## 講演者
- **祁答院**: 神山塾の塾長
- **WEEK神山**: イベント名

## 主な話題
1. **神山塾の紹介**: 神山塾の活動や目的についての詳細な説明。
2. **地域活動**: 徳島での過去のイベントオーガナイズ経験から、神山での地域活動への関与。
3. **神山の変遷**: 神山におけるアート活動、地域活性化の歴史と現在の状況。
4. **神山塾の教育方針**: 学生と地域の連携、自立支援、実践的な学びに重点を置いた教育。
5. **自己成長と地域貢献**: 神山塾を通じての個人の成長と地域への影響。
6. **未来への展望**: 神山塾の将来の目標とビジョン。

## TODO
- **神山プロジェクトの年表作成**: 講演内容を基にして年表を作成し、宿の壁に掲示する。

---

以上が講演の要約となります。さらなる詳細や特定のポイントについて情報が必要な場合は、お知らせください。

ChatGPTのレスポンス

ここからさらに「話題1はどんな内容でしたか?」とか「講演者はどんな考えで活動をしていますか?」などの質問を重ねることができます。インタラクティブに情報を聞き出すことができます。

講演者について尋ねてみたところ、このような回答が返ってきました。

## 講演者に関する要約

### 講演者: 祁答院
祁答院さんは神山塾の塾長として、この講演で中心的な役割を果たしました。彼は、徳島での過去のイベントオーガナイズの経験から、神山地域の地域活動への関与を始めたことを話しました。この経験を通して、彼は地域コミュニティと若者を結びつけ、地域の活性化と文化保存に貢献しました。

彼はまた、神山塾の教育方針を詳細に説明し、学生が実践的な学びを通じて自立し、地域社会に貢献する方法を提供することに重点を置いていることを強調しました。神山塾では、学生たちは地域の課題に直面し、解決策を模索することで、現実世界での重要な経験を積むことができます。
(後略)

祁答院さんはどんな考えで活動していますか?という質問への回答

概要をまとめてもらった上で、気になったトピックを深掘りする使い方ができました。

ポイント3:インタラクティブ議事録としてのGPTs

これまで議事録と言えば『記録者が要点だと感じた部分をまとめたもの』でした。それに対してAI議事録は『AIによるまとめ』に加えて『詳しく知りたいところを質問できる』というインタラクティブ文書です。

まったいらな会議の書き起こしを与えて、その内容について回答するGPTsが議事録である、という使い方もできそうでした。

手塚治虫『火の鳥 ヤマト編』より

議事録のあり方が変わってきますね。

[ラジオ収録] の書き起こし要約

3つ目はラジオ収録の書き起こしです。ポッドキャストの要約としても同じ使い方になると思います。

ベースとしたのはこちらの記事で作成したWhisperによる書き起こしを使いました。

書き起こし全文をgistに置いておきました。

ラジオの本放送もspotifyから聞くことができます。

今回、まずは辞書を作るところから始めてみます。

ポイント4:辞書パートをChatGPTに作らせる

書き起こしをそのまま貼り付けて固有名詞を取り出します。Whisperの認識間違いがあれば、dictionaryかreplaceパートに取り上げていきます。

ラジオの書き起こしを以下に貼ります。このなかから固有名詞と思われる単語をピックアップしてください。書き起こし間違いがあれば修正するために使用します。

辞書作成プロンプト

ピックアップされた単語は以下のとおりです。

『ディスコード』とか『リコード』がどうやらdicordのことのようです。TOMLプロンプトの辞書に登録しておきます。

[目的]
ラジオの収録書き起こしを構造化してまとめる

[information]
title="松坂智美の新しい働き方ラジオ"
date=20240105
language=日本語

[command]
replaceパートのkey値が登場した場合、value値に置換して下さい
dictionaryパートの単語は必要に応じて使用して下さい。
書き起こしの中からトピックを時系列順に取り出してください。
それぞれのトピックについて400文字程度でまとめてください。

[概要]
今回は、リモートワーク時代に半強制的に必要となった、リモート社員のマネジメントについて扱っていきます!
この番組は、多様な働き方が推奨される現代、正解のない新しい働き方について女性の目線で切り込んでいく経済情報番組です。ムツビエージェントが運営する徳島の転職支援サイト「いつか徳島」の提供でお送りしています。
ゲスト:株式会社モノサス 本橋大輔さん
前半・リモートワークの実態と求められるリモートマネジメントスキルついて、後半・リモートワークで働く当事者に働き方や仕事の工夫をお伺いします。

[replace]
ディスコート=discord
リコード=discord
スラック=slack

[dictionary]
いつか徳島
株式会社モノサス
kintone

[書き起こし]
(ここに書き起こしを貼ります)

ChatGPTは次のようにまとめてくれました。まとめ方がいまいち気に入らないときはリテイク(再生成)させてください。

## 松坂智美の新しい働き方ラジオ概要

### 番組タイトル
松坂智美の新しい働き方ラジオ

### 収録日
2023年12月20日

### 言語
日本語

### 概要
この番組は、リモートワーク時代に求められるリモート社員のマネジメントに焦点を当てています。現代の多様な働き方を女性の視点から掘り下げる経済情報番組で、徳島の転職支援サイト「いつか徳島」の提供で放送されています。ゲストは株式会社モノサスの本橋大輔さんで、リモートワークの実態やマネジメントスキル、さらにはリモートワークにおける働き方や仕事の工夫について討論されます。

---

## トピックごとの要約

### トピック1: リモートワークと機材の活用
本橋さんは、リモートワークにおいて機材の重要性を強調しました。特にUSBマイクの使用を推奨し、内蔵マイクやスピーカーではなく、外付けのマイクを利用することで、コミュニケーションの質を向上させることができると述べています。また、ノートパソコンのみでZoomを使用することの限界についても触れ、外付けカメラやマイクの使用を提案しています。

### トピック2: リモートワークにおけるコミュニケーション
リモートワーク環境におけるコミュニケーションの重要性に焦点を当て、情報共有、コミュニケーションのツール活用(slack、discordなど)、共感の育成の3つの要素が重要であると指摘しています。本橋さんは、共感を育てるためには、デジタルツールを活用しつつも、時折リアルで顔を合わせることが重要だと説明しました。

### トピック3: リモートワークに適した人物像
本橋さんはリモートワークに適した人物像について言及し、自己管理能力の高い人がリモートワークに向いていると述べています。また、リモートワークの一般的な弊害として仕事のしすぎを挙げ、仕事と私生活のバランスを保つことの重要性を強調しています。

### トピック4: リモートワークの将来的な働き方
最後に、本橋さんはリモートワークの将来的な働き方について触れました。リアルとデジタルの両方のコミュニケーションを重視し、リモートワークのメリットを生かしつつ、仕事の生産性を最大化することを目指すと述べています。

ラジオコンテンツの概要

収録をばっちり時系列順にまとめてくれました!

その他の用途

会議の書き起こし、講演の書き起こし、ラジオ収録の書き起こしそれぞれに対してTOMLプロンプトで議事録を作る例を紹介してみました。TOMLプロンプトにはまだまだ工夫のしがいがありそうです。

たとえばWhisperで書き起こしのときにタイムスタンプを入れておくようにすればpodcastのチャプターを自動生成することもできそうです。

今回は紹介していませんでしたが、車の運転中にボイスレコーダーに独り言を話して、あとで書き起こしをChatGPTにまとめてもらうという使い方もよくしています。

独り言の書き起こしでは、同じことを何回喋ろうが、どれだけ話題が行ったり来たりしようが、エーとかアーとかどれだけ間延びさせようが、ChatGPTがまとめてくれた時点でとてもスッキリ構造的に書き上げてくれます。ブログの下書きや考え事のまとめなどに重宝しています。

いずれのケースでも一旦録音を挟むことになります。Bluetoothヘッドセットだったり、ボイスレコーダーだったり、音質はさほど影響しないのでお使いの道具で試してみてください。

おまけ:Whisperによる文字起こしのやり方

Whisperによる書き起こしは、僕は手元のPythonスクリプトで動かしています。ちょっと検索してみたところ、インターネットWatchにこんな記事がありました。

後でこちらも試してみたいと思います。

こういう大人の自由研究は最高に楽しいですね! みなさんもテクノロジーをお楽しみください!

この記事が気に入ったらサポートをしてみませんか?