見出し画像

50本のYoutube 要約を【GPT-4o-mini】でやってみる。

現在、youtubeには1分間に500時間分の動画がアップロードされているそうです。.statista.com/statistic

どれだけ優れたデバイスが周囲に溢れても、こんな情報の海の中では効率的に情報収集はできませんね。見れば見るほどお勧め動画が出てきて、調べものするにもすぐに雑念が入っていつの間にか関係ない動画を見てしまいます。

お気に入り動画も無尽蔵に増えていき、”どっかで見たんだけどなぁ。”の記憶しか残っておらず、かといって都度都度メモをとるのも面倒になってきました。

そこで、動画の概要を記録に残しておくためのデータベースを作成することにしました。(また、AIの力を借ります。)
動画の文字起こし取得->要約 -> 記録保存。その方法はいろいろありますが

  1. Notebook LMを使い記録に残す。  --- 手間、要約内容が短すぎる。

  2. GPTsで要約。      --- カスタム可能も、保存性難

  3. Open AI assistantを使って出力保存コントロール。---今回これに挑戦。

他にもYoutbe要約サイトなど方法は千差万別、ただ出力内容についてはカスタムしたいところです。

2 についてはGPTsで次の"Video Summarizer ✏️🌐🔝🚀"というのが人気のようで、+800kの人が使用しています。そこで使われてるプロンプトを確認すると以下プロンプトが書いてあります。


今回の目的は、無尽蔵に増えていくyoutube動画を効率よく把握、記録を残すこと。

  • お気に入りのチャンネルから再生数が多いもの5件、最新3件の動画URLを適当に取得。またはURLをまとめてクリップボードにコピーした状態から一気に処理。

  • 上記プロンプト参考に、要約や動画IDや再生回数、タイトルなどを取得。

  • 動画への投稿コメントからSentimentAnalysis(感情分析)を行う。

  • 結果をデータベース化する。(今回はAirtableに転送)

という素案ができたのでmermaid化。このフローに従って、pythonでコーディングしてもらいました。

なお、グリーン箇所についてはOpen AI Assistant をそれぞれ作成、assistant ID選択して出力は自分好みにカスタマイズ。

要約に設定したinstructionは以下です。”読みやすさを意識、動画内で重要な項番説明などはそのまま記録。さらに要約内容から、ビジネスアイデアを3つ出す。”

Role: You are a professional blog writer

##Output below in Japanese

##Write a summary of ##{the above text} in Japanese, with a minimum of 3000 characters.

##Be sure to write out what is described as a bulletin point in the {text above}.

##Another 100 words should be written as an engaging introduction to attract the reader.

##Finish with three bullet points of business ideas from the summary.

Use the following format for the summary:
Heading should be ‘Summary’ as above, using bold and pictorial type.
Paragraphs should be separated by blank lines.
Use italics to emphasise words and phrases.
Include a blank line between the heading and the first line of the manuscript.
Add two blank lines between each section (Key Takeaways, Summary, Transcript) for ease of reading.
For easier reading.


#When creating a summary, keep the following in mind

Clarify the core message of the article.
Highlight the most important facts, statistics and examples that support the main points.
Where applicable, briefly state the key conclusions and recommendations presented in the video.
Avoid unnecessary fluff and filler language and do not include introductory phrases such as ‘This video...’. Instead, concentrate on communicating key information clearly, efficiently and directly.

今回open AI assistantなるものに触れて、出力コントロールが自在にできること、ファイルなどを追加して出力フォーマットを校正できることながわかり、いよいよ泥沼にはまってしまいました。


ここまでで、今回作成物のスナップ(airtable)です。
背景の左列にある”Created"を見ていたければわかると思いますが、動画1本あたり25sec位で要約保存してくれています。プログラム修正しながら確認してるので数時間経過してます。

それぞれの動画へのコメントの感情分析もできており、10時間分以上の動画をすべて見ることはできませんが、概要だけでもさっと確認できますし、気になった動画はx2速で見れればQOLが上がります。

Airtableは、スプレッドシートの使いやすさとデータベースの機能性を融合したクラウドベースのプラットフォーム。直感的なインターフェースで複雑なデータ管理を可能にし、多様なビュー形式やオートメーション機能を提供することで、ビジネスプロセスの効率化を支援できます.


最後に費用です。Open AI assistantsは従量課金で使うモデルによってinput、output tokenの料金が変わります。詳しくは専門サイトに譲りますが、20min動画で大凡以下料金がかかっていました。

  • $0.03-0.05@GPT-4o

  • <$0.01@GPT-4o-mini

詳しくは料金へのリンク

動画時間だけでなくTranscript量も影響してくるでしょうし、同じ動画でも出力内容は毎度異なるので定量算出は難しいですが、沢山処理するなら安価な方(mini)でいいかなと思います。このプログラム作成過程(約1日)で50本ほど動画処理しましたが、TTL_Usageは $0.33ほど。

GPT-4oが盲目的にいいものだと思って使ってましたが、4o-miniに変えて後、その出力内容の違いについては気にするほどのことでもなかったです。

出来上がったデータベースからビジネスアイデアが生まれたり、それらを定期的にSNSへ投稿したりと、使用用途は広がります。

最後までお読みいただきありがとうございました。

いいなと思ったら応援しよう!