【ffmpeg】Windowsで会議を動画でキャプチャしてGoogle AI Studioで文字起こし

ffmepg を日常生活でコマンドプロンプトから普段使いしているエンジニアです。

過去には、動画ブログや動画投稿サービスなどつくったりしていました。

また以前はブログでImagemagicなどのコンテンツを書いたりしていましたが、最近の画像加工はpythonでなんでもできるので需要はなくなってきたのかなーと思います。ちなみにffmpeg-python とかあるようですが使ったことがないので、今回はここでの説明は省きます。

ffmpegはバイナリ版のffmpeg.exeがあればダウンロードしてインストールしなくても、コマンドプロンプトから、setx でffmpegの保存先のPATHを指定しておけば再起動してもコマンドが使用できます。

今回は「Windowsキー」+「g」で画面録画したmp4ファイルから音声だけを抽出して、Google AI Studio で文字起こしをする簡単な手順を解説します。

会議の議事録や議事メモつくるの面倒だ。。。

スマホやデバイスで会議録音したり、CLOVA Note駆使したり、ChatGPTやclaude等の生成AIに課金したり、手間かけて議事録つくるのめんどーすぎるというに人にぴったりです。

以下よりffmpegのWindows版のバイナリをダウンロードします。
https://ffmpeg.org/download.html
zipファイルを解凍するとffmpeg.exeファイルをPCの保存可能な場所に移します。

例) 
「Windowsキー」+「r」を押して、ファイル名を指定して実行で、「cmd」と入力して「enterキー」でコマンドプロンプトを開きます。

mkdir C:¥ffmpeg
move  "ダウンロードして解凍したffmpeg.exeファイルのPATH"  C:¥ffmpeg
setx PATH "%PATH%;C:¥ffmpeg"

念のため確認する場合、コマンドプロンプトをいったん閉じてから、再度コマンドプロンプトをcmdで開きます。

set コマンドを実行します。

ユーザーの環境変数「Path」の中の最後に「C:¥ffmpeg」が追加されていることを確認してください。

これでffmpeg コマンドが使えるようになります。

あとは、「Windowsキー」+「g」で保存されたキャプチャは

.¥Videos¥Capture

に保存されています。

ffmpeg -i 'ファイル名.mp4' -ab 128k 'ファイル名.mp3'
を実行します。

-i で音声を抽出するMP4動画ファイルを指定して、-ab にて音声ファイルの音質であるビットレートを指定します。ここでは128kの値を指定します。会議などの音声であれば十分な値です。
その後に新規作成するmp3形式で出力するファイル名を指定します。

音声ファイルの文字起こしは、Google AI Studio を使用します。https://ai.google.dev のGoogle AI Studioの公式サイトに個人用のgoogleアカウントでdeveloperとしてログインします。
(Googleの法人アカウントはGemini)

Google AI Studioのページから、Create Promptから新規にプロンプトを実行する際に「+」ボタンを押してffmpegで変換したmp3の音声ファイルをローカルファイルから指定して、アップロードします。
mp3に変換されているので、ファイルサイズは動画ファイルと比較すると40分の1程度のサイズに小さくなっています。

プロンプトは以下を参考にしてください。

以下の音声ファイルより議事メモを作成してください。要約、時系列に詳細な内容、まとめ、アクションアイテムを担当者や期限が明確になるように作成して下さい。

以上!

「ためになった」と思ったら、以下の有料部分からチップをお願いします。
お礼のメッセージが表示されます。

ここから先は

12字

¥ 100

よろしければサポートお願いいたします。いただいたサポートはクリエイターの活動費にさせていただきます!!