見出し画像

音声まで編集できてしまうんかい。

画像ファイルやドキュメントファイルだけじゃなく、音声ファイルまで編集できてしまうChatGPTさん恐るべし。もう動画編集もできてしまうのかもしれない(出来たらやってみたいけど、たぶんタイムアウトする気がする。)

音声についてはなかなか編集する機会はないと思うし、本内にある音声ファイルの時間確認や、波形を確認することはほぼほぼ使うことは無いと思うが、動画編集ソフトを持っていない場合は、GPTでサクッと編集できてしまうのは良いかもしれない。

本書内で音声ファイルの扱いについて一番実用性があるのは、
この音声ファイル内の無音部分のみをカットするプロンプト。
Youtubeは動画と連動させる必要があるので難しいが、ライターさんが長くなってしまった録音を縮める等の用途はあるのかもしれない。

音声ファイルの無音部分を以下の要件に従ってカットしてください。

要件"""
・pydubのdetect_nonsilent関数を使用する 
・無音の最小期間は100msとする 
・無音のスレッショドルは-40dBとする
"""

ここでいう
・Pydubとは、
Pythonで音声ファイルを簡単に扱うことができるライブラリです。音声ファイルの読み込み、編集(カット、結合、フェードイン・フェードアウトなど)、エクスポートなど、様々な操作をサポートする。
・無音部分の指定はmsは、
時間の単位の一つです。1msは1秒の1000分の1を意味するため、100msは0.1秒に相当する。
・スレッショルドは、
無音と判断される音の大きさ(音量レベル)の基準を意味する。
デシベル(dB)で表され、この値以下の音量を無音とみなして処理を行う。

それ以外にも
ピッチシフト・タイムストレッチ
音声の音の高さや、高さを変えずに速度を変えることも可能。

音声ファイルを上に3度ピッチシフトしてください。
音声ファイルを2倍の長さにタイムストレッチしてください。

などを利用して、全体に対する編集もできるし時間を指定すれば部分的に調整することが出来る気がする。

ただ結局編集したのをダウンロードして聞き直して、違ったら確認してといった作業になるので、そう考えるとやはり動画編集ソフトを使ったり、無料の音声編集ソフトをダウンロードした方がまだまだ手っ取り早い気がする…。


よろしければサポートお願いします。 投げ銭で頂いたものはコーヒーやラムネなど創作のお供に返させていただきます。