![見出し画像](https://assets.st-note.com/production/uploads/images/159215259/rectangle_large_type_2_d1e8b3407c4548f5000a92f592706eb5.jpeg?width=1200)
Pythonで音声データ加工(2)pydub、ffmpegのインストール
前回
の中で、
m4aファイルは直接librosaでは扱えないようなので、Convertioのオンラインサービス
https://convertio.co/ja/
を使って変換しました。
とさらっと書いたのですが、やっぱりこれは悔しい気がする。
※外部のサービスを使わずに自分の作成するアプリの中で一連の操作を完結させたい、という気持ちがあります。
Copilotのアドバイス
m4aファイルの処理
![](https://assets.st-note.com/img/1729796969-U7zh6WPxBbeviGJnI2ALK4FV.png?width=1200)
やっぱりpydubが必要なのか?
・・audioconverterというのも示されているけど、それも結局pydubとffmpegの組み合わせのようです。
mp3形式での出力
![](https://assets.st-note.com/img/1729797195-Ke7CjvV6iBUhStycEXN8oRHJ.png?width=1200)
これも結局、pydubが必要なのか?
pydubのメンテに関して
ただ、pydubの懸念は、最近メンテナンスされていないようだ、という点なんですよね。
![](https://assets.st-note.com/img/1729818656-2FTkMDYB3NcW9ZiPAljqbwar.png?width=1200)
pydubはメンテされていないし、依存関係に含めるとやばいよ、python3.13では、audioopが削除されるから・・みたいな?
ではpozalabs-pydubは?・・何故か二つの答えが出てきた。
![](https://assets.st-note.com/img/1729819697-CuW1ryAn3LNxKMzhBIJi8oqH.png?width=1200)
へえ、Snykというサービスで、パッケージがどれくらい普及しているとかわかるんですね。
![](https://assets.st-note.com/img/1729820034-eicnhUztBQ3TklKGS9roZ0Xf.png?width=1200)
![](https://assets.st-note.com/img/1729820124-VuZQ69hIi8dnU5zFrMOCjp43.png?width=1200)
![](https://assets.st-note.com/img/1729820204-1wOBUNbfLy49lAuRazMxhQd5.png?width=1200)
それでも元祖pydubの方が高得点なのは普及率の差からくるのか。
選択
さあどうしたものか。pozalabs-pydubも信用できそうだけど、できるだけ「多数派の側」にいる方が無難だとも思える。問題が発生するのが分かっているのはpython 3.13かららしいから、python 3.12.3を使っている自分としては古くても元のpydubでいいか、などと悩んだ末、念のため
>pip list
をやってみたらリスト中に
>pydub 0.25.1
・・ありゃ、いつのまにか入っていた。
テスト1
つまり、今の当方の環境は、pydub 0.25.1は入っているが、ffmpegは入っていない、という状態。こういう場合にプログラム走らせようとするとどういうエラーが出るのか試してみます。
幸い、前回作った doremi.wavというファイルがあるので、mp3に変更するコードを。
from pydub import AudioSegment
audio = AudioSegment.from_wav("doremi.wav")
audio.export("doremi.mp3", format="mp3")
RuntimeWarning: Couldn't find ffmpeg or avconv - defaulting to ffmpeg, but may not work
warn("Couldn't find ffmpeg or avconv - defaulting to ffmpeg, but may not work", RuntimeWarning)
(以下略)
はい、ffmpegがありませんね。
![](https://assets.st-note.com/img/1729826550-Tcw9AFVoMxynm5hu67tEH0kz.png?width=1200)
赤い字が出ました。やっぱりありません。
![](https://assets.st-note.com/img/1729826618-I6KYB7hOSRPWEp59TqxkZbnw.png?width=1200)
ffmpegインストール
インストーラーを選ぶ
![](https://assets.st-note.com/img/1729826835-yroM1Usd35hFIbugG6fjaPNR.png?width=1200)
![](https://assets.st-note.com/img/1729826859-0NvOunYEG7UjtsLBqVe4fgzH.png?width=1200)
ダウンロードサイト
Windows用は2種類あるようです。
![](https://assets.st-note.com/img/1729834288-wnTplQVP4uMYH6AficNBjLDU.png)
どちらを選ぶ?
![](https://assets.st-note.com/img/1729834463-vHM1VWpkQwGDYUbu2FozBtX3.png?width=1200)
よくわからんけど、
>一般的には、より多くの機能を必要とする場合はgyan.devのFullビルド
・・・とあるので、「それ」にしておきますか。
行ってみると
![](https://assets.st-note.com/img/1729837460-ucXrgwvmD1WxqGTYpyAOVQdL.png?width=1200)
ようやく絞れました。
![](https://assets.st-note.com/img/1729837609-olMqFwWR8QG5j2VgpAdJmsnu.png?width=1200)
ffmpeg-7.1-essentials_build.zip ダウンロードしました。
展開すると
![](https://assets.st-note.com/img/1729838147-BgHiA90U34nYXRtaElKxuV7F.png)
で、binの中身は
![](https://assets.st-note.com/img/1729838303-jnd1NaHr9IlKQ6VX3sCfUxOo.png)
で、これをどうするの?
配置方法
検索したらQiitaに記事がありました。
所定の場所に保存してシステム環境変数のPATHにbinフォルダのパスを追加しました。
VSCodeは要再起動。再起動後、ターミナルで、ffmpeg -version。これでバージョン情報が表示されるようになりました。
テスト2
現状、ffmpegの公式インストーラーによるインストールは終わっていますが、pip install ffmpeg-python によるバインディングライブラリのインストールはしていません。この状態で、先ほどのテスト1と同じコードを実行してみます。
⇒問題なく実行できました。ffmpeg-python をインストールしなくてもpydubのバックエンドとしてffmpegは動作するとわかりました。
そして収穫は
昨日のdoremi.wavが172KBでしたから、ファイルサイズ1/10になっています。
よしよし。