音声認識したい

水平思考パズルを考える力量が足りない...

全然関係ないプロダクトで音声認識してテキストリアルタイム書き起こしアプリをつくりたくなったので、そっちを今週はやってみることにした.

gcloud ml speech recognize test1.wav --language-code=ja-JP

上記みたいな感じで、とりあえずlocalのファイル認識ができた。

ちょっとハマって、1ch & 16000 sampling rateじゃないとうまくいかないっぽい...

macのマイクからstdinにredirectして持ってきたいけど、どうやるんやで今ハマってる

この記事が気に入ったらサポートをしてみませんか?