音声認識4
3hほど作業.
zoom経由で音声入力 -> 音声ファイル書き出し -> 音声ファイル読み出し -> google speetch to textで認識
の4ステップがgolangで実装できた.
Result: alternatives:{transcript:"テスト" confidence:0.8677456} is_final:true result_end_time:{seconds:4 nanos:60000000}
Result: alternatives:{transcript:"音声認識テストです" confidence:0.95545924} is_final:true result_end_time:{seconds:11 nanos:920000000}
Result: alternatives:{transcript:"今日の議題" confidence:0.9521157} is_final:true result_end_time:{seconds:17 nanos:130000000}
Result: alternatives:{transcript:"今日の天気は晴れほぼ満月" confidence:0.9332442} is_final:true result_end_time:{seconds:27 nanos:410000000}
実際にやってみたログ..
間をおいて認識しやすくしゃべると認識してくれるが、複数人だったり、間が適当でないとうまくいかない
内部的にいい感じに間を省く処理が必要そう
この記事が気に入ったらサポートをしてみませんか?