音声認識4

3hほど作業.

zoom経由で音声入力 -> 音声ファイル書き出し -> 音声ファイル読み出し -> google speetch to textで認識

の4ステップがgolangで実装できた.

Result: alternatives:{transcript:"テスト"  confidence:0.8677456}  is_final:true  result_end_time:{seconds:4  nanos:60000000}
Result: alternatives:{transcript:"音声認識テストです"  confidence:0.95545924}  is_final:true  result_end_time:{seconds:11  nanos:920000000}
Result: alternatives:{transcript:"今日の議題"  confidence:0.9521157}  is_final:true  result_end_time:{seconds:17  nanos:130000000}
Result: alternatives:{transcript:"今日の天気は晴れほぼ満月"  confidence:0.9332442}  is_final:true  result_end_time:{seconds:27  nanos:410000000}

実際にやってみたログ..

間をおいて認識しやすくしゃべると認識してくれるが、複数人だったり、間が適当でないとうまくいかない

内部的にいい感じに間を省く処理が必要そう

この記事が気に入ったらサポートをしてみませんか?