マガジンのカバー画像

【TOPIC】 AI×スピーキングテスト

7
(ジャンル)AI/音声認識技術(概要)スピーキングテスト・PROGOS®の説明/音声認識技術の進歩/Transformerのポイント/AI活用と技術開発
運営しているクリエイター

#音声認識技術

なぜ音声認識技術の精度が上がったのか?|#3|AI×Speaking Test

《今回のポイント》音声認識技術と機械学習の歴史2017年に、“Attention is All You Need”という論文が発表されました。その中で提案されたのが「Transformer」という機械学習モデルです。従来のモデルの利点を組み合わせて《いいとこどり》したことで、推論速度と深層学習の精度が上がり、転移学習もしやすいという土壌が整いました。 元々は文字データを扱うモデルでしたが、これらの特性により、画像認識や音声認識の分野でも使われ始め、過去の音声認識技術と比較して

音声認識技術をめぐる外部要因 |#4|AI×Speaking Test

《今回のポイント》技術の精度以外にも大事なポイントTransformer、Conformerによって、自然言語処理・音声認識技術の精度は飛躍的に高くなりました。そして、音声認識技術を活用したスピーキングテストなどのプロダクトも高精度となり、実用化が進んでいます。 しかし、実はもう一つ、大事なポイントがあります。それは《精度の高い技術が使いやすい》状態であること。 たとえば、どんなに精度が高い機械学習モデルであっても、コストが高い、機械学習に時間がかかる、権利的に使いにくい…

音声認識技術の使われているプロダクト|#5|AI×Speaking Test

《今回のポイント》意外と身近に使われている音声認識技術スピーキングテストにおいて重要な音声認識技術は、それ自体を直接意識することはなくとも、実は身のまわりのさまざまなプロダクトや機能で使われています。 例) ・“Hey, Siri.”や“OK, Google”といったバーチャルアシスタント →呼びかけ(音声データ)を認識し、内容を文字データに変換してからアプリなどを立ち上げる ・議事録などの自動文字起こしソフトやアプリ ・音声翻訳ソフトやアプリ 語学関連サービスでも、音声