見出し画像

OpenAIにみるオープンソースビジネスモデル

過去記事でも取り上げたOpenAIですが、今度は音声から文字を生成する、文字起こしオープンソースAI「Whisper」を発表しました。ウェブから収集した68万時間に及ぶ音声データを用いてAIモデルを学習させ、アクセント、背景・雑音、専門用語に対する精度が向上していることを謳っています。

WhisperのAIモデル

英語だけでなく、日本語やフランス語、ドイツ語など数十以上の言語にも対応しています。文字起こしの精度は言語ごとに異なり、日本語の単語誤り率は6.4%でWhisper対応言語の中でもかなり高い精度で対応しています。

Whisperの言語毎の単語誤り率

現在の対象ユーザーはAI研究者で、彼らに無償で利用してもらい、フィードバックを受けることにより品質や機能性の向上を図ります。ゆくゆくは文章生成モデルGPT-3や画像生成モデルDall-e2のように、一般ユーザーでも利用できる商用化を目指していくものと見られます。

この記事の続きは、下記からご覧ください。

EIS Insightとは

主要コンテンツInsight(https://insight.eisnetwork.co)では、今世界で起きている最新のビジネス・テクノロジー・消費者トレンドを、欧米を拠点に事業展開・生活しさまざまな分野に精通しているEISメンバーのリアルな肌感覚や実際の体験に基づき解説しています。


詳しくはウェブサイトにて!

いいなと思ったら応援しよう!