OpenAIにみるオープンソースビジネスモデル
過去記事でも取り上げたOpenAIですが、今度は音声から文字を生成する、文字起こしオープンソースAI「Whisper」を発表しました。ウェブから収集した68万時間に及ぶ音声データを用いてAIモデルを学習させ、アクセント、背景・雑音、専門用語に対する精度が向上していることを謳っています。
英語だけでなく、日本語やフランス語、ドイツ語など数十以上の言語にも対応しています。文字起こしの精度は言語ごとに異なり、日本語の単語誤り率は6.4%でWhisper対応言語の中でもかなり高い精度で対応しています。
現在の対象ユーザーはAI研究者で、彼らに無償で利用してもらい、フィードバックを受けることにより品質や機能性の向上を図ります。ゆくゆくは文章生成モデルGPT-3や画像生成モデルDall-e2のように、一般ユーザーでも利用できる商用化を目指していくものと見られます。
この記事の続きは、下記からご覧ください。
EIS Insightとは
主要コンテンツInsight(https://insight.eisnetwork.co)では、今世界で起きている最新のビジネス・テクノロジー・消費者トレンドを、欧米を拠点に事業展開・生活しさまざまな分野に精通しているEISメンバーのリアルな肌感覚や実際の体験に基づき解説しています。