OpenAIにみるオープンソースビジネスモデル

2022年11月4日 00:25

過去記事でも取り上げたOpenAIですが、今度は音声から文字を生成する、文字起こしオープンソースAI「Whisper」を発表しました。ウェブから収集した68万時間に及ぶ音声データを用いてAIモデルを学習させ、アクセント、背景・雑音、専門用語に対する精度が向上していることを謳っています。

英語だけでなく、日本語やフランス語、ドイツ語など数十以上の言語にも対応しています。文字起こしの精度は言語ごとに異なり、日本語の単語誤り率は6.4％でWhisper対応言語の中でもかなり高い精度で対応しています。

現在の対象ユーザーはAI研究者で、彼らに無償で利用してもらい、フィードバックを受けることにより品質や機能性の向上を図ります。ゆくゆくは文章生成モデルGPT-3や画像生成モデルDall-e2のように、一般ユーザーでも利用できる商用化を目指していくものと見られます。

この記事の続きは、下記からご覧ください。

主要コンテンツInsight(https://insight.eisnetwork.co )では、今世界で起きている最新のビジネス・テクノロジー・消費者トレンドを、欧米を拠点に事業展開・生活しさまざまな分野に精通しているEISメンバーのリアルな肌感覚や実際の体験に基づき解説しています。

いいなと思ったら応援しよう！