【音声認識AI】すごい!ここまで来たか。NottaとWishiperの精度と速度を実験してみた。
今回は、音声認識AIの精度と速度の比較、特にNottaとWhisper V3 Fasterについて解説しています。動画の主なポイントは、音声認識AIとは何か?、音声認識AIの精度と速度の比較、そして有料サービスと無料サービスの比較の3つとなっています。
NottaAIとは?
NottaAIは、音声をテキスト化し、要約することができる有料のサービスです。高速でPCが不要で、スマホだけで使用可能という利点があります。また、精度も高いのが特徴です。ただし、無料版には制限があり、有料版は月額1,317円かかります。でも。すっごくいい!
Whisperとは?
Whisperは、OpenAI社が開発した無料の音声認識AIです。基本的に無料で使用でき、汎用性が高いのが特徴ですね。また、PCにローカルで構築可能なため、アップロードが不要で安全性が高いという利点もあります。さらに、分数の制限がないのも魅力的です。ただし、音声の録音機材が別途必要で、構築にはPythonの知識が必要です。また、速度はパソコンのスペックに依存します。ちょっと、初級者にはハードルが高いです。
この動画の実験について
この動画では、NottaとWhisperの精度と速度を比較する実験を行ってみました。
精度の比較では、Nottaは1,090文字を認識し、53文字の間違いがあり、正解率は95.13%でした。一方、Whisperは1,125文字を認識し、60文字の間違いがあり、正解率は94.66%でした。両者の精度はほぼ同等ですが、Whisperは「元号」を「言語」と誤認識する傾向がありました。ただし、Whisperは、Nottaでは聞き取れなかった文章も読み取ることができました。
速度の比較では、Nottaのテキスト変換は1分22秒、要約は3〜4分かかりました。一方、Whisperのテキスト変換は6分14秒かかりました。速度については、Nottaが圧倒的に優れていました。
まとめとして、精度は両者ともに約95%で互角でしたが、速度はNottaが優れていました。Nottaは有料ですが導入が簡単で、Whisperは無料ですが導入にPythonの知識が必要です。普段はNotta、特殊な作業にはWhisperが適しているようです。
音声認識AIの強みは、高い認識率と速度であり、会議のメモレベルであれば実用的です。弱みは、固有名詞や専門用語の認識が弱いことです。今後、新しいデバイスの出現により、音声認識AIの活躍の場がさらに増えると期待されています。
【参考にした動画】
【Whisperの構築参考動画】
・【音声文字起こし5】超高精度!音声認識AI WhisperをローカルインストールしてPythonで使ってみる!~インストール~GPU利用、実践プログラムまで詳しく解説~→
・【Python】音声文字起こしWhisperの最新モデルLarge-v3と高速処理のfaster Whisperを試してみた!~ついに精度xxx%!~→
【AI関連動画】
・【音声認識AI】すごい!ここまで来たか。NottaとWishiperの精度と速度を実験してみた。
・【簡単】パーソナル AI Chatを作る。AiDriveとChatGPTのAiPDF連動
・【主要AI全部使える!perplexity AI 】ChatGPT、Claude3、Mistral全部いり。SDXL、DALL3、Playgroundも全部入り。AIに迷っている方におすすめ
・【AI搭載メガネ】世界初!マルチモーダルAI搭載メガネのBrilliant Labs(ブリリアント・ラボ)Frameレビュー
・【すぐわかるイラスト生成】ChatGPT4にDALL E3が搭載されてAI画像生成ができるようになったよという動画
・【ChatGPT-4Vレビュー】のアップデートが凄すぎる! わかりやすく説明算数のテスト問題も解ける!? #chatgpt4V
・OpneAI モデルGPT 4のAPYキーが届いたので、WebUIを作ってみた。#opneai #gpt4 #api #OpenAIapi
・【2023年1Q保存版】AIサービスのおすすめ3選ChatGPT、NotionAI、AgentGPTの使い方説明#chatgpt #agentgpt #notionai
・翻訳ソフトDeepLレビューおすすめ機能5選 #deepl
・【衝撃の返答】ChatGPTの質問テクニックを公開。簡単なのに効果抜群!Chat-GPTで驚きの回答を引き出すテクニック!#chatgpt #chatgptplus
・