音声配信アプリのAI読み込み機能、その評価と今後の課題
はい、どーも、りゅうパパです。
このブログは、子供が寝静まったあとにパパが本音を話すブログとなっております。
わたくし、(人前で話すお喋りの練習のため内緒でありますが…)2021年の2年前から、音声配信アプリ『stand.fm』を始めて、多いときは週に3回ぐらい音声配信したり、まさに先日、音声配信の更新が200回を超え、それぐらいハマっております。
音声配信アプリの魅力は
他のSNSコンテンツに比べ、音声を吹き込むだけで、編集さえしなければ、そのまま配信が可能であり、非常にお気軽に更新できることが魅力です。例えば、動画なら編集が必要ですし、イラストなら描くのに非常に時間が掛かります。
音声配信なら、簡単に配信ができるので、寝る前に5分間音声を録音し、配信するのにタイトルとか説明の文章を入れてもプラス5分。合計10分もあれば、音声コンテンツを作成し世界に配信までできるんです。
以前、家族がコロナになり、2週間の外出禁止となった際、家族以外と気軽にお話する機会を失って、ストレスの溜まる一方でしたが、音声配信アプリで毎日ひとり喋りを行い、配信したことで、うまく気持ちと心のコントロールが出来た部分もあります。
そんな音声配信アプリstand.fmが新機能を実装しました
新機能は「AIテキスト読み込み」で、そのまま公式の文章をコピペすると「テキストを入力するだけでAIが読み上げる音声ファイルを作成できます。作成した音声ファイルは放送として投稿することができます。」だそうです。
さらに、「note記事を音声化」するという機能もあります。
僕としては、noteの記事(ブログ)を書くことで、それが自動で音声コンテンツになるなんて、1つのコンテンツが勝手に2つになるわけで「一石二鳥じゃん」と思いました。そのコンテンツの品質は置いといて、コンテンツは自分の財産だと思うと、とても魅力的な機能です。
なので、自分は音声配信コンテンツを作るために、そのAIテキスト読み込み機能を利用するために、数年間放置し触っていなかったnoteを突如再開し、記事を書き始めたわけです。
以下では、実際にAIテキスト機能を使ってみた感想と課題を述べます。
実際にAIテキスト機能を使ってみた
その感想は、テキストを”基本は”違和感なく音声化できることに驚きました。
とは言え、やはりまだまだ発展途中のAI機能なので、一部発音が間違っていたり、文章の途中に変な間ができたり、完ぺきではないのは事実です。そこでAIはまだまだだ!不完全だ!未熟だ!と言ってしまうのは、これからの発展の妨げになるので、今後の技術進化に期待します。
ただし、そのような技術進化がフェイク動画など、今後世界を混乱させる可能性もあり得るので、勿論注意は必要だと思います。
その問題点以外にも…
AIテキスト機能で課題に思ったことがあります
AIテキスト機能で音声化されたものは、その設定次第ではありますが、自分の拙い喋りとは違い、限りなくアナウンサーが読み上げたような出来です。
しかも、整理された完成度の高い文章・テキストであればあるほど、その音声の完成度も高くなります。
・ただし、ここで問題があります!
そもそも、元が自分の記事なので文章内容がつまらないってこともあるかと思いますが、整理された文章でアナウンサーが読んだような完成度の高い音声コンテンツは…聴いていて「つまらない!」ということです。
タレントのラジオだって、台本通りのようで、アドリブも人間性も出ているから面白いわけで、自分は、意外に「えーと」とか「でね!でね!」とか、笑い声だったり、様々な”無駄”だと思われる不要な言葉が、話のテンポを作り、人間臭さが魅力になり、大事なんじゃないかと思いました。
・AI時代だから大事なもの
自分は多摩美卒で今もたまに模写イラストなどを描きますが、絵を描くことだってそうです。ましては、模写なんて、今はAIで簡単に描ける世の中です。仮に手描きの模写があったとして、完成度が高くなればなるほど、AIとの差別化が難しくなります。
だからこそ、そこに手描きのアナログ感とか、汚い筆の跡とか、言ったら完ぺきではないノイズが必要になるのではないでしょうか。自分はそう思います。
というわけで…
・まとめます
・音声配信アプリstand.fmのAIテキスト機能は素晴らしいですが、発音や間などで課題はあります。
・その技術進化が、よりコンテンツの完成度を高めると同時に、それはつまないものとなる可能性があります。
・だからこそ、今は無駄なものが大切であり、それがコンテンツの魅力を高め、AIとの差別化を行います。
なんて、偉そうに思います。
今日は真面目な内容となりました。皆さん、最後までありがとうございました。ではまた。