YouTubeの多言語音声機能、OpenAIの技術を利用したSpotifyのDJ機能ーー「大手企業の音声新機能」を考える

2023.4/14 TBSラジオ『荻上チキ・Session』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、YouTubeとSpotifyという、巨大プラットフォーマーが新たに発表した機能について紹介します。

◾YouTubeの多言語音声機能が拡大

世界中で人気のYouTubeはこれまで、外国語音声の字幕を自動で生成する機能など、様々な言語で作成される動画の翻訳を試みています。そんな中YouTubeは2023年2月に、ひとつの動画に多言語の吹き替え音声を作成し、視聴者が自由に音声を変更できる機能を拡大すると発表しました。

YouTubeではこれまで、少数のクリエイターに多言語の音声を追加する機能を提供し、テストしてきました。YouTubeによれば、世界で1億以上の登録ユーザーを有する、世界トップレベルのYouTuberである「Mr.Beast」氏にこの機能を提供したところ、平均で総再生時間の15%以上が吹替版の言語で視聴されたとのことです。海外の人気の動画を日本語の吹き替えで視聴できれば、エンタメや教育など、様々なコンテンツをより楽しむことができるでしょう。

ちなみに、Mr.Beastの動画は英語で、日本語版吹き替えは同氏の好きな日本の漫画「NARUTO」のアニメ版声優である竹内順子氏が担当しており、人気を博しています。YouTubeの多言語音声機能は順次拡大するとのことですが、世界中の多くの動画が日本語で視聴できる点は、私たちにとっても有益でしょう(ただし、より人気の動画とそうでないものの格差も生じるようにも思われます)。

◾Spotifyの「DJ」機能

一方、音声プラットフォーマーであるSpotifyも、新たな機能の提供をはじめています。Spotifyの強みは大量の音楽を有していることだけではありません。Spotifyは有名DJ等が作成するプレイリストが人気であり、またNetflix同様、ユーザーの聴取傾向から「おすすめ」を提供する機能が強みです。

そんな中、Spotifyは2023年2月、AIによってパーソナライズされた選曲と、楽曲やアーティストに関するコメントを作成する「DJ」という機能のベータ版を公開しました。現時点では、アメリカとカナダのプレミアムユーザーが対象となっています。

注目すべきは、ChatGPTで有名になったOpen AI社のジェネレーティブAI技術を活用する点です。これにより、これまで以上にユーザーの好みを把握し、AIのDJが好みのプレイリストを作成するだけでなく、曲やアーティストの情報を伝えてくれる、個人用のラジオステーションのようなものです。

AIのDJはラジオのようにユーザーに話しかけますが、このDJは実在の人物(Xavier “X” Jernigan)の声からつくられた合成音声だとのことです(このDJはSpotifyとパートナー関係にあります)。また選曲を評価したり、選曲のムードを変えるボタンも用意されています。

この機能をアメリカで実際に体験した記者によれば、選曲はよかったとのこと。もちろん、DJが「熱帯夜のあの感じ」と言ったところに、記者はひっかかりを感じたそうです。AIなのにその感じはわかるのか?という違和感です。このように、どれほどDJを人間に近づけるか等は今後の課題でしょう。

同時に、やはりラジオ的な使い方が増えるのであれば、やはりAIではなく人間が話すラジオが良いと、既存のラジオが逆説的に再注目される可能性もあります。これについては、どちらが良いというわけではなく、新たな技術が登場することで、私たちの新旧技術との関わり合いが変化する可能性があるということです。いずれにせよ、当ラボはYouTubeやSpotifyといった巨大プラットフォーマーの動きについても、引き続き注目していきます。

この記事が気に入ったらサポートをしてみませんか?