![見出し画像](https://assets.st-note.com/production/uploads/images/50612763/rectangle_large_type_2_6a4aa5f484dfb3fac1ce9d76f8a630a4.png?width=1200)
音声SNSの新時代ー聞く習慣に新しい遊び方(前編)
どうもZ Venture Capitalの李路成(@lucheng_li)です。年始から音声領域大注目していまして、直近中国系の音声アプリすごく気になる変化がありました。
それは音声アプリの中「オーディオファーストな社交」と「コンテンツの混在化」が起きているということです。
え?それって当たり前じゃん?と思うかもしれないですが、私なりの定義はこんな感じです。
・「オーディオファーストな社交」=音声を聞いてる中他のユーザーと「一緒に」アクションを起こして、コンパニオンシップ関係を作る
・「コンテンツの混在化」=ショートビデオ、ライブ、ポッドキャスをオールジャンルで揃う
という変化です。
今回はこのブームの背景や要因を徹底的に調べて皆さんに紹介したいと思います。前編ではまずユーザー目線で最近の音声プロダクトを使ってみて感じたことを書きます。
「オーディオファーストな社交」=「一緒に」〇〇をする、仕組み
早速例を出します。ヒマラヤの「一起听」機能:一緒に〇〇を聞く。
いろんなコンテンツが選べられてとても楽
つまり、この機能を通じて、知らない人でも同じルームに入って同じコンテンツを聞いてチャットすることが実現されました。
私がぱっとこれを見たときに、これに似てると思いました。
そう、クラブハウスなんです。
しかし、使ってみて本質的な違いを感じました。Clubhouseのユースケースとしてルームのホルダーがゲストを招待し、強烈なコンテンツを用意してユーザーの耳を惹き付ける、言い換えると「イベント」形式のものが多いではないでしょうか。
私がクラブハウスで配信をしたときに少しずつ視聴者が増えてくれたせいか、だんだん自分はコンテンツに対する自信がなくなります。
話すネタはこれでいいんかな?何回も話してるので飽きてるやないかな?
みたいに思ったりして。
一方、ヒマラヤの一緒に聞く機能を使うときにこのような悩みがありません。音声コンテンツありきの感じで聞きたいポッドキャストの部屋を見つけて、そこで知っている人/知らない人と一緒に音声を楽しんで、チャットするのようなものです。
すでにお分かりになったかと思いますがヒマラヤの場合、主役は話し手ではなく聞き手になっています。オーディオコンテンツファーストではなくて、オーディオの社交がファーストになっています。
誰が「一緒に」機能を開発しているのか
つまり、中国の「聞く」経済圏ではほぼ「一緒に」機能を実装しました。
「一緒に」聞くってどういうことができるの?
・ヒマラヤー一緒にコンテンツを聞く部屋
・QQミュージックーー部屋を作って人をインバイトし聞く、見る
・雲ミュージックーー知らない人とマッチングして聞く、ゲームをプレイする
・Kugouミュージックーー部屋を作って友達をインバイトして音楽を聞く
「一緒に」聞くって何が良いの?
結局、一緒に聞いて何がいいんだっけ?と思うかもしれません。機能からだけではそうなのかもしれません。しかし、これまでの音声系アプリでコミュニティ機能も実装したし、フィード型のタブも開発したし、ましてカラオケみたいな対戦まで本当に様々なSNS要素を取り入れられました。
「一緒に」聞く機能は結構なイノベーションだと思っています。なぜなら、音声をベースとするサービスで、「個」のソーシャルのニーズを答えているサービスがまだ存在していないように思います。且つ、音声だけでソーシャルに展開できるってClubhouseが出てくる前に世の中は懐疑的な見方でした。
今や、「一緒に」聞くフィーチャーの存在で、遠くにいる恋人、同じ趣味嗜好の人と気持ちよく音声のコンテンツを楽しめるし、自分がコンテンツを持たなくても既存のコンテンツでルームを一つ開けば簡単にたくさんの人と交流できます。
「コンテンツの混在化」=ショートビデオ、ライブ、ポッドキャス、音声のコングマリット化
誰が「コンテンツ混在化」させているのか
「コンテンツ混在化」したら何が変化したのか
結果的に、全てのプラットホームにおいて、PGCコンテンツも、UGCコンテンツも、視覚要素が入るコンテンツ全て集約されています。
それでいいの?サービスコンセプトブレてないの?複雑になりすぎていない?と思いますよね。
しかし、PM(プロダクトマネージャー)たちは決して馬鹿ではないし、そうした理由は必ずあります。複数PMにヒアリングしてみたら一つ驚きの結果がわかりました。
「音声は弱い」
と、みんな口揃って言いました。
理由も明確です。
まず、視聴者視点で当然いろんなコンテンツを聞けるプラットホームに耳が行きがちですね。そして手が空いたらただ聞くよりもビデオか、ゲームかをやってしまう傾向があります。
また、配信者視点で音声のマネタイズ効率が相対的に低いと言われています。もちろん強い音声コンテンツはマネタイズできます。ミュージシャンの音楽もそうだし、有名人のブログもそうです。しかし、大多数の人は一般的な音声配信者であり、現在流行っている投げ銭モデルでなかなか支援を集めません。そうすると、良い配信者の原石もだんだん剥がれて配信頻度が減っていきます。配信者が減ると、ユーザーがまた減るような悪循環が生んでしまいます。
最後、運営者視点はさらに簡単で、視覚情報があることによって広告バリュエーションも増えるし、新しいビジネスモデル(ECモデルとか)も追加しやすいです。
そこで至った解決方法は「他のプラットホームからユーザーを奪うこと」「目を奪うこと」で、コンテンツがどんどん混在化し始めました。
最後に
前編はかなりユーザー視点でパッションで書きました。
趣味趣向が近い音声コンテンツを返して近い属性の人と知り合うきっかけとして90年以降のユーザーを中心に利用が伸びているのは、中国の若者世代の社会課題を反映しているとも言えます。
再び、音声コンテンツの特性・本質について考えてみたいと思います。音声は表情が見えない分、話し手の地域・生活感、話し手のいまの想いを感じやすい特性があります。
さて後編ではもう少しこうなった背景を述べます。引き続きぜひご覧ください。
ーーーーーーーーーー
1、[https://pdf.dfcfw.com/pdf/H3_AP202011231431942901_1.pdf?1606124020000.pdf](https://pdf.dfcfw.com/pdf/H3_AP202011231431942901_1.pdf?1606124020000.pdf)
2、[http://www.iprchn.com/cipnews/news_content.aspx?newsId=122846](http://www.iprchn.com/cipnews/news_content.aspx?newsId=122846)