「ボイステック革命」著：緒方憲太郎

2021年7月20日 22:19

読んだきっかけ：
毎日Voicyを聞いているので
単純に読んでみたくなった。

読んだ日：
2021年7月

学べること：
音声業界の動向について。
音声業界の未来について。
Voicyの魅力について。

オススメしたい人：
Voicyアプリを利用している人。
音声業界、音声メディアに興味がある人。

●はじめに

ボイステック革命が発売されることは
緒方さんのVoicyを聴いて知りました。

「Voicyで様々なチャンネルを聞いていて毎日勉強になっているし、
Voicyのこともっと詳しく知りたいから絶対に読もう！」

発売日に何店か書店をまわったけどどこにも売ってない。
沖縄は離島扱いなので発売日に入荷することはほとんど無いし
大きい書店も1店舗しかないのでそもそも入荷予定すらない。

さて、どうするべきかと思っている時に
緒方さんのVoicyにてボイステック革命の寄贈をおこなうとのこと。

音声業界を知りたい者として、
寄贈の申し込みをさせて頂きました。
（コメント欄にはちゃっかり沖縄では手に入りにくいこともお伝えして…笑）

Voicy本社（渋谷区）へ受け取りに来てくれる人を
優先するとのことでしたので気長に待っていようと
思っていたところ、なんと！すぐに届けてくれました！

こんなに早く届くとは思っていなかったので
とても興奮したのを覚えています。

対応して頂いた株式会社Voicyスタッフの皆様。
本当にありがとうございました。

ということで
早速読んでみたいと思いま〜す。

●音声ブームの到来

株式会社Voicyを起業したのは2016年。
緒方さんはその頃から音声の未来に可能性を感じていて
音声産業が社会を大きく変えると考えていたそう。
ただ、当時は誰も聞く耳を持ってくれなかったという。

その頃、海外ではスマートスピーカーの登場や
ワイヤレスイヤホンの普及、音声テクノロジーの
進化を背景に、音声コンテンツやサービスが
急成長していたそうだ。

それから5年経った2021年
「音声が社会を変える？本当かもしれない」
と、関心が高まり始めている。

2021年1月末にクラブハウスブームが日本にやってきた。

毎日テレビニュース等で取り上げられ
クラブハウスの認知度が高まっていったと感じた。

僕自信がクラブハウスを知ったのは
西野亮廣さんのVoicyを聞いていた時で
その時はまだブームが巻き起こる少し前だった。

その後日に日にクラブハウス熱が高まっていく様子を感じ
音声メディアへの興味関心が湧いてきました。

●ボイステックの未来

プロローグとして音声がもたらす生活の変化を
「ある1日」のストーリーとして書いてありました。

朝、スマートスピーカーから流れる
音声アシスタントが「目覚めの音楽」をテーマとして
選んでくれた音楽で目を覚ます。

「今日の予定は？」と質問すると
登録していたスケジュールを音声にて教えてくれる。

ニュースを聞きたいと思ったら
「ニュースを聞かせて。ビジネスニュースがいいな」
とスピーカーに向かって言うだけ。

ベッドサイド、廊下、洗面所や風呂場、
トイレ、台所、リビングなど至るところに
スピーカーが設置されている。

スピーカーには高感度のマイクが取り付けられていて
すべてがネットワークで同じ音声アシスタントにつながっている。

外出の準備をしながら、家事をしながら、食事をしながら
「ながら時間」を利用して様々なことができるようになっている。

このような未来がすぐ近くまで来ていると思うと
音声の可能性を感じるとともに、
音声によって作られる全く新しい生活が
とても楽しみになった。

●変革の時代のカギ

音声の変革のカギとなったのは

・音声テクノロジーの進化
・デバイスの普及
・「聴く」習慣の広がり

の3つがあげられる。

まずは音声テクノロジーの進化について。

音声テクノロジーの進化の中でも
特に重要なのは、解析の技術である。

ここ数年で、音声を解析する技術が飛躍的に進み
デジタル音声データの内容を機械的に「理解」することが
できるようになってきたという。

Appleの「Siri」やGoogleの「Googleアシスタント」などの
音声アシスタントが生まれた背景にはこうした技術の進歩がある。

この技術が実現したのは、インターネット上に膨大な情報が
蓄積され、コンピュータがディープラーニング（深層学習）という
機械学習を行うために必要な素材が豊富に集まるようになったこと
さらに、解析力の高いコンピュータが手に入るようになった
ことがあげられる。

音声テクノロジーの代表的なものは
音声をテキストとして認識する技術とされている。

SiriやGoogleアシスタントも、人が発した言葉を
テキストに変換する音声認識という技術が
なくては実現しなかったといえる。

次にデバイスの普及について。

ここ数年で「聴く」人口が増えた理由の一つが
革新的なデバイスの普及であり、
例えばスマートスピーカーとワイヤレスイヤホンである。

日本において、スマートスピーカーはまだ普及は進んでいないが
アメリカにおけるスマートスピーカーは、既に市場に幅広く行き渡りつつある。

そして、

ボイステックの未来にとって、スマートスピーカーよりも
大きなインパクトがあるのが、ワイヤレスイヤホンの普及だ。

ワイヤレスイヤホンとスマホを連携させていることで
手元よりもっと近い、耳元に、常にSiriやGoogleアシスタントが
いることになるからである。

ワイヤレスイヤホン普及のきっかけとなったのは
Appleが発売した「AirPods」だった。

これはイヤホンが単にワイヤレスになったというだけではなく
イヤホンにマイクや簡単なリモコン機能が搭載されている。

ワイヤレスイヤホンは、音声を聞くだけのためのものではなく
耳に装着した小型コンピュータのような役目を果たすようになってきている。

音声の最大の特徴は、何かをしながらの「ながら聴き」が
できる点にあるが、ワイヤレスイヤホンによって
さらに「ながら聴き」が簡単にできるようになり、
音声市場の盛り上がりに貢献することとなった。

●「人」軸の時代のメディア

人はかつてのように「速い、安い、うまい」というだけでは
商品やサービスを買わなくなっている。

今は価格や商品の質だけではなく、
「人」を物差しにするようになっている。

特に「コンテンツ」に対しては、こうした傾向が強く
「誰が」発信しているのかが重要であり、
その発信者に共感できなければお金は払わない。

音声は最も「人」軸のメディアである。

フォロワーたちは、役立つ情報を得られるという理由だけで
ファンになっているのではなく、その人の生き方が
その人自身の声で伝わってくるから好きになっていると考えられる。

Voicyユーザーにおいても
毎日聴いているうちに、その声の持ち主を好きになり
その人が書いた本を買ってみたり、その人が主催する
オンラインサロンに入会してみたりというケースが
多数見られるという。

●ボイステックの技術

ボイステックの技術について、現在どのような
テクノロジーが存在しているのか。

①発信
②受信
③分析・活用

この3つのカテゴリに分けて解説されていた。

①発信

発信のカテゴリでは、コンテンツ制作、収録、
保管、加工、届け方などが関わってくるという。

日本で今後発展が期待されるのが、コンテンツ制作の分野と
されており、音声の世界は、発信のハードルが低い分、
コンテンツが充実していくスピードが速いとされている。

日本では、ラジオ番組のスタイルを踏襲したコンテンツが多く、
また、英語などの語学学習用コンテンツも人気となっているようだ。
オーディオブックも伸びてきている。

収録や加工の技術も変化してきており、専用機材や専門知識がなくても
スマホさえあれば手軽に収録、加工ができるようになっており、
音声コンテンツ制作のハードルは下がってきている。
配信プラットフォームによっては、アプリ内に
収録や編集、加工などの機能が搭載されているものもあるらしい。

②受信

受信のカテゴリでの注目株は、音声認識について。

音声認識は、ボイステック革命のきっかけとなった基盤技術で
人が発する音声をデータとして処理して「理解」する技術のこと。

今、多くのスマホやスマートスピーカーに搭載されている
音声で操作する機能を「音声アシスタント」という。

音声アシスタントと呼ばれる機能の基本的な流れは、
まず、人が発した言葉を解析してテキストに変換（音声認識）する。
次にテキストから目的を推測（意味理解）し、目的に応じて
アプリを起動するといった次の動作につなげる。
「今日の天気は？」などの、音声による回答を求められている場合は
目的に応じた答えとなるテキストを作り出し（回答生成）、
それを音声に変換（音声合成）して返答する。

音声認識技術は、ディープラーニングによって飛躍的に進んだ。

ディープラーニングとは、人間の脳神経の構造を模倣して
作られたモデルを使い、コンピュータ自信が大量のデータの中から
特徴を自分で学習するものである。

ディープラーニングを使うと、たくさんの情報を処理すればするほど
学習が進み、処理や判断の精度が上がっていく。
音声アシスタントも同様で、話しかければ話しかけるほど
音声データがクラウド上に蓄積され、音声認識の精度が上がっていく。

音声アシスタントを支える技術として、音声認識とあわせて
欠かせないのが人口音声の技術である。

「音声認識によって機会が人の言葉を理解し、人口音声が返してくれる」
という一連のやり取りを、より自然で、人間同士の会話に近いものに
するための技術の一つである。

人口音声に関しても、AIのディープラーニングのおかげで
無機質で抑揚のない、機械的な音声から、より「人間らしい」
自然な音声表現ができるようになっている。

③分析・応用

音声の大きな特徴の一つが、
「感情を動かすメディア」であること。
ただ、どんな音声が、どのように受信者の感情を
動かすのかについては、はっきりわかっているわけではない。

音声は、聴いた人がどう反応し、聴いた音声の影響で
行動をどのように変えたかは追いにくい側面がある。

2015年にAppleがApple Watchを発売して以降、
トレーニングや健康管理に活用できるさまざまなセンサーを
搭載したスマートウォッチが登場している。
こうしたデバイスを連動させれば、特定の音声を聴いたときに
心拍数や体温などがどう変化したかがわかるようになる。
受信者の感情の動きを可視化することもできるはずだ。
この分野の研究が進めば、音声コンテンツの開発や
音声マーケティングでの活用も考えられる。

とあるように、音声を聴くことによって
どのような効果を得られるかというのは
今後の「分析力」「応用力」の成長にかかっているといえる。

●まとめ

ボイステック革命を読んでみて
音声業界の現状や大きな未来の可能性を
感じることができました。

これまで何気なく使用していたSiriやAirPodsも
音声メディアの発展に大きく関わっているもので
今後のアップデートに注目していきたいと思いました。

Voicyを聴くようになってからは、すき間時間に
「ながら聴き」をすることが当たり前になりつつあります。

特に、車移動中はほとんどの時間を
Voicyを聴いて過ごしています。

「ながら聴き」といっても、たくさんの学びを得ることが
可能ですし、Voicyを通して知ることのできたパーソナリティの方も
たくさんいます。

鴨頭嘉人さん、ニシトアキコさん、イケハヤさん
ワーママはるさん、大河内薫さん、西野亮廣さん
マナブさん、ゆうきゆうさん、箕輪厚介さんなど
もちろん緒方憲太郎社長のチャンネルも！！

パーソナリティによってジャンルは違うし
それによって幅広い知識を身につけることができます。

毎日聴いているチャンネルを聴けていない日は
気持ちがソワソワするぐらい僕の日常の一部となっています。

ボイステック革命を読んで知ったことを
意識しながら聴くことにより、今までとは
少し違った視点から学びを得ることができそうです。

最後に、本を寄贈してくださった緒方社長。
本当にありがとうございました。

「道に迷えばオモロい方へ！」

この記事が参加している募集

#推薦図書

43,865件

#読書感想文

208,856件

この記事が気に入ったらサポートをしてみませんか？