Vol.5:なんかいびつな音声作品の世界

みじんこきなこ

2024年11月24日 15:48

皆様こんにちは、あるいはこんばんは、みじんこきなこです。

新サービスCoWaASを始めるまでのよもやま話を連載するマガジン、「私がCoWaASというWebサービスを公開するまで」

今回からは、実際にこのサービスを開発しようと思ったきっかけの話を、全3回で執筆していきます。
前回の記事は台本をインターネットで公開することの難しさ。

今回は２回目、なんかいびつな音声作品の世界と題して、音声の投稿や配信をしていたときに、ここが変な業界だなぁと感じたポイントと、CoWaASの設計にそれがどう反映されたかを書いていきます。

声を扱う世界の変なとこ

私が声を扱う世界に触れるようになったのは、スマートフォンで手軽に配信ができるアプリが普及し始めたことがきっかけでした。

当時暗黒時代の仕事について悩んでいた時期ですが、ITの人の割とよくある悩みとして、システム開発に従事するときのあの疲れ方とか、そもそもの仕事の内容とか、そういったものが同業界で所帯を持ったのでもなければ家族に理解してもらえない。
というものがあります。

私の場合
仕事があまりうまくいかないし誰かと会話したい
→ 技術者交流会も参加していたけど、そう頻度があるわけではない
→ 同じような仕事してる人いたら話しできないかな
→ 技術者系のPodCastも嫌いじゃないけどなんか違う
からスマートフォンアプリを使うようになりました。

そしてたまたまボイスドラマを作っている人と知り合い、一回台本を演じてみた結果面白くて声を扱う世界に関わるようになったのです。

そして飛び込んでみて色々知っていくと、「結構いびつな世界だなぁ」と感じたことがCoWaASの仕様に関わっています。

やたらと多い音声提供者

声優と聞くと、大体の方はアニメのキャラクターボイスや、映画の日本語吹替音声などを想像するかと思います。

大規模なコンテンツに起用され、多くの人の耳に触れる芸能人の一種ですが、調べてみるとこの声優を職業としている人は、幅がありますが300人から1200人ほどといわれています。

しかし毎年職業としてそれを志望する方は、専門教育機関を卒業する人だけでも3～5万人ほど。実はこれって日本では「新卒のITエンジニアと同等かそれ以上の人数」です(2023年のIT系新卒は4.8万人)。
ちなみに、日本のITエンジニアを職業としている人の数が144万人です。

ではこの新たに志したけど職業にできていない方々はどこに行くのでしょう。
公的な調査資料がないので断言できる情報はありませんが、一つはかなりの数の方が趣味として、または実績作りとしていわゆる「ネット声優」「ボイスコーポレーター」という分野で活動を行うことが推察されます。

つまり、アマチュアの分野であっても、ものすごい数の音声提供者が存在するのです。

少ない編集者

逆に演じた人の音声を一つの作品としてまとめ上げる編集者は、実は音声のみを対象とした編集者という職業としての推計はなく、映像編集者に含まれます。
これが日本で30万人、そのうち一部が趣味やボランティアとしてやっている。または独学で趣味のみでやっているというのが実情なので、非常に人数が少ないのです。

音声作品の編集は、音楽とはまた違った方向の難しさがあり、割とサークルなどでも入れ替わったり音信不通になったりといった事故の多い役割でもあります。

この人数的な偏りがある種のボトルネックとなって、音声作品の供給量はかなり少ないのです。

やり甲斐の少なさ

そして、前回の台本の話とは逆に、音声と編集は収益化の壁がやたらと高いのです。

どちらも少なくとも自分でどこか作品を販売しているサークルに売り込みに行くか、お仕事くださいの形でネットに掲載するか。
そして、いずれも練習や専門的な知識、そして作家性が必要な創作であるにもかかわらず発注側の予算感と見合うことが少ないです。

そのため、趣味としてはマニアックで、続けられる人は偏執的になりがちで、気軽にできないけど本気でやっても実利が産まれない形に陥りがちなのです(まぁITも大概そうなんですが…)。

とはいえ、演じたり、作品を作ること、誰かに感想をもらうことって楽しいじゃないですか。

私自身台本のキャラクターになりきって音声を録音して、編集するのは、ストレスで靄がかってしまった頭がすっとしましたし、楽しかったし、実際IT以外のそういう趣味に救われたから今色々生きているっていう側面もあるので、できれば多くの人がもっと気軽に楽しめる趣味になってくれたらいいなと思っています。

必要なのは公開しやすく収益化できる仕組み

そんなわけで、CoWaASでは、収録、公開、利用にあたる工夫がいくつか機能として組み込まれています。

特別なソフトウェアなしで録音するインブラウザレコーダー

まず、購入(利用を作者に承諾してもらった)台本を、特別な収録ソフトウェアなしにWebブラウザだけで台本を表示、収録、公開するための仕組みを備えます。

収録の際に自分の担当キャラクタがわかるよう、セリフのハイライトを行い、PCやミキサの性能によりますが、ハイレゾまでの音声形式をカバーしつつ、サーバへの転送や保存は劣化なしの可逆圧縮で行い利用時にもきれいな音声が使えるように配慮して設計しています。

駆動箇所検討中だけど音声改質機能

もう一つはインブラウザレコーダーの機能として組み込むか、サーバー側で処理するか検討中の音声改質機能です。

音声作品のセリフ音声は、実際に使用するまでに、音声のノイズ取りや音量の統一、前後の無音区間の調整や、シーンの空間にあったエコー等のエフェクトの追加など、音声波形を編集する機能が必要になります。

こちらはブラウザ用とサーバ用に機能自体は開発してあるのですが、メモリを食うのでブラウザに搭載すると、一定の性能のPCが必要になってしまう。
(とはいえWindows11で8GB積んでればどうにかなる ( けど家電量販店で買って使っている方だと微妙だし、実際生活ぎりぎりの方もすごく多い ))

かといってサーバで駆動させると、システム運用コストが跳ね上がってしまう(ただでさえボランティアに限りなく近い価格設定で設計してるのにそこまでやったらやる意味あるのか)ということで悩んでおります。

βリリースの様子見て結論を出したい。

さいごに

今回は、「なんかいびつな音声作品の世界」と題して、音声の投稿や配信をしていたときに、ここが変な業界だなぁと感じたポイントと、CoWaASの設計にそれがどう反映されたかについて書かせていただきました。

最近はβ用のプロジェクトを稼働し始め、1月末のβリリースに向けて開発環境から機能を検証、最適化、移植している段階です。

CoWaAS開発、ぜひとも見守っていただければと思います。

また、クラウドファンディングのページをプレビュー公開しています。
まだ募集前ですが、実際のクラウドファンディングのページはこちら↓