声もライセンス化されるようになる

田村一起/(株)voiceware CEO

2020年8月11日 15:47

voicewareも創業から3年が経ちました。

改めて創業時の事業計画を見直してみると、まだまだ想い描いていた世界の実現には程遠いなと。
ただ、完全に見切り発車でスタートした当初から比べると、かなり形になってきているので、さらに加速度的に前進していきます！

さて、今回は声の権利について書いてみました。

声を作る技術

以前の記事でも書きましたが、voicewareで取り組んでいる声質変換技術によって声優の働き方が大きく変わってくる可能性があります。
https://note.com/voiceware/n/nf772daaa8a6a

では、現状、声の権利ってどうなっているのでしょうか？

録音された音声等には、その人の表現活動として見做されるので著作権は存在しますが、あくまで発言した内容に対してとなります。「声色」そのものには権利はありません。

つまり、特定の誰かの声色を使って何か発信したとしても問題がないわけです。
もちろん他人を詐称したり、悪意ある制作物であれば、内容次第で名誉毀損等の様々な罪に問われる可能性はあります。

これまで、声色を再現する技術なんてなかったので当たり前と言えば当たり前ですよね。

しかし、今は「声」を作り出すことも比較的容易になっています。

例えば、音声合成技術。
これまでは、あらかじめ決められた文章を読み上げた音声を収録することが必要でした。
多大なコストがかかるため、本人の意図しないところで利用される可能性は極めて低かったわけです。

しかし、今では数時間〜数十時間程度の任意の音声データさえあれば、かなり精度の高い合成音声を作ることができるようになりました。
もはや、注意して聞かないと、本人の声なのか機械の声なのか聞き分けれないレベルです。

そうなると、テレビやラジオ、インターネットから取得した音声から合成音声を作りだすことができてしまいます。

さらに、声質変換技術もあります。

声質変換では、さらに少ない音声データで声を再現することが期待されています。

まだ品質に課題があるので、本人そっくりというわけにはいきませんが、本人の声と聞き分けできないレベルの声が再現できるようになるのも時間の問題でしょう。
そうなると、パターン化された喋りだけでなく、あらゆる表現が可能になってきます。

このように、写真のように本人の全く知らないところで、声が利用されているケースもでてくるわけです。

それに伴い、声をライセンス化しようという議論も出てきています。
声の肖像権のようなイメージですね。

ライセンス化されると何が変わる？

まず、真っ先に思い浮かぶのは、声優や著名人の方の働き方の転換です。

今までは、音声収録のためにスケジュールを確保する必要があったので、収録できる時間に限りがありました。
しかし、音声合成や声質変換の技術によって、本人が収録しなくてもよくなると、収録のコストが大幅に削減され、音声を販売するハードルがかなり下がります。
コストやスケジュールを考慮しなくて良くなると、よりイメージに合う声を起用できるようになりますよね。

まさに、声だけを販売しているようなイメージです。

また、最近は「個の時代」と盛んに言われていますが、ライセンス化されるようになってくると音声界隈でもこの傾向が加速すると考えています。

今までは、音声合成等の技術で声を作ることは多大なコストがかかっていため、組織的に行うことが一般的でした。

しかし、前述のように声を作ることがどんどん容易になってきており、個人でも自由に技術を使えるようになってくるでしょう。
そうなってくると、個人が自分の声を作成して自由に発信・販売することも可能になってきます。
顔を出すのはイヤだけど、声ならOKという人も多いのではないでしょうか？

そういった発信活動を通して、魅力的な声が見つかれば、この声をこのアニメに使ってみよう、この動画のナレーションに使ってみようということなってくるわけです。

収録が必要なく、いろんな声で試行錯誤することも容易なので、よりイメージに合った声を選びやすくもなります。

もしかすると、利用シーンに応じて、いろんな声のバリエーションで効果測定することで、声のデータ活用が加速することにも繋がるかもしれませんね。

法律的な課題

以上のように、ライセンス化されることで様々なメリットがあるわけですが、もちろん課題もあります。

既に述べたように、現状、「声色」そのものには法律的に権利はありません。

法律化しようという動きもあるようですが、肖像権のように法律化までされるには線引きがかなり難しいと思います。

それは、
どのレベルまで似ていると本人の声と見做されるのか？
という点です。

例えば、テレビ番組でもよく見かけますが、タレントの写真を使うことがNGなのでイラストが使われているケースがありますよね。
イラストであればOKなのです。

声に関しては、写真と違って、100%本人と同一のものを写しとることはできないので、厳密な線引きができないと思います。

では、打つ手がないのかというと、そういうわけでもありません。

アメリカのいくつかの州では、ディープフェイク技術を利用して政治的な動画を制作・販売することが法律で禁止されました。
あくまで政治的な内容に関してのみですが。

このように、用途を絞った形で、技術の利用を制限する法律はできてくるかと思います。

他にも、声を提供した本人が意図しない形で使われることをどう回避・検知するのか等の課題もありますが、音声関係の技術も声を使った仕事に大きく関わってくるのは確かですし、既に変わりつつあります。

多様な働き方・コミュニケーションの在り方を実現できるよう、これからも邁進していきます！

株式会社voiceware
代表取締役CEO 田村一起
http://voiceware.co.jp/