音楽業界のブロックチェーン活用に関する一考察:KENDRIXの事例から考える
僕は大学で深層学習(いわゆる今のAIの基盤技術というか)の研究をしている身なのでブロックチェーンは専門外なんだけど、一方で楽曲をリリースしたりライブ活動したりする中で音楽関係の企業さんとの付き合いも多い(一応アドバイザー的なポジションにいる)ので、音楽テック関係の情報はそれなりに追い続けてきた。
なんだか知らないけど、生成AIが話題になる一瞬前までのほんの一時期に限っては、AIとブロックチェーンが各種メディアで一緒に取り上げられることがとても多かった。今思えばそう大した関係はないんだけど、AIの生成性とブロックチェーンの自律性がうまく組み合わさることで有機的なシステムができることを期待していたのかもしれないし、単に何も考えていなかっただけなのかもしれない。
音楽テックとしてのKENDRIXの話
そんななか、音楽産業におけるブロックチェーン活用でいうと、JASRACのKENDRIX (https://kendrix.jp) (Kenri: 権利 × DX: デジタルトランスフォーメーション)はひとつの成果だったと思う。KENDRIXは楽曲の存在証明を行うサービスとして、ブロックチェーン上に自分の楽曲をハッシュ化した文字列を登録できる(この辺の意味も下の方で書きます)ようになっている。これについて今さらながら少し考えてみることにする。
ブロックチェーンに乗せることの意義
そもそも、創作行為における著作権者であることの証明は地味に難しい。というのも、創作という過程自体は形を持たないものだから、自分が作ったという証拠をどう残すかという問題になってくる。
一番手っ取り早いのは、登録の"先行性"、つまり、あらゆる違法アップロードなどに対して、「僕の方が先に登録してました〜だから僕が著作者で〜す」と言い張ることだろうと思う。すると、自分の楽曲をブロックチェーンに乗せることによって、自身の楽曲の存在証明が(一応は)できることになる。僕も先日アルバムをリリースしたので、ついでに1曲『Not Jealous』という楽曲をブロックチェーンに登録してみた(存在証明ページ: https://kendrix.jp/versions/musical_creative_work_version_id:87cebc99…)。
それ自体はすごく興味深かったし、音楽業界にとっても非常に大きな一歩だと思う。ただ、僕には現状でいくつか懸念していることがあるんですよね。(研究者はいつだって何かを懸念している。ただ、研究者は現状が抱える課題のことをchallengesと呼び、自分が貢献できる改善点と捉えます)
問題1. あまりにも簡単に誰でも楽曲を登録できる
KENDRIXは簡単に使えることに重点を置いている関係で、逆にあまりにも誰でも簡単に楽曲を登録できるようになってしまっている。先にも、登録の先行性が楽曲の存在証明(というか著作権者であることの証明)の手っ取り早い方法だと言ったけれど、言い換えると楽曲のリリースのタイミングあるいはそれよりはるか前の時点で登録しておかないと、今後先行性を奪われるリスクが出てくる。
というのも、たとえば海外だとリリース前に平気でアルバムの全曲リークが出るし、日本で先日観測したものとしては、back numberの楽曲『冬と春』はリリース前にラジオで1回フル尺が流れただけで、直後にYouTubeがカバーと違法アップロードで溢れ返るというのもあった(個人的には「恥とかないんか?」って感じだったけど)。つまり、楽曲のリリース前に楽曲ファイルを手に入れることは不可能ではないわけで、権利者以外が無断でYouTube等に楽曲を公開するような違法行為の延長線上に、今後は第三者が本家に先行してブロックチェーンに楽曲を登録するという行為があるように感じるんですよね。楽曲の存在証明っつっても、存在を証明するだけなら実際に配信されてるのを見ればわかるわけで、役割としては先行性を推していくしかないように思うんですよね。
問題2. ハッシュ値による存在証明プロセスの困難さ
実際にブロックチェーン上に登録されるのは楽曲ファイルをハッシュ化した文字列としてのハッシュ値になる。ハッシュ化について非常に簡単に説明しておくと、あるファイルをランダムな文字列に変換すること。
KENDRIX上の説明を引用するなら、ハッシュ値とは「ハッシュ関数にデータを入力すると得られる一定の桁数の値。同じデータであれば必ず同じハッシュ値,僅かでも異なるデータであれば全く異なるハッシュ値が得られる(https://kendrix.jp/faq)」という感じ。
音声も画像も動画もあらゆるものをランタナ文字列に変換できるという意味では正しいんだけど、もっと重要なこととしてハッシュ値は基本的に復号できないという点があると思っているんですよね。どういうことかというと、音源をランダムな文字列に変換することはできても、その文字列を音源に戻すことはできないっていう一方通行の構造なわけです(普通の関数、たとえばy=ax+bっていう一次関数は、xからyを計算するだけじゃなくて、yからxを計算することもできるけど、ハッシュ関数ではそれができない)。
だから、オンチェーン(ブロックチェーン上に放流された状態)になったハッシュ値から、それがどんな音源なのかを判別することはできないんですよね。
(もちろん、一方でブロックチェーン上という公共空間に商用楽曲の生ファイルが上がってると誰でも無料で元音源を取得できることになるという意味で大問題なので、何かしらの変換 = エンコーディングによって情報量を要約することは少なくとも必須になる)
ハッシュ化するってことは現状でブロックチェーン上にどんな楽曲が登録されているかは分からないっていうことはですよ、何が言いたいのかというと、この存在証明システムでは、ハッシュ値と一緒に元ファイルを完全に同じ状態で保持しておかないと何をハッシュ化したのかわからないという重篤な問題がある。使ってみてすぐ率直に思ったんだけど、単にハッシュ値を載せただけではなんの証明にもならないんじゃないか…? だって全然違うファイルのハッシュ値がオンチェーンになっていても復号できないから、それがNot Jealousなのかは検証のしようがないわけだし、本当に証明するためには登録した元データを聴きながらそれをハッシュ化しないと検証にならない気がする。
そうなると、対策として考えられることはそんなに多くはない。一つには、楽曲から特徴ベクトルを抽出してそのパラメーターをブロックチェーン上に登録しておくっていうのがあるんじゃないかと思ってるんですよね。特徴ベクトルをかなり大雑把に説明するなら「ゴールデンレトリバー」を「哺乳類、四本足、毛並みふかふか、比較的大型、黄色、人懐こい」みたいな特性パラメーターに分解して記述するわけだ。すると、同じように特徴ベクトルに変換されたオブジェクト(たとえばラブラドールレトリバー)との類似性を測ることができるようになる。
(実際はもっと大量のパラメーターがあって、たとえば今のChatGPTやGeminiの基盤の基盤として提案されたBERT-Largeというモデルでは、ひとつの単語を1024個の特徴ベクトルで表すことによって、全然違う単語でも似た意味を表すもの同士と認識できる。)
この方法なら、必ずしも元ファイルを保持しておく必要はなくなる。あるいは、自分の持っている楽曲ファイルのフォーマットやエンコードの方法、多少のアレンジによらずそれなりに一定の傾向を得ることができるから、多少ファイルが吹っ飛んだりちょっと構造を変えたりしたぐらいならブロックチェーン上の登録情報と類似した結果が得られるから、いつの時点でその楽曲を登録したのかの証明になるんじゃないかと思う。
問題3. ハッシュ値だから他の楽曲との比較ができない
今の問題2は自分の持っている楽曲ファイルとオンチェーン上の情報の比較の問題だったんだけど、その延長線上にあることとして、自分の楽曲とほぼ同じようなものが既に登録されているかどうかを調べる術がないという問題もある。
登録された存在証明に書かれたメタデータ(曲名、作曲者、作詞者)を頼りにする以外には調べようがない。別名義と別の名前でオンチェーンになってたらもうわからん。しかも音楽ストリーミングのプラットフォーム(SpotifyやApple Musicなど)から配信されている楽曲は各社で(特に音圧に関して)独自の加工やフォーマットの変換が行われているから、配信されているファイルをハッシュ化しても比較のしようがない。
これに関しても、オンチェーンにする情報をハッシュ値ではなく特徴ベクトルに変えることによって対応できるんじゃないかなーなんて思っている。特徴ベクトルで保持しておくということは、元の楽曲を厳密に復号することはできない状態でありながら最低限の参照はできるわけだから、既にブロックチェーン上に乗っている楽曲の特徴ベクトルを持ってくることによって、自分の曲と似たものが乗ってないことを調べられるんじゃないかな。
あるいは、たとえばSpotifyで配信されているある音源から同様に特徴抽出を行うことにより、ブロックチェーン上の音源との類似性を直接的に比較することができるようになる。そうすれば、Spotifyで配信されている楽曲のうち、ある一定以上の類似度を示した場合のみKENDRIXからボタンひとつでJASRACに配信停止などの要請ができて、そこから先は検証のための担当者がつくとかっていう形で違法配信の検出プロセスを効率化するとかいうようなメリットも出てくるんじゃないかな。
おわりに
まあこんな感じで、ほとんど専門の機械学習の話を中心に解決策を書いてしまったような気がするけど、テックによって音楽産業が良くなっていくこと(特に経済的な面での利益分配の精緻化や、違法アップロード等の対策の効率化)は本気で願っているし、その力になりたいとも思っています。