見出し画像

架空のシンガー生成過程(前文編)


はじめに:
本記事は、生成AI技術を用いて架空のシンガーを創り上げた過程をまとめた備忘録を、公開用に整えたものです。

「前文編」「本編」の二部構成です

「前文編」👈イマ ココ
 - 
生成AI技術に対する私の考え方や、大まかな制作手法、法的な問題の検討
本編
 - 音声生成AI及び歌声生成AIを用いてボーカル部分を作成した過程

 本記事の公開の目的は、「生成物が合法的であり、私の著作物であることを示すとともに、制作過程の透明性を保つ」ことです。How to記事ではないため、誤解された方がいらっしゃいましたら、ご容赦ください。



前文編・目次:




第1 生成AI技術に対する私の考え方

 創作活動に生成AI技術を用いることについての、私個人の考えです。

 MY ETHOS on generative AI technology
:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*
I, Yugi, employ generative AI technology in parts of my work as a homage to human wisdom and cultural advancement.
:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*
More Info:
*--∞- In adherence to existing laws, ethics, copyrights, and content guidelines, I warmly invite you to join me in experiencing the fragrance of a new civilization, much like the scent of flowers carried by the spring breeze, heralding the beginning of a new season.
*--∞- We are living through a period that future generations will likely learn about in their history classes as the "Intelligental Revolution", akin to the "Industrial Revolution" we know only from textbooks.
*--∞- Regardless of our varied perspectives on AI, it is a rare fortune to witness this monumental shift in civilization firsthand, not through books, as part of our own lives, feeling its impact with our own senses in real time, as true living beings.
*--∞- Thank you!

 翻訳したもの。

 生成AI技術に対する私の考え方
:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*
私、由木は、 人類の叡智と文明の進歩への深い敬意を込めて、一部の作品に生成AI技術を取り入れています。
:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*:*:.:*:.:*:.:*:.:*:.:*
詳細情報:
*--∞- 現行の法律、倫理、著作権およびコンテンツガイドラインを遵守しながら、新しい文明の香りを一緒に感じてください。それは、まるで春のそよ風が運ぶ花の気色、新しい季節の訪れを告げるものなのです。
*--∞- 私たちが「産業革命」を教科書で学んだように、未来の世代は、私達が今まさに生きている時代を、歴史の授業で「知性革命」と学ぶでしょう。
*--∞- AIに対する見解は人それぞれ異なるかもしれませんが、こうして教科書ではなく、私たちの生活の一部として、生身で、文明の転換を体験できることは、実に貴重な幸運であり、奇跡なのです。
*--∞- お読みくださり、ありがとうございます!

叙情的なのは「POLICY(方針)」ではなく「ETHOS(精神)」だから



第2 制作動機

1 なぜ架空シンガー?

 仕事をお休みしているのは、過日、X(旧ツイッター)で近況報告したとおりです。お薬の影響で脳がうまく働かないと、1日が長く感じられます。気分の乱高下も激しいです。

 それならば、どうせ何もできないのならば、かつて、技術的にも時間的にも叶わなかった夢に、挑戦してみようかな、と思ったのでした。

かつての平成の夢・・・・・・。

かつての菅野よう子女史にとっての坂本真綾ちゃんのような、
かつての梶浦由記女史にとってのKalafinaのような・・・・・・   .

 私の曲を歌うためだけに存在するシンガーがほしい・・・・・・。
   
令和最新版の技術を使えばできるかも・・・・・・。



2 VY1はどうなったの?

 (1) 技術的限界

 長年、YAMAHA社の「VOCALOID4 Library VY1V4」をメインに使用してきました。この「VY1V4」及び「VOCALOID4」には特別な機能があります。

● 4つの声質(Normal、Soft、Power、Natural)
● グロウル
● クロスシンセシス

クロスシンセシスとか 革新的だったね

 これに「VOCALOID4 Editor for Cubase」を組み合わせることで、自由度の高い理想的な合成音声を生成でき、多くの思い入れがありました。

 しかし、後継製品「VOCALOID5」ではこれらの機能が失われ、最新のVOCALOID6では「VY1」そのものが存在しなくなりました。

 さらに、「VOCALOID4」および「VOCALOID4 Editor for Cubase」は既に生産終了済みです。
 手でピッチを描く作業にも限界があるところ、最新技術の恩恵を受けられないうえ、いつサポートが終了するかわからない状況なのです。


 (2) キャラ付け的限界

 昨年秋、「VY1」は「A.I.VOICE VY Project」に進出し、「VY T-01号」としてスーツのお姉さんキャラが登場、キャラクター素材も配布されました。

 公式には「新シリーズです」「キャラクターは概念です」と説明されていますが、元々キャラクターのイメージが固定されていない自由なところが好きだった私にとって、ヒトガタを「概念」に留めるのは厳しいものがあり、スーツのお姉さんに私の曲を歌わせるイメージしか浮かばなくなりました。

 言うまでもなく、それは私の理想とは異なります。
 文化はいつだって、哀しい歴史を辿るもの。分かってはいるけれど、あんまり繰り返したくない。

 そこで、私だけの「サスティナブルな令和最新版シンガー」を、私自身で作ることを考え始めました。

 


第3 制作環境

1 制作環境

 (1)  PCスペック

   O  S:Windows 10 Home
   CPU:Intel(R) Core(TM) i7-6700 CPU @ 3.40GHz 3.40 GHz
   GPU:NVIDIA GeForce RTX 3060 12.0 GB
   RAM:32.0 GB

容量 1テラバイト の SSD も あるのぜ!

 数年前にドスパラで購入したBTOパソコンです。
 今や、テセウスの船と化しています。
 

 (2) その他スペック

 生成AI関係でいえば、「Python」や「git」等は一通りインストール済みの上、ローカル環境に「Stable-Diffusion-WebUI Forge」や「ComfyUI」を構築している程度の知識はあります。
 

 (3) 大切な余談

 使用予定はないものの、同じくローカル環境に Retrieval-based Voice Conversion(RVCv2)とそのWebUI も構築しています。これは以前、夢を実現させようと試行錯誤していた時期にインストールしたものです。

 当時、この「RVC」は最も革新的な AI ボイスチェンジャーでした。私も、ボイスバンク(学習済モデル)を自前で用意できる「VOCALO CHANGERになり得るとして、注目していました。

 ただ、「RVC」自体はクリーンな音声生成AIであるものの、オープンソースで使いやすいために、悪意あるユーザーが他人の声を不正に学習させたモデルを作成しやすい状況も生まれてしまいました。
 この不正使用の問題が、現在の声優の皆様によるNOMORE無断生成AIの運動につながったと記憶しています。

 以下で紹介する音声生成AI「Vocoflexは、こうした一連の状況を受け、不正利用防止措置を徹底しています。
 具体的には、購入時に写真付き公的身分証明書等による本人確認を行い、かつ、生成された音声に除去不能の特殊な波形を付与することで、不正利用者を特定できる仕組みを導入しています。

 インターネット上では画像生成AIの問題が取り上げられがちですが、音声生成AIにも同様に非常にシビアな問題が存在するのです。そのような中、こうして「Vocoflex」のように安心して使えるツールが登場することは、とても喜ばしいことだと思っています。


2 使用ツール

 (1) 架空のシンガー制作

 主に、次の二つの生成AIツールを使用します。

  • Vocoflex:理想の音声データを生成するためのツール

  • ACE Studio 理想の歌唱データを生成するためのツール


作業のイメージ

①「Vocoflex」で理想の音声データを創る。
② 私自身が歌い上げた自作曲のアカペラデータを用意する。
③アカペラデータを「Vocoflex」で理想の音声データに変換する。
③ 理想の音声によるアカペラデータを「ACE Studio」で学習させる。

②のせいで すごく 難易度 高い

 以下、それぞれのツールの簡単な説明です。

  ① Vocoflex 

 Synthesizer V で有名な Dreamtonics社 が令和6年7月に発売した、リアルタイム音声モーフィングプラグインです。

 音声を自在に加工したり、複数の音声を混ぜ合わせたり、音声ジェネレーション機能を用いて架空の音声を生成できたりリアルタイムでボイスチェンジできたりします。つよつよすぎるプラグインのため、上述のとおり不正利用防止のための様々な措置が講じられています。

 価格は、株式会社AHSのAHSダウンロードで31900円Dreamtonics Storeで$199.00(※日本語サポートなし)なので為替と英語力次第・・・・・・。

 詳しくは、私の愛読書・DTMステーションの記事をご覧ください。


  ② ACE Studio 

 TIMEDOMAIN社が令和6年8月に新たな機能を搭載してリリースしたAI歌声合成ソフトです。
 他社製の類似ソフトとは一線を画しており、自分専用のAI歌声モデル「カスタマイズAIシンガー」を作成できる点が大きな特徴です。
 アカペラデータをクラウド上で学習させ、「声」だけでなく「歌唱」や「歌い癖」まで学習したオリジナルシンガーを生成することができます。
 
 「Vocoflex」で理想の声を作り出すことは可能ですが、それだけでは歌わせることはできません。正確には、「他人」の歌声をボイスチェンジ機能で変換するしかないのです。
 実際、「Vocoflex」を利用して発表された楽曲には、「Vocoflex feat. Synthesizer V ●●●」のように、歌唱元となった既存のAIシンガーや人物名が併記されていることが多いように思います。

 多くの方はそれで満足かもしれませんが、私の場合、「オリジナルが別に存在するなんて・・・・・・」とか「こういう歌い方じゃないんだなぁ・・・・・・」といった、かなり面倒なジレンマに駆られてしまうのです。
 そんな悩みを「ACE Studio」が解決してくれるのです。

 詳しくは、愛読書・DTMステーションの記事をご覧ください。



 (2) その他の制作

 曲を投稿する際のサムネイル・イラスト等についてです。

 私は、理想の声を持ち、曲を歌ってもらいたいと思える架空の存在がほしいと考えています。
 それは自我や他人の影を一切持たない、純粋な架空の存在であるべきですが、私自身が前面に出たいわけではありません。
 一方で、「オリジナルのボーカロイドキャラクター」を設定して楽しみたいわけでもありません。

 このあたりの微妙なニュアンスを言語化するのは難しいのですが、架空のシンガーのビジュアルについては「黒髪で色白の可愛い子が、なんとなく歌ってくれたらいいな」という漠然とした気持ちしかありません。
 そのため、曲を投稿する際には、これまでと同様に、曲に合わせたサムネイル・イラストを用意したいと考えています。

 しかし、私は絵が得意ではなく、イラスト制作には相当な時間がかかります。限られたエネルギーをできるだけ曲作りに充てたいという思いもあり、今後はサムネイル・イラストに画像生成AIを活用したいと考えています。

 具体的には、以下の三つの画像生成AIツールを使用する予定です。

 以下、それぞれのツールの簡単な説明です。

  ① Stable Diffusion XL

 Stable Diffusionを開発するStability AI社による、約3世代前のモデルです。
後述する二つと比較してモデルのサイズが軽量のため、私のVRAM環境でもスムーズに生成ができることから、最も多く用いることになると思います。

 使用するモデルは、ツールと同時に開発者により公開され、追加学習が一切行われていないベースモデル「sd_xl_base_1.0」とVAE「sdxl_vae」のみです。


  ② Stable Diffusion 3.5

 Stable Diffusionを開発するStability AI社が令和6年10月末に発表した、現時点で最新の画像生成AIツールです。
 まだ「ComfyUI」に限りますが、既にローカル環境を構築しています。

 使用するモデルは、ツールと同時に開発者により公開され、追加学習が一切行われていないベースモデル「large」及び「medium」のみです。


  ③ FLUX.1

 Stable Diffusionの開発メンバーが設立したBlack Forest Labs社が令和6年8月に発表した、高品質な画像生成AIモデルです。
 Xの画像生成ツール「Grok」もFLUX.1を採用していると聞いています。
 高品質な分、必要なVRAM量も多いのですが、有志の方々が量子化(軽量化)を進めてくださったおかげで、ローカル環境の構築ができました。

 使用するモデルは、ツールと同時に開発者により公開され、追加学習が一切行われていないベースモデル「dev」をGGUF形式で量子化したもの(「flux1-dev-Q6_K.gguf」等)です。

ベースモデルのみを使用する理由について:
 次章第4に記載のとおり、現在公開されているファインチューニングモデルやマージモデルがすべて違法であるとは考えていません。追加学習の目的や過程を明確に記載している作成者も多く、問題なさそうなモデルも数多く存在します。
 ただし、画像生成AIのモデルは非常に奥深く、最新のものであるほどパラメータが複雑になり、現時点での私の深層学習に関する理解では、技術的な側面について、適切に説明することが難しいと感じています。
 そのため、単純に追加学習が一切施されておらず、現行法上合法とされている「ベースモデル」のみを使用するのが、私にとって無難な選択だと判断しました。

「LoRA(Low-Rank Adaptation)」モデルについて:
 
「LoRA」とは、特定のキャラクターや人物、画風などの特徴をAIモデルに覚えさせ一貫したビジュアルを再現するための手軽な追加学習ツールです。
 どの程度手軽かというと、私でも作れるほどです。
 しかし、その手軽さゆえに、第三者が作成・公開している「LoRA」には作成過程や意図が明確でないものも多く、現行法や倫理的問題に抵触するリスクがあります。
 そのため、「LoRA」を使用する場合は、私自身の著作物ないし私自身が適切に生成した生成物のみで作成された「自作LoRA」のみとします。




第4 法的な問題の検討

 生成AI技術の使用における著作権に関する法的な問題について、個人的な検討結果を記載しておきます。検討の過程は割愛し、代わりに文化庁のガイドラインの参考ページを付記しました。

 生成AI技術に関してさまざまな意見や議論が起こっていることは了知していますが、私は感情に左右されず、現行法を優先し、法を基準にすることで生成AI技術の利用における安定性や透明性を保ちたいと考えております。
 感情は現行法を変えるための原動力にはなり得ますが、それを理由に現行法を無視する行為は、法治国家においては望ましくないものと思料します。

 もちろん、今後の法改正や社会的変化があれば、それに応じて柔軟に検討を見直していくつもりです。なお、各ツールの利用規約はインストール時に確認済みのため、基本的に本記事では言及しません。

(余談)
 画像生成AIについて、「外国で訴訟になっているので、問題があるツールだ」とする見解をよく目にします。ですが、これは法的な検討には値しないため、ここで軽く、私見を述べるにとどめます。
 そもそも、紛争解決のために訴訟を提起することは、法治国家において当然の行為であり、国を問わず一般的です。刑事事件として有罪が確定しているわけでもない以上、単に民事訴訟の当事者になったという事実だけで『問題あり』と判断してしまうのは、裁判手続に対する偏った見方であります。
 仮にその考えを頭の中に留めるだけでなく、外部へ広く主張して問題提起するのであれば、名誉毀損のリスクを避けるためにも、少なくとも相手方が訴訟を起こした目的や原因、争点について、訴訟記録や信頼できる資料に基づいた調査をするべきでしょう。民事訴訟の背景は、通常とても複雑です。

アメリカの訴訟は 特に 利害関係が複雑に 絡み合っているね・・・・・・


1 参考にした資料

  • 令和6年10月1日現在の関連法令及び法制審議会の公開資料等

  • 同時点で発行されている著作権等についての専門書いくつか

  • 同時点で発出されている文化庁等の各ガイドライン


2 検討した結果

 主に、画像生成AIを使用する際の留意事項について、「モデルの選定時」と「生成AI技術で画像を出力する時(画像の生成時)」の二つの観点から、私なりに整理した個人的なメモを、検討結果として示します。
 今後は、このメモに基づいて各制作に取り組みたいと考えています。

 その前に・・・・・・。

免責事項

 本記事記載の検討内容は、現行法及び行政機関から発出された各種文書といった信頼性の高い資料に基づき、私、由木が、個人的な目的で整理したものです。

 本記事の執筆に際し、正確性の確保には最大限努めておりますが、個人の能力の限界から、法解釈の誤りや事実誤認が含まれる可能性があります。

 よって、本記事記載のいかなる検討内容に関しても、私、由木は、いかなる保証も行うものではありません。

 生成AI技術の法的な問題については、必ずご自身で一次資料をご参照のうえ、自己責任において慎重に検討するか、法律専門家にご相談ください。

 本記事の内容に関連して発生したいかなる不利益、損失及び損害についても、私、由木は一切の責任を負いません。

 本記事記載のコンテンツについては、検討内容を含む一切の文章・画像・動画などの転載および複製行為を禁止します。ただし、著作権法上の権利制限事由に該当する利用方法については、この限りではありません。

お堅いですけど 大事なことなので

 要するに、この記事の内容は私個人が自らの制作指針とするためだけに、他者との議論を経ないまま孤独に検討したものを、かなり簡素に整理した、極めて個人的なメモに過ぎないので、鵜呑みにしないで、拡散もしないで、気になる人は自分で資料にあたって確かめてね、というお願いです。


 (1) モデル選定時の留意事項

生成AI技術を利用するにあたってのモデル選定時の個人的留意事項(メモ)

 現行の著作権法には権利制限規定があり、一定の要件を満たす場合、利用者は権利者の許諾を得ずに著作物等を利用することができる。
(参考:「AIと著作権に関する考え方について」2(1)ウ / 5頁目)

 生成AIツール開発のための学習データとしての使用は、通常、著作物に表現された思想や感情の享受を目的としない利用であるため、同法第30条の4柱書により権利制限事由に該当し、利用の際に許諾を得る必要はない。
(参考:「AIと著作権に関する考え方について」2(1)ウ / 5頁目)

 ただし、学習データとしての使用に「享受」の目的が併存する場合、要件を満たさず、権利制限規定の適用はない。
(参考:「AIと著作権に関する考え方について」2(2)ウ / 10頁目)

 「享受」の目的が併存する例として、既存の学習済みモデルの学習データ内に含まれる著作物の創作的表現を意図的に出力させるため、当該著作物を過学習させる追加的学習が行われた場合、などが挙げられる。
(参考:「AIと著作権に関する考え方について」5(1)イ(イ) / 20頁目)
※ 
検索拡張生成AIにおける例もあるが、使用予定はないため、省略。

 よって、使用モデルの選定に際しては、追加的学習が施され権利制限の適用外となる違法モデルを避けるため、細心の注意を払って確認することが必要である。

 具体的には、著作物の権利者の許諾なしに当該著作物を出力させるための「ファインチューニング」を行っているモデルや同様のための「LoRA(Low-Rank Adaptation)」モデルは、違法モデルとみなし、使用しない。合法モデルと違法モデルをマージしたモデルについても、使用しない。

 合法モデルの例としては、①生成AIツールの初期公開と同時に開発者により公開されたベースモデル、②追加的学習はされているが、特定の著作物の意図的出力を目的としたものではないモデル、③自身の著作物または生成AIで出力した生成物や、パブリックドメイン等の公共に帰した権利的問題の存在しないデータ等を用いて追加的学習をされたモデルが考えらえる。

 絵柄や作風は現行の著作権法で保護される利益ではなく、アイデア等に類されるため同法の罰則規定の対象ではない。私人間の紛争として民法709条(不法行為責任)等に基づき処理される。
(参考:「AIと著作権に関する考え方について」5エ(イ) / 23・24頁目・同2(1)ア / 4頁目) 

 絵柄や作風に係る紛争を解決する現状唯一の手段は、「違法性の高い特定のモデルにより具体的な法益侵害を受けた」として訴訟を提起し、認容判決を得ることであるが、この手段は個人クリエイターにとって現実的ではない。このため、著作権法上の問題はなくとも、紛争を防ぐための道徳的配慮は欠かせないと考える。特に、生成AI技術が急速に広まり、他クリエイターへの尊重がより一層重要である局面において、生成AI技術に不安を抱くクリエイターの心情を傷つける行為は、倫理的に慎むべきである。

10 よって、いわゆる「絵柄LoRA」や「作風LoRA」の使用は通常問題ないが、その選定等には慎重を期すべきである。具体的には、特定のクリエイターの名を冠した「LoRA」や、明らかに特定のクリエイターの絵柄や作風を想起させる「LoRA」は使用しない、などの方策が考えられる。

11 また、共通した作風が一連の作品として評価されているクリエイターの場合、作風自体が著作物として認められ得ることに留意する。その場合、類似した作風を生成することは「享受」を目的とするものと認定され、権利制限事由に該当しない使用は著作権侵害とされる可能性がある。
(参考:「AIと著作権に関する考え方について」記載中5(1)イ(イ) / 21頁目)

 11 の「共通した作風による一連の作品群」について、資料には具体的な作品群までは例示されていませんでしたが、ジブリ作品がこれにあたるのかなと思いました。社会通念上「●●作品」と呼ばれがちなものだと解しました。


 (2) 画像出力時の留意事項

生成AI技術を利用するにあたっての画像出力時の個人的留意事項(メモ)

 生成AIツールを用いた生成行為や生成物の利用行為が既存の著作物の著作権侵害に該当するか否かは、AIを使用せずに行う創作活動と同様に考えられる。
(参考:「AIと著作権に関する考え方について」5(2)ア / 32頁目) 

 AIを使わない創作活動の場合、既存の著作物との「類似性」と「依拠性」の両方が認められると、著作権侵害に該当する(判例同旨・ 昭和50(オ)324 平成11(受)922)。生成AIによる生成物も、同様の基準で判断される。
(参考:「AIと著作権に関する考え方について」5(2)ア / 32頁目) 

 「依拠性」及び「類似性」の各定義は以下のとおりである。
依拠性:「既存の著作物に接し、それを自らの作品に取り入れること」
類似性:「既存の著作物の本質的な特徴を感得できること」
これらを基に、生成物が著作権侵害に該当するか判断される。
(参考:「文化庁令和6年度著作権セミナー『AIと著作権Ⅱ』講義資料」47頁目 / 「AIと著作権に関する考え方について」5(2)イ(ア) / 32頁目)

 生成物による著作権侵害を防ぐために、類似性については「既存の著作物の表現上の特徴を模倣しないこと」、依拠性については「プロンプトに著作物のタイトルを含めないこと」「Image to Image(i2i)機能に既存の著作物を使用しないこと」等のルールを課し、遵守することが重要である。
(参考:「AIと著作権に関する考え方について」5(2)イ(ア) ①/ 33頁目)

 自身が既存の著作物を意識していなくても、使用した生成AIツールが開発段階で当該著作物を学習している場合、客観的にアクセスがあったとみなされる。これにより偶然類似が生じても依拠性が推認され、著作権侵害とされる可能性があるため、モデル選定の際には、類似が生じ得る違法な過学習モデルを避けることが必須である。
(参考:「AIと著作権に関する考え方について」5(2)イ(ア) ①/ 33頁目)

 AIは法的な人格を持たないため、AI生成物が著作物とみなされる場合、その生成物の著作者はAI自身ではなく、当該AIを用いて創作した人となる。
(参考:「AIと著作権に関する考え方について」5(3)ア/ 39頁目)

 AI生成物が表現に至らない単なるアイデアに留まらず、著作物として保護を受けるためには、生成時における創作的な寄与の程度を総合的に判断する必要がある。
(参考:「AIと著作権に関する考え方について」5(3)イ/ 39頁目)

 著作物と認められるための具体的要素として、プロンプトの分量・内容や、生成を繰り返しながらプロンプトを修正した過程、生成物を思想や感情に基づいて選択した行為などが総合的に考慮される。
(参考:「AIと著作権に関する考え方について」5(3)イ①②③/ 40頁目)

 生成物を自身の著作物と主張し、無断転載などのトラブルを防ぐためには、生成の過程や創作的寄与の部分を記録しておくことが望ましい。

10 具体的な記録方法としては、日記やブログに生成過程をメモしておく、生成に使用したプロンプトを保存する、生成手順や試行内容をスクリーンショットで記録する、生成の各ステップにおける変更点や工夫点を簡単なメモとして残すなどの手段が考えられる。これにより、創作的寄与が明確に示され、著作物としての主張がより確実なものになる。

 手動で行ってはいけないとされていることは、AIでも行ってはいけない。手動で行ってよいとされていることは、AIでも行ってよい。ただし、AIには特有の事情があるため、手動のとき以上に取扱いに気を付ける必要がある。
 最も簡潔に言えば、そういうことになるのでしょう。


3 参考資料へのリンク

 (1) 関連法案

著作権法(昭和四十五年法律第四十八号)

著作権法施行令(昭和四十五年政令第三百三十五号)

著作権法施行規則(昭和四十五年文部省令第二十六号)


 生成AI技術の学習への利用云々(学習データとしての使用が、権利除外事由に該当するか否か)に係る条文を抜粋します。
 ちなみに、条文は著作権法第13条1号により、同法上の権利の目的とはならないため、こうして自由に転載できるのです。

第五款 著作権の制限
(著作物に表現された思想又は感情の享受を目的としない利用)
第三十条の四
 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
 一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
 二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
 三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合

著作権法(昭和四十五年法律第四十八号(令和六年法律第五十五号)

 改正同条が施行されたのは、平成31年1月1日からなので、念のために、改正前の旧同法同条も抜粋します。

(技術の開発又は実用化のための試験の用に供するための利用)
第三十条の四
 公表された著作物は、著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合には、その必要と認められる限度において、利用することができる。

著作権法(昭和四十五年法律第四十八号)(平成二十八年法律第百八号)

 
 短いですね。
 本条を拡充し、整理する方向で改正したということは、遅くとも平成末期時点の関係省庁の認識として、大深層学習時代の到来を把握・予期していたことが推察されます。

 同法施行令(政令)及び同規則(省令)のいずれも、同法同条への言及はありませんでしたが、代わりに文化庁が、ガイドラインを発出しています。

 この大改正時に発出された、「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方」という資料は、6年経つ現在でも踏襲され、随所で引用されています。古いから、といって捨て置かずに、一読することが推奨されます。

 (2) 文化庁の各ガイドライン

  ① ウェブサイト

トップページ

 特設ページはアドレスが変更される可能性があるので、一応掲載。

著作権全般についてのインデックスページ

AIと著作権についての特設ページ

 生成AIと著作権の関係に特化したページです。
 様々な資料が掲載されているほか、セミナーの開催案内があります。
 次に紹介する資料も、全てこちらに掲載されています。

  ② 文書資料(pdfファイル)


「デジタル化・ネットワーク化の進展に対応した 柔軟な権利制限規定に関する基本的な考え方」(文化庁著作権課:R1.10.24 発出)
https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/h30_hokaisei/pdf/r1406693_17.pdf 

 条解・改正著作権法(一問一答つき!) みたいな内容。

「AIと著作権に関する考え方について」(文化審議会著作権分科会法制度小委員会:R6.3.15 発出)https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/pdf/94037901_01.pdf 

 
前記の基本的な考え方を踏まえ、生成AI技術に的を絞った資料。
 当面の間、生成AI技術関係の諸問題は、本資料によって解釈することになるのでしょう。
 とはいえ、表紙に記載のとおり、本資料は、現状の考え方を整理し、周知するためのものであって、確定的な法的評価を行うものではないことに注意が必要です。


文化庁著作権課:R6.7.31
「AIと著作権に関するチェックリスト&ガイダンス」(文化庁著作権課:R6.7.31 発出)
https://www.bunka.go.jp/seisaku/chosakuken/pdf/94097701_01.pdf 

 前記各資料をベースとした、民草向けのパワポ資料です。要点を抑えているので、これだけでも大丈夫かな。
 本パワポ資料を教科書、前記各資料を参考書、という位置づけで適宜参照すれば、致命的な紛争は避けられるものと思料します。
 


4 各資料の一部引用

 生成AI技術の法的問題について検討する際には最低限把握しておくべきだと感じた部分等を、著作権法第32条1項により一部引用します。

 (1) デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方

  ① 「享受」という用語の定義

問6
著作物に表現された思想又は感情を「享受」するとはどのような意味か。

「享受」とは,一般的には「精神的にすぐれたものや物質上の利益などを,受け入れ味わいたのしむこと」を意味することとされており,ある行為が法第30条の4に規定する「著作物に表現された思想又は感情」の「享受」を目的とする行為に該当するか否かは,同条の立法趣旨及び「享受」の一般的な語義を踏まえ,著作物等の視聴等を通じて,視聴者等の知的・精神的欲求を満たすという効用を得ることに向けられた行為であるか否かという観点から判断されることとなるものと考えられる。

「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方」(文化庁著作権課 R1.10.24 発出)より

 まずは条文を抑える。その次に、用語の定義を抑える。基本姿勢ですね。

  ②「享受」を目的としない行為の具体例

問7
著作物に表現された思想又は感情の「享受」を目的としない行為とは具体的にどのような行為か。また、主たる目的は著作物に表現された思想又は感情の「享受」ではないものの,同時に「享受」の目的もあるような利用を行う場合は,本条の権利制限の対象となるか。

(中略)
「享受」を目的とする行為に該当するか否かの認定に当たっては,行為者の主観に関する主張のほか,利用行為の態様や利用に至る経緯等の客観的・外形的な状況も含めて総合的に考慮されることとなる。

(著作物に表現された思想又は感情の「享受」を目的としない行為の具体例について)
例えば,
・人工知能の開発に関し人工知能が学習するためのデータの収集行為,人工知能の開発 を行う第三者への学習用データの提供行為(問11参照)
(中略)
については,著作物の視聴等を通じて,視聴者等の知的・精神的欲求を満たすという効用 を得ることに向けられた行為ではないものと考えられることから,「著作物に表現された 思想又は感情」の「享受」を目的としない行為であると考えられる
(中略)

(同時に「享受」の目的もあるような利用を行う場合について)
法第30条の4では「享受」の目的がないことが要件とされているため,仮に主たる目的 が「享受」ではないとしても,同時に「享受」の目的もあるような場合には,本条の適用 はないものと考えられる。
(中略)
また,漫画の作画技術を身につけさせることを目的として,民間のカルチャー教室等で手本とすべき著名な漫画を複製して受講者に参考とさせるために配布したり,購入した漫画を手本にして受講者が模写したり,模写した作品をスクリーンに映してその出来映えを吟味してみたりするといった行為については,たとえその主たる目的が作画技術を身につける点にあると称したとしても,一般的に同時に「享受」の目的もあると認められることから,法第 30条の4は適用されないものと考えられる。

「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方」
(文化庁著作権課 R1.10.24 発出)より

 後半の「享受」目的ありの例が興味深かったです。
 これって、漫画研究会みたいな有志の集まりで、研究ないし作画技術向上のために模写用としてお金を出し合って漫画を買って回すみたいな行為等も享受目的ありと認定されうるという理解でよろしいのでしょうかね。
 確かに、音楽でいえば「JASRAC」の徴収基準もそんな感じか。漫画には「JASRAC」みたいな機関がないから、見逃されているだけなのかも。

  ③ 権利除外が適用されない場合にあたるか否かの判断基準

問9
法第30条の4ただし書の「…著作権者の利益を不当に害することとなる場合」に当たるか否かはどのように判断されるか。

法第30条の4ただし書では,「著作権者の利益を不当に害することとなる場合」には,権利制限が適用されないことを定めているところ,当該場合に該当するか否かは,同様の ただし書を置いている他の権利制限規定(法第35条第1項等)と同様に,著作権者の著作物の利用市場と衝突するか,あるいは将来における著作物の潜在的市場を阻害するかという観点から判断されることになる。具体的な判断は最終的に司法の場でなされるものであるが,例えば,大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物が販売されている場合に,当該データベースを情報解析目的で複製等する行為は,当該データベースの販売に関する市場と衝突するものとして「著作権者の利益を不当に害することとなる場合」に該当するものと考えられる。

「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方」(文化庁著作権課 R1.10.24 発出)より

 当時は、ここまでの生成技術が民草に広がっていなかったので、具体例もデータベースそれ自体の売買関係のみですね。いずれにせよ、判断は司法府が行うわけなので、あまり行政府が深入りできない領域であるのでしょう。

  ④ AIの学習データの収集等の法的解釈について

問11
人工知能の開発に関し,人工知能が学習するためのデータの収集行為,人工知能の開発を行う第三者への学習用データの提供行為は,それぞれ権利制限の対象となるか。

著作権法の目的は,通常の著作物の利用市場である,人間が著作物の表現を「享受」することに対する対価回収の機会を確保することにあると考えられることから,法第30条の4における「享受」は人が主体となることを念頭に置いて規定しており,人工知能が学習 するために著作物を読む等することは,法第30条の4の「著作物に表現された思想又は感情を享受」することには当たらないことを前提としている。

したがって,人工知能の開発のための学習用データとして著作物をデータベースに記録する行為は,「著作物に表現された思想又は感情を享受」することを目的としない行為に当たり,法第30条の4による権利制限の対象となるものと考えられる。
また,収集した学習用データを第三者に提供する行為についても,当該学習用データの利用が人工知能の開発という目的に限定されている限りは,「著作物に表現された思想又は感情を享受」することを目的としない著作物の利用に該当し,法第30条の4による権利制限の対象となるものと考えられる。
通常は,人工知能が学習用データを学習する行為は,「情報解析」すなわち「…大量の情報から,当該情報を構成する…要素に係る情報を抽出し,…解析を行うこと」に当たると考えられることから,いずれの行為も第2号に当たるものと考えられる。

なお,旧第47条の7においては「情報解析」を「多数の著作物その他の大量の情報から,当該情報を構成する言語,音,影像その他の要素に係る情報を抽出し,比較,分類その他の統計的な....解析を行うこと」と定義されていたところ,時代の変化に応じて様々な解析が想定し得る状況となっていることを踏まえ,情報解析の定義のうち「統計的な」との限定を削除している。これにより,例えば,深層学習(ディープラーニング)の方法による人 工知能の開発のための学習用データとして著作物をデータベースに記録するような場合も権利制限の対象となるものと考えられる。

「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方」(文化庁著作権課 R1.10.24 発出)より

 膨大なデータを許諾なく集めたものが、どのような建付けで整理されているのか。刑法分野における常識「機械は欺けない」を連想しました。
 機械は欺けないし、なにかを味わい、楽しむこともできない。哀しいね。

 (2) AIと著作権に関する考え方について

 一気に時代が6年飛んで、有識者を交えた委員会の資料です。

  ① 諸問題の検討区分

(ウ)開発・学習段階における著作物の利用行為
○ 生成AIとの関係において著作物が利用される場面を概観すると、大きく「開発・学習段階」と「生成・利用段階」に分けられる。

「AIと著作権に関する考え方について」
(文化審議会著作権分科会法制度小委員会 R6.3.15 発出)より

 生成AI問題を論じる場合、段階を分けて検討する必要があるという示唆。この点、確かに本問題は関わる人間やデータが膨大ですから、うっかり混乱しがち。「開発・学習する主体及びその動機」と「生成・利用する主体及びその動機」が全く異なることも、ついつい忘れがちです。

  ② 「開発・学習段階」における更なる区分

○ このうち、開発・学習段階においては、AI(学習済みモデル)作成のための学習や、生成 AI を用いたソフトウェア又はサービスの開発に伴って、次のような場面で著作物の利用 行為が生じることが想定される。
 ➢ AI 学習用データセット構築のための学習データの収集・加工
 ➢ 基盤モデル作成に向けた事前学習
 ➢ 既存の学習済みモデルに対する追加的な学習
 ➢ 検索拡張生成(RAG)等において、生成 AI への指示・入力に用いる
  ためのデータベ ースの作成

「AIと著作権に関する考え方について」
(文化審議会著作権分科会法制度小委員会 R6.3.15 発出)より
(注:添付の図は省略)

 先ほど二段階に分けた分類を、さらに細分化するもの。「学習データの収集・加工」や「事前学習」の2つについては、早速、前記「基本的な考え方について」記載の6年前の内容を踏襲しています。

  ③ 既存の学習済みモデルに対する「著作物」の追加学習

○ 上記ア(ウ)に示したような生成 AI の開発・学習段階における著作物の利用行為における、享受目的が併存すると評価される場合について、具体的には以下のような場合が想定される。
 ➢ 既存の学習済みモデルに対する追加的な学習(そのために行う学習
  データの収集・加工を含む)のうち、意図的に、学習データに含ま
  れる著作物の創作的表現の全部又は一部を出力させることを目的と
  した追加的な学習を行うため、著作物の複製等を行う場合

  (例)AI 開発事業者又はAI サービス提供事業者が、AI 学習に際して、
     いわゆる 「過学習」(overfitting)を意図的に行う場合
 ➢ 既存のデータベースやインターネット上に掲載されたデータに含ま
  れる著作物の創作的表現の全部又は一部を、生成AIを用いて出力させ
  ることを目的として、これに用いるため著作物の内容をベクトルに変
  換したデータベースを作成する等の、著作物の複製等を行う場合
  
(具体例については後掲(1)ウを参照)。

「AIと著作権に関する考え方について」
(文化審議会著作権分科会法制度小委員会 R6.3.15 発出)より

 現状、このあたりが主として問題にされていますね。
 無作為に学習したはずの基盤モデルに対し、感情あふるる人間が、恣意的に学習データを選別するわけなので、同じ建付けがとおる筈がない。

 本記事第3-1(3)の余談で述べた、「RVC」や声優の皆様による「NOMORE無断生成AI」運動も、追加学習を問題視しています(声等は、著作権法上の著作物以前に、民法ないし憲法上の人格的利益の侵害の話になりそう)。
 
 前者は、学習済みモデルに対して、意図的に他者の著作物を出力させるためのファインチューニングを施したり、出力できるように「LoRA」を作成する目的で著作物の複製(データの収集や加工を含む)をするのは、アウトですよ、ということ。
 細かい記載ぶりからみるに、著作物ではないキャラクターや、創作性に乏しい没個性的な絵柄の追加学習は問題ないと反対解釈できるか。

 後者は、いわゆる「検索拡張生成AI」の開発・学習段階の話ですね。
 既存のデータベースやインターネット上のデータをベクトル変換したデータベースを作成する際に、ある著作物の創作的表現の全部又は一部を生成AIを用いて出力させることを目的として、当該著作物をベクトル変換してデータベースを作成する場合における当該著作物の利用がどうのこうの、今回は全く関係ないですね。
 ベクトル変換とは、多分ですが、コンピューターとお話しやすくするためにデータを数値化したりみたいな技術のことだと思います。


  ④ 既存の学習済みモデルに対する「絵柄や作風」の追加学習

○ これに対して、「学習データに含まれる著作物の創作的表現の全部又は一部を出力させる意図までは有していないが、少量の学習データを用いて、学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行うため、著作物の複製等を行う場合」に関しては、具体的事案に応じて、学習データの著作物の創作的表現を直接感得できる生成物を出力することが目的であると評価される場合は、享受目的が併存すると考えられる。
 他方で、学習データの著作物の創作的表現を直接感得できる生成物を出力することが目的であるとは評価されない場合は、享受目的が併存しないと考えられる。

○ 近時は、特定のクリエイターの作品である少量の著作物のみを学習データとして追加的な学習を行うことで、当該作品群の影響を強く受けた生成物を生成することを可能とする行為が行われており、このような行為によって特定のクリエイターの、いわゆる「作風」を容易に模倣できてしまうといった点に対する懸念も示されている。
 この点に関して、いわゆる「作風」は、これをアイデアにとどまるものと考えると、上記2.(1)アのとおり、「作風」が共通すること自体は著作権侵害となるものではない

 他方で、アイデアと創作的表現との区別は、具体的事案に応じてケースバイケースで判断されるものであるところ、生成AI の開発・学習段階においては、このような特定のクリエイターの作品である少量の著作物のみからなる作品群は、表現に至らないアイデアのレベルにおいて、当該クリエイターのいわゆる「作風」を共通して有しているにとどまらず、創作的表現が共通する作品群となっている場合もあると考えられる。

 このような場合に、意図的に、当該創作的表現の全部又は一部を生成AIによって出力させることを目的とした追加的な学習を行うため、当該作品群の複製等を行うような場合は、享受目的が併存すると考えられる。
 また、生成・利用段階においては、当該生成物が、表現に至らないアイデアのレベルにおいて、当該作品群のいわゆる「作風」と共通しているにとどまらず、表現のレベルにおいても、当該生成物に、当該作品群の創作的表現が直接感得できる場合、当該生成物の 生成及び利用は著作権侵害に当たり得ると考えられる。

「AIと著作権に関する考え方について」
(文化審議会著作権分科会法制度小委員会 R6.3.15 発出)より

 中段部分の「懸念」に対して私が懸念を抱いていることとして・・・・・・。

 作風や絵柄も著作物として保護されるべきだとする論調は、かなり昔からありますが、個人的にはそれらを単なるアイデアとみなし原則として著作権上の保護は不要だとするのが相当と思料します。
 なぜなら、仮に作風や絵柄が保護対象とされた場合、没個性的な私のような者にとっては表現活動が制限されてしまうからです。
 実際、大多数の個人も、作風や絵柄が特定の権利として扱われたら、萎縮し、気軽に表現活動ができなくなるのではないかと思います。
 憲法上保障されている「罪刑法定主義」及び「表現の自由」が同時に揺らいでしまうのは明らかです
 それにもかかわらず、作風や絵柄も保護するべきとする意見が、表現活動を主として行っている作家間で主流のように見えるのはなぜなのか・・・・・・。

 生成AI技術への漠然とした不安感等を逆手にとった何者かに扇動されて、大切な自由を失う羽目に陥るのは、悪法もまた法なりと言えども、ちょっと嫌ですね。

ではここで一曲。


  ⑤ 「開発・学習段階」における「享受」目的の評価時期

○ なお、開発・学習段階における享受目的の有無については、開発・学習段階における利用行為の時点でどのような目的を有していたと評価されるかが問題となることから、生成・利用段階において、AIが学習した著作物と創作的表現が共通した生成物が生成される事例があったとしても、通常、このような事実のみをもって開発・学習段階における享受目的の存在を推認することまではできず、法第30条の4の適用は直ちに否定されるものではないと考えられる。
他方で、生成・利用段階において、学習された著作物と創作的表現が共通した生成物の生成が著しく頻発するといった事情は、開発・学習段階における享受目的の存在を推認する上での一要素となり得ると考えられる。

「AIと著作権に関する考え方について」
(文化審議会著作権分科会法制度小委員会 R6.3.15 発出)より

 享受目的「あり」とするための主張と立証、事実認定、難しいね。

 「どうしても〇〇っていう既存のキャラを出したい!」と利用者が勝手にプロンプトを工夫しただけであれば、基盤モデルやその開発者が悪者になるわけじゃない、という趣旨のなお書まで、ご丁寧についていました。

 なお、学習された著作物と創作的表現が共通した生成物の生成が頻発したとしても、これが、生成 AI の利用者が既存の著作物の類似物の生成を意図して生成AIに入力・指示を与えたこと等に起因するものである場合は、このような事情があったとしても、AI 学習を行った事業者の享受目的の存在を推認させる要素とはならないと考えられる(後掲(2)キも参照)。

「AIと著作権に関する考え方について」
(文化審議会著作権分科会法制度小委員会 R6.3.15 発出)より

 本条に関する控訴審は、普通に全部、知財高裁でやってほしい。


 きりがありませんので、引用はこの辺にしておきますが、いずれも過渡期ならではの興味深い資料でした。
 現在の大生成AI技術時代においては、これらは必読・必携の書と言っても過言ではなく、日本語が読める方全員に一読をお勧めしたいくらいです。

 特に生成AI技術を利用する方にはもちろん、反対の立場であっても、今の法的な状況を理解せずには、適切に意見を述べることは難しいでしょう。

 感情というパワーはとても貴重であると、心身を病んで以降、改めて強く感じています。
 そのような貴重なパワーを無駄にしないために、生成AI技術に思うところがあり、まだ資料をお読みでない方には、是非とも目を通していただきたいなと、勝手ながら願っています。




第5 結語


 いろいろ見てはきましたが、当然、合法だったら何をしてもよいわけでは決してないので、多方面への配慮を忘れずに、慎重に慎重を期して・・・・・・

訴状を確認していないので、コメントは差し控えさせていただきます

なんてセリフを行使する羽目にならないように・・・・・・

 冒頭の「生成AI技術に対する私の考え方」記載のとおり、令和最新の文化を謳歌して参りたいと思います。私はただ「現代を楽しんでから死にたい」という、単純にそれだけの理由で、生成AI技術を各制作活動に使用します。




前文編・終わり

本編へ続く・・・・・・


いいなと思ったら応援しよう!