弱きAI情報発信者が斬る生成AI(画像生成AI)
2024年8月18日。
アスキー(ASCII)さんのとある記事が気になったので、X(旧Twitter)に投稿しました。
私自身の思いの丈というか、思うところを簡潔にリプしたこちらの件。
記事の内容的には
米連邦地方裁判所で、生成AIを用いた画像の著作権に関する判断が8月12日に下されました。訴訟は「Stable Diffusion」や「Midjourney」など4社に対し、アーティストのKarla Ortiz氏らが、自分たちの作品が無断で学習に使用されたとして著作権侵害を主張
↓
原告側は、学習に使われた画像が著作権で保護されており、その無断使用は著作権侵害にあたると主張しました。また、被告企業が不当な利益を得ていることや、デジタルミレニアム著作権法(DMCA)違反も訴えた
↓
しかし、裁判所はDMCA違反と不当利得の訴えを棄却、一方で、著作権侵害の訴えについては審理を続行する判断を下した
というもので、その判決は、AIによる画像生成と著作権の関係について重要な問題を含んでおり、今後の司法判断が注目だなと、個人的に思いました。
ここから、投稿のリプと重複しますが
生成AIの利用に関して明確なルールが必要です。
画像生成AIに限ってみても、特にアーティストの名前や特定の作品名を禁止ワードとして設定することで、無断利用を防ぐ一歩となる、と考えています。
アーティストの名前や作品名を禁止ワードとする措置は、倫理的なAI利用を促進するための重要な手段となります。
日本のようにAI美少女画像・イラストの生成が盛んな国では、盗作や確信犯的なパクリが問題となることがあり、個々の趣味や商業利用を考えている人々にとっても、画像生成AIにおける明確なルールの制定が必要とされていることは同意する、という方は少なくないのでは?(特にいわゆる反AI層の方々なんかは)
画像生成AI・Midjourneyのようなプラットフォームが、禁止プロンプトを公表せずに厳格なフィルタリングを行っていることは、悪用を防ぐための合理的な措置と考えられますが、ユーザーにとっては透明性の欠如を感じるかもしれません。
尤も、Midjourneyについて言えば、MITテクノロジーレビューさんの取材で2023年時点で次のような禁止事項が明らかとなっています。
ただ、冷静にというか、一般的な倫理観を持ち合わせているユーザーであれば、こういった禁止ワード、画像生成時のプロンプトにおけるNGワードに対して「そりゃそうですよね」「でしょうな」と、納得するものかと思います。
手前味噌ですみませんが、私のサイト「はじめての生成AI比較.com」は、わりと早い段階から着手した自負があります。
ただ、生成AIの進化は思ったより何倍も速く、サービス・ツール自体のUI等がマイナー/メジャーアップデートの兼ね合いもありつつで、結構変わりがちです。
つまり、”サイト泣かせ”な面があり、なかなか上手く新規更新が出来ずです。
また、生成AIの進化が凄まじく速いことは、それこそ日本における生成AIの明確なルール制定もままならない理由でもあります。
AIや生成AIに関する明確なルールや規制は、各国や地域で議論は進んでいるものの、技術の進化が非常に速いため、法整備やガイドラインが追いついていないということです。
私自身、いわゆる反AI層、生成AI、例えば画像生成AIに批判的・懐疑的な方々の思いはわかるつもりです。
だって、ちゃんとルールがない画像生成AIで平然とパクってAI画像生成してドヤ顔してる人間も一部いますから。
いや、画像生成AI自体が学習データ・トレーニングと称して、いろんな画像や著名アーティストの作品等を無断盗用してるだろ!?
と言われてしまったら、そもそも論ではあるのですが…。
でもホント、こと画像生成AIにおける明確なルールが制定されていないからこそ、いろんな問題が起こるわけですよね。
「画像生成AIの台頭によって仕事を奪われてしまうかもしれない」
「勝手に自分の画風や作品が盗作された」
といった問題は、画像生成AIでの画像生成時におけるテキストプロンプトの禁止ワード/NGワード規制があるだけでも変わってくるかと思います。
私としても画像生成AIにおける明確なルール制定は、一刻も早く形になってほしいです。
というのも、例えば↓の画像
このAI画像は、画像生成AI「にじジャーニー(nijijouney)」で、私が考えたプロンプト入力から生成されたAI画像です。
プロンプトは以下
A beautiful girl with a side-tail. Clear and detailed depiction of every detail. Vector drawing. Impeccably calculated angles and composition,--style raw
こういう画像をSNS等にアップした際、「〇〇っぽい」「〇〇のパクリじゃないか」という声が上がります。
※↑の画像生成プロンプトに嘘偽りなく、にじジャーニー・Midjouneyでの生成画像はサイトに”いつ、どんなプロンプトで生成した画像なのか”データが残ります
大体この、、何といいますか、2Dアニメ調のデジタルアート風の画像で多いのは「kyneさんっぽい」と批評・揶揄されがちです。(いやいや、これじゃ全然kyneさんっぽくなんかないよ、と言われたらそれは単純に喜ばしいこと)
私自身、kyneさんの絵・スタイルは好きですし、おおよそどうでもいいことまで言うと、kyneさんの奥さんの共通の知り合いがいたりもします。
著名でも、関節的に知ってるから、パクるのをよそう、盗用は止めよう、ということを言ってるわけじゃないです。
著名度に限らず、私はAI画像生成のポリシーとして、一般的に名の通っているアーティストさんや、その関連作品等はプロンプトに含めない、と決めています。
生成結果がたまたま「誰々っぽい」となってしまうのは致し方ないところだとも思っています。
明確なルールがないと、困るのはアーティストさん達だけではなく、明確なルールがないと、AI画像生成を楽しんでいる普通のユーザーが不必要に批判を受けることがあります。(あるかと思います)
特に2Dアニメイラストやポップアートのようなスタイルでは、簡単に「〇〇さんのパクリだ」と言われがちで、それが純粋に楽しんでいる人にとって大なり小なり、ストレスになります。
著名なアーティストや作品名をプロンプトに含めることを禁止するルールがあれば、こうした問題も減少するでしょう。
そうしたルールが困るというユーザーがいるとすれば、それはプロンプトエンジニアリングのスキルがまだ不十分なだけかもしれません。
画像生成AIにおけるプロンプトエンジニアリングとは、AIが生成する画像の内容やスタイルを制御するために、適切なプロンプト(指示文)を作成・調整する技術や方法のことを指します。
プロンプトエンジニアリングは、生成される画像のクオリティや具体性に大きな影響を与える重要な要素だと考えています。
※ChatGPT等のLLM(大規模言語モデル)におけるプロンプトエンジニアリングも重要で、意図した応答や情報を引き出すために効果的なプロンプト(入力文)を作成・調整する技術や方法を指します
AI技術が進化し、サービスやツールが淘汰される過程で、ユーザーもまた適応していく必要があると思っています。
どの分野でも、進化についていけない者は淘汰されるというのは、厳しいですが現実的な側面もありますから。
ただ、「〇〇っぽい」という批評は、音楽や他のクリエイティブな分野でもよく見られるものですし、特にAI画像の場合、プロンプト自体にライセンスがないために、誰が先にそれを使って出したかで有利になることもあります。
これがAI画像生成における難しい点でもあります。
今後、画像生成AIのルールが整備されると、次はプロンプト自体を守るための権利やルールの整備が求められるかもしれません。
プロンプトエンジニアリングも重要なスキルであり、その成果を適切に保護する仕組みが必要になる可能性があります。(あくまで可能性)
AI技術の発展に伴い、クリエイティブな分野全体が大きく変わるかもしれません。
現状、(↑の画像のように)そのスタイルや画風の第一人者がすでにいる場合、後から似た作品が出てくると「〇〇っぽい」と言われるのは避けられない部分があります。
クリエイティブな表現には独自性が重要視されるので、誰かが先に確立したスタイルに似ているとどうしても比較されてしまいます。
それでも、そこから新しい表現を生み出すことができれば、それもまた一つのクリエイティブな挑戦と言えるかもしれません。
また、すべてのクリエイティブな表現は、何かしらの「系譜」に連なっているものです。
過去の作品やスタイルを参考にしつつ、それを基に新しいものを生み出していくことがクリエイターの役割でもあるのかなと。
そうしたプロセスを通じて、完全に新しいものが生まれることもありますし、既存のスタイルに新たな視点や要素を加えることで、独自性を持つ作品が生まれることもあります。
クリエイティブな世界では、既存のものを踏まえつつも、それをどう超えていくかが大切です。
最後に、↑画像において、「こんな画像出してるから〇〇っぽいなんて言われるんだよ」と感じた方がいましたら、私について語らせて下さい。(ここまでも誰やねん状態の中、無駄に語ってすみません)
私の画像生成AIにおけるポリシー的なことは上述した通りですが、画風・スタイルに固定はなく、実写系もアニメ系も、今はとにかくオールジャンルの画をプロンプトエンジニアリングによって出せるように勤しんでいます。
そもそも、何処の馬の骨かもわからない私が画風やスタイルを固定して、「木村といえばこのスタイル」なんて有り得ませんし、そういった意味でもプロンプトを磨いて、出せない画はない、というところまで、画像生成AIを使いこなしたいと考えています。
AIや画像生成AIの技術自体は素晴らしいですが、それをどう使いこなすか、どう活用するかは最終的には人間のスキルにかかっています。
AIがどんなに進化しても、それを最大限に引き出し、創造的に活用できるのはやはり人間の力です。
だからこそ、プロンプトエンジニアリングやAIツールの理解がますます重要になってくると思い、日々AIと向き合っています。
…と、こうした問題や課題がクリアになることで、生成AIや画像生成AIの利用が、よりクリエイティブで公正なものになり、技術の進化とともに健全な発展を遂げていくことを願っています。
明確なルールが制定されることで、クリエイターもユーザーも、そしてAI自体も、そのポテンシャルを最大限に活かすことができる未来が訪れることを期待しています。
きれいごとみたいに綴っていますが、実際にはまだ多くの課題が山積みです。
それでも、例えば画像生成AIやChatGPT等を安心して有意義に利用するためにも、まずは一歩ずつ前進し、少しでも建設的な方向へ進んでいくことが大事だと考えています。