画像生成AI トレンド年表 その1:年表の解説編(Miro公開)
はじめに
こんにちわ、デザイナーのU1です。
近年の画像生成AIの進化は凄まじく、いちクリエイターとして非常に危機感を抱いています。特にこの1年は、非常に多くの社会的/技術的なトレンドが生まれました。皆さんも個々には把握されている内容だとは思いますが、全体を俯瞰して潮流を捉える必要があると感じ、「一個人として、画像生成AIトレンド年表を作って発信しよう」と思い至りました。この記事では、その内容をご紹介させて頂きます。
画像生成AIとは
画像生成AIとは、データを入力することでAIが自動的に画像を生成する技術です。例えば、「猫が犬を見ている様子」をテキストで入力すると、AIがその情報に基づいて自動的に画像を生成することが可能です。
近年、敵対的生成ネットワーク(GAN)、変分オートエンコーダー(VAE) などの技術を用いることで、質の高い画像を生成することが可能になりました。
3つのトレンド
ここからは、時系列に沿ってトレンドにつながる具体的な事例をご紹介させて頂きます。
トレンド1: AI画像生成ツールの普及
2022年7月、Midjourney社が「Midjourney」、OpenAI社が「DALL-E 2」をリリースしました。これらはSNSで話題になり、TIPSなどの投稿が流行しました。AIが生成した画像の活用法が模索され、テストとして投稿されたAIマンガ「サーバーパンク桃太郎」に注目が集まりました。
2022年8月、Stability AI社が「Stable Diffusion」を一般向けにリリースしました。ウェブサイトでテキストを入力するだけで、無料で画像が生成することが可能となりました。また、生成した画像は基本的には商用・非商用を問わず、自由に利用できるというライセンスも大きな話題となり、一般の人々も画像生成技術に興味を持ち始めました。オープンソース化したことで、様々なアプリやモデル、開発環境に派生するきかっけになりました。
2022年9月、「Midjourney」を使って制作したデジタルアートがコロラド州の美術コンテストで優勝作品に選ばれました。AIが質の高い作品を生み出せるのか、そして芸術家とは何かという論争が巻き起こりました。日本ではイラストレーターの個性を学ぶサービス「mimic」がβ版をリリースされ、これもまた物議をかもしました。
トレンド2 : 学習方法の多様化
2022年10月、Anlatan社が「NovelAI Diffusion」のサービスを開始しました。日本の漫画・アニメ作品に登場するような2次元キャラクターがハイクオリティで生成されると話題になりました。ユーザーの間では、テキストから画像を生成する際に入力する文字列(プロンプト)のことを“呪文”と呼ばれており、中国語圏コミュニティがまとめた“呪文”の研究文書「元素法典」が話題になりました。
2022年11月、「Midjourney」がremix機能を実装しました。2枚の画像を混ぜることが可能になりました。Midjourneyで生成された画像にはseed値が設定されており、同じ画風で微調整を行うことも可能になっています。
2022年12月、「StableDiffusion」でLoRA(Low-Rank Adaption)が登場しました。LoRAとは「再現したいキャラクター」の画像を複数枚集め、使用したいモデルデータに対して追加で情報を与えて学習させることで、プロンプト1つでその特徴を簡単に呼び出すことが可能です。特定の画像の再現性が高まったことで、バリエーションが生み出すことが可能となり、AI画像生成の活用の幅が広がることになりました。
Stable Diffusionのローカル環境の構築が普及しました。そして、モデルファイルを共有するウェブサイト「Civitai」が話題となりました。基本的にユーザー登録不要で、無料でダウンロード利用できます。これらのLoRAファイルの配布により、さらなる絵柄無断学習が問題となりました。
トレンド3 : 著作権・肖像権からの反発
2023年2月、アメリカ合衆国著作権局が「Midjourney」で生成したクリス・カシュタノバ氏の漫画『Zarya of the Dawn』内のイラストについて、彼女に著作権は認められないという見解を示しました。「Midjourney」がどんなイラストを生成するかユーザーが予測できない点をもって、他の創作ツールの著作権法上の扱いと異なると説明されました。
2023年3月、「Midjourney V5」を利用し、偽の「トランプ前大統領が逮捕された」画像を生成した人物が利用禁止処分を受けました。2023年3月16日にリリースした「Midjourney V5」はまるで実写のような超高画質の画像を生成することが可能となりました。X(旧Twitter)に大量のディープフェイクが流れ、話題になりました。
2023年3月、Adobe社が「Firefly」のβ版をリリースしました。Photoshop、Illustratorなど、クリエイターに支持される既存のツールと連携することで、デザイナーが仕事の中でAIをどう活用できそうか?を理解するきかっけになりました。学習元が同社のストックフォトサービス「AdobeStock」を利用しているため、権利関係の解決に期待が寄せられました。しかし、「Adobe Stock」自体が無断転載やAI生成物が跋扈する無法地帯になるなどの懸念点があります。
2023年5月、生成AI対応への不信感によりPixivで多数のイラストレーターが公開停止措置を行いました。また、集英社がAI写真集「さつきあい」を発売するも、生成AIの論点・問題点の検討が不十分だったとして即販売終了を発表しました。
2023年7月、全米俳優連合(SAG-AFTRA)が生成AIに関する俳優の肖像権問題やストリーミングの普及に伴う還元不足等の理由によりストライキに突入しました。なお既に同様の理由でストライキを行っている全米脚本家協会と共同でストライキに参加しています。
トレンドまとめ
2022年夏「AI画像生成ツールの普及」、冬「学習方法の多様化」、2023年春「著作権・肖像権からの反発」が顕著に現れました。
圧倒的な速さで移り変わるトレンドを見ると、「アーティストやクリエイターは仕事を奪われるのではないか?」という危機感を抱くのも無理ないと感じます。
これから何が起こるのでしょうか?
私は、様々な場所で「ルールメイキング」が行われると考えています。
2023年7月、国連・安保理がAIに関する初会合を開催しました。誤った情報の拡散や軍事目的で利用されるリスクなど、リスク管理の必要性が訴える声が相次ぎました。国際協調の流れが起きています。また、ホワイトハウスはOpenAI等AI開発企業7社を招集し、生成AI製コンテンツに「透かし」を入れる等の対策を自発的に実施する事を約束させたと発表しました。
既に、国・業界・企業などのコミュニティでガイドラインの作成が進んでいると思います。その背景には、技術覇権競争など各コミュニティの思惑があると感じます。何か一つだけが生き残るのではなく、各勢力の棲み分けが行われるかもしれません。そして、年表で取り上げていたAI会社は今後も重要なプレイヤーとなることは確実だと思います。
大事なのは「これから何が起きるのか?を予測し備えること」だと考えています。そのためには、トレンドを把握し日々読み解く必要があると感じます。次回の記事は「その2:勢力図の読解編」と題し、トレンドからの読み解きをご紹介したいと思います。
おわりに
この年表は、オンラインホワイトボードツールMiroにて作成しました。その際、多くのニュース/動画/まとめサイト/SNSの情報/画像を引用させて頂きました。まとめてではありますが、出典のご紹介をさせて頂き、心から感謝致します。感謝を込めてMiroのボードを共有させて頂きます。
【Miro】画像生成AI トレンド年表
https://miro.com/app/board/uXjVMvuoMBE=/?share_link_id=299630202198
「クリエイターとして、これからのAIとの向きあい方」について意見交換したいと思い、年表を作りました。コメントなどのフィードバックを貰えると嬉しいです。
今後も画像生成AI関連をはじめ「デザイナーに有益な情報」を発信していければと思っています。もしご興味がある方はX(旧Twitter)など、お気軽にご連絡頂けると幸いです。最後まで読んで頂き、ありがとうございました。