見出し画像

生成AIでマンボウを悠々と泳がせたかったのに…!

ここ1年でAIのイメージ生成技術はかなりのレベルに到達していて
美少女とかサイバーパンクとかファンタジーなど、ネット上で人気のあるもの、需要があるものは相当な高品質で出せます

でも、作品をあれこれと作っていると、全く出力できないイメージにまだまだ出会います
そんな時「学習していないものは出せない」というAIの基本に改めて気付かされるのです

そう、出ないものはホントマジで出ないんです!


クリエイターが
生成AIで本来やりたいのは
未知の表現

△ 手軽に高品質なイメージを生成する

仕事の資料に添える、SNSの投稿に彩りを加えるなど、旧来手間がかかっていた作業を爆速化する「カイゼン」にはめちゃくちゃ向いています

◎ CGを使っても表現が難しい、未知の表現を創造する

クリエイターとしては、本来こっちがやりたいんです…
でもAIは「未知」の表現が本当に苦手です
学習していないものをプロンプトで描そうとするとかなりの根気とテクニックが必要になります(そして現状そのコストが見合っていません)

更に言えば
未知の表現どころか、世の中のニーズからちょっと外れたイメージを生成しようとしただけで、かなりの頻度でガチャ地獄に落下するハメに!

すなわち
作品を制作する過程で空費されたAI生成物の魂と自分の時間を供養すべく「絶対生成できない」やつを記録しておこうと始めたのがこの「できない」シリーズです


今回のお題は「マンボウ」 

マンボウ(Mola mola)は興味深い生態で知られる世界最大の硬骨魚
マンボウの体は非常に独特で、楕円形の平たい体をしている
背びれと尻びれが大きく、体の上下に突き出てて、尾びれはなく、代わりにクラビアと呼ばれるひれ状の構造を持つ

GPT4oによる解説
こちらが北欧最大の水族館にいる実際のマンボウ
学名はMolaMola Per-Ola Norman

そもそも英語で何と入力するかでつまづきます
翻訳で出てくる「Sunfish」ではまずマンボウは出ず金魚のような赤い魚が生成されます
「Ocean Sunfish」「Mola Mola」の2つでやっとそれらしいものが出始めるのですが・・・


MidJourney

プロンプト「OceanSunfish」のみでは
ほど遠い感じです

プロンプト:swimming 0cean Sunfish under the sea
プロンプト:a swimming 0cean Sunfish under the sea

「Mola Mola」を足すと
カワハギのような紙風船のような
モンスターフィッシュが続々と生まれます

プロンプト:ocean sunfish, mola mola ,swimming under the sea
プロンプト:ocean sunfish, mola mola ,swimming under the sea
プロンプト:ocean sunfish, mola mola ,swimming under the sea

ガッチガチにプロンプトで
容姿を説明しても
びくともしません

プロンプト:Appearance of the Ocean Sunfish (Mola mola) Size: The ocean sunfish is one of the heaviest bony fish in the world, typically reaching lengths of 1.8 to 3.3 meters (5.9 to 10.8 feet) and weights over 1,000 kilograms (2,205 pounds). The largest recorded specimen measured 3.3 meters (10.8 feet) in length and weighed 2,300 kilograms (5,070 pounds). Shape: The sunfish has a very distinctive body shape. It has a round, laterally compressed body, appearing almost disk-like or oval when viewed from the side. The body is flattened from side to side, giving it a thin profile when viewed head-on. Fins: It lacks a true tail fin; instead, it has a clavus, a rudder-like structure formed by the convergence of the dorsal fin and the anal fin. These two fins are large and extend vertically, almost symmetrically, from the top and bottom of the body, giving the sunfish its distinctive shape. Skin: The skin of the ocean sunfish is rough and leathery. It can vary in color, typically appearing silvery gray or brown, and often has spots or mottling. Head: The sunfish has a small mouth that is always open due to the fused teeth forming a parrot-like beak. Its eyes are relatively small compared to the size of its body and are positioned close to the mouth. Coloration: The coloration of the sunfish can vary from silvery-gray to brown or even slightly greenish. They often have a pattern of mottled spots across their bodies. The underside of the body is generally lighter in color compared to the dorsal side. Gill Openings: The gill openings are located just in front of the pectoral fins, and they are relatively small compared to other fish.

実物のイメージガイダンスをつけても
このありさま
どうやらMidJourneyは
マンボウに興味がないようです!
😆

というか、遠ざかってしまった・・・
尾びれがキモっ!

GPT4o+Dall-E

LLMの強みを利用すべく
マンボウについてひととおり
GPTに説明させてから
続けて画像生成します

ぼんやりと見れば
シルエットは近い気がしますが…

冷静に実物と比較すると全然違います

AIは雰囲気で似せてくるので
生成ガチャで何回も出力していると
だんだん正解な気がしてきます

しかしここで騙されてはいけません!
現実と照らし合わせて
熱くなった自分の目を冷ましてやる必要があります(経験則)

先ほどのガチガチプロンプトを
入れてもさして変わらず

個人的には
Dall-E特有の昔の図鑑イラストのようなぬるいリアル画風もかなり気になります


Stable Diffusion 3 Ultra

リリースされたばかりの
最新版かつ最上位モデルで挑戦です

SDの素のモデルには
さすがに荷が重いみたいです

SD3は描画力が高いだけに不思議に実物感のあるナゾ生物にはなっていて
クリエイター視点ではUMA動画にするなど
何かに使えそうで「面白」くはあります

…が
本来の目的「マンボウの生成」においては最もダメでした!


生成できない理由

あくまで推測ですが下記のような事だと考えられます

  • そもそもマンボウの生息数が少ない

  • 当然鮮明なマンボウの写真画像がネット上に少ないためあまり学習されていない

  • 「魚」という概念から外れている独特すぎる形状のため、AIがうまく学習できていない、また形状を推測できない

  • 特に尾びれの形状が唯一無二すぎる

同じような条件にあたるものはだいたい生成できません
例えば「シーラカンス」

怖すぎるMidJourney産のシーラカンス
GPT/Dall-Eのクエのようなシーラカンス
SD3のシャケのようなスズキのようなシーラカンス
一番近い?
「nature」の本物のシーラカンス



オマケ1:
話題の最新動画AIで生成してみる
Runway Gen-3

静止画で出せないのに動画AIで一発生成できるはずもないのですが、SORAに迫るリアルさだと話題のRunway Gen-3でもテストしてみましたよ!

# プロンプト
The sunfish has a very distinctive body shape. It has a round, laterally compressed body, appearing almost disk-like or oval when viewed from the side. The body is flattened from side to side, giving it a thin profile when viewed head-on.
Fins: It lacks a true tail fin; instead, it has a clavus, a rudder-like structure formed by the convergence of the dorsal fin and the anal fin. These two fins are large and extend vertically, almost symmetrically, from the top and bottom of the body

すがすがしいほどのガン無視っぷりです!

オマケ2:
仕方がないので実在の写真を動画で泳がせる
Creative Commons + Dream Machine

北欧最大の水族館「Nordsøen Oceanarium」がマンボウの鮮明な写真をCreative Commonsで提供してくれているので
これを話題のDreamMachineで動かしました

なんか尾びれが
ヨレヨレに伸びちゃってますけど。
一応泳いだので これにて終了します!


「マンボウを出せたよ!」
って方がいらっしゃったら
是非コメントでご一報ください



2024年8/30 後日談:「Imagen3」登場!

Googleがローンチした「Imagen 3」を試したところ
バチっと一発で出せました!!!

"front view"で正面よりの画をキッチリ出してくるのは凄みがあります

厳密に見ると、胸ビレが普通の魚っぽく筋が入っていたりするのですが、「マンボウ」のAI出力画像としては十分なクオリティと言えるのではないでしょうか
Googleは20年近く遍く蓄積してきたインターネット上の画像データベースを持っているので、ついに本気出し使ってきた、というところでしょうか(いよいよ法的にも戦えると、と判断したのかもしれません)


残念ながらシーラカンスは今一歩でした…

尾びれの形など、従来の他モデルよりは頑張ってシーラカンス味を出していますが、まだ学習が足りないようです

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?