
【AMD Amuse】モデル評価 - 高速タイプ
表紙画像をこのタイプの第1位のモデルによる生成画像に変更しました。
AMD Amuseのモデルについて、勝手に4つのタイプに分類して、各モデルを評価しようということになりました。
モデルの評価には、共通して次のプロンプトを使用しました。今回対象のモデルはいずれもネガティブプロンプトを入力できませんでした。
プロンプト
ultra quality, realistic photo, a Japanese woman, casual, city, fingers, flower
超高品質、現実的写真、日本人女性、カジュアル、街、指、花
評価観点は🌈全体、👧日本人女性、👗カジュアル、🏡街、🖐指、🌸花の6点で、本文中にこれらのアイコンを示します。また、参考生成時間も掲載します。評価基準の詳細、および測定環境のスペックは、上記「AMD Amuseモデルの分類」の記事を参照してください。
モデル別出力結果(高速タイプ)
評価用プロンプトを用いて、高速タイプに分類した各モデルにおいて生成できた画像を、ランキング形式で紹介して、最後に一覧でまとめます。
(私の環境にインストールしたもののみとなっています)
写真はひとつのモデルにつき2枚ずつ掲載します。1枚目はなるべくプロンプトの内容に忠実な描画が行えたもの、2枚目は一部に乱れや不具合があってもモデルの特徴を表現できているもの、であると私が判断したものを選びました。
また、モデルごとの特徴的なことを評論家的に説明していますが、シロウト目線ですので許してください。見当違いなことを言っているかもしれませんが、率直な意見を述べたいと思います。
第9位 : Dreamshaper v7 LCM


モデルによって向き不向きがあることをわかりやすく説明してくれるモデルのひとつです。このモデル、どう考えても日本人女性の顔を誤解しています。
人物(または顔)を描画しない構図、例えば背景だけの画像を生成したいときには使えそうなモデルです。
🌈全体の印象も、こういう描画をするモデルと割り切ると悪くないのかもしれませんが、今回は現実的写真かどうかで判断すると最低レベルです。
👧日本人女性の顔が、何度やっても人間ではなく人形として描画されます。おそらくそのように学習しているのでしょう。顔のパーツはどの生成画像も同じ感じで、それでいてたまに崩れます。
👗カジュアル的な服の学習も偏っており、花柄の和服が多いです。服の描画自体は悪くないのですが、着ている人が人形っぽいので、やはり人形の衣装のように見えてしまいます。
🏡街の描画は素晴らしいです。背景のボケ感はほとんどなく、くっきりした画像で描画されます。良く見ると通行人は日本人ではない異国の雰囲気がありますが、プロンプトで修正可能だと思います。ただ、お花屋さんの前での撮影もまれに出現しました。
🖐指の描画は、どうも本数をがんばちゃうタイプのモデルのようです。基本的なグーとかパーとか、シンプルな恰好を描いてくれれば良さそうなのに、形も頑張っちゃうのでなかなかバラエティのある手が雑に出力されます。
🌸花の形や色は豊富で、花自体の描画は悪くないです。服や背景に溶け込もうとすることも多いですが、それでも手に花を持つことも多いです。ただし、なぜか造花に見えてしまうのは、顔に引っ張られ過ぎでしょうか。
第8位 : Fluently v4 LCM


現実的ではありますが、どこか油絵風、独特の雰囲気を描画するモデルです。ヨーロッパとかの人物を描かせればそれなりに良い画像が得られそうですが、日本人向けのモデルではなさそうです。
🌈全体的に暗い雰囲気で、なんとなく地味です。寂しい感じが漂うため、評価が低くなってしまっています。
👧日本人女性ではなく、ヨーロッパの女性とかだと雰囲気がマッチしそうです。または、ヴェートーベンのような音楽家向けのモデルなのかもしれません。
👗カジュアルな服を期待しましたが、どうもくたびれた感じの古着みたいな服が生成されます。もっと明るい色とか描いてほしい。
🏡街もなぜか薄暗いです。ただ、背景としてみるとそこまで悪くない描きこみをしています。
🖐指も可もなく不可もなく、という感じでしょうか。暗いですが、表現力はしっかりしています。
🌸花は、一瞬どこに反映しているのかわかりにくい画像ばかりです。花の色も鮮やかさがないのが寂しいです。
第7位 : AngrA RealFlex
※このモデルはクレジット表記が必要で、さらに生成画像の販売ができません

(generated by AngrA RealFlex)

(generated by AngrA RealFlex)
良いところと悪いところがはっきりしている極端なモデルです。
ライセンスの制限で、生成した画像を販売できない(広い解釈では、お金を得るために使用できない)ため、扱いが難しいモデルです。クレジット表記も必要で、これらライセンスの制限がなければ、もっと上位だったと思います。
🌈全体としては少し暗めですが好印象です。プロンプトの再現性は少し低めのようですが、このタイプのモデルでは数多く生成することのほうが大切です。
👧日本人女性の描画はどれも同じ顔という印象はあるものの、飾らないそれこそ現実的な人を生成してくれます。今回、表情はつけていませんが、髪の毛の描画などは素晴らしいモデルです。
👗カジュアルな服は色も形もたくさんの種類が描画でき、それでいて質感の表現も素晴らしいと思える描画でした。特にデニム生地の描画が優秀です。
🏡街は適度なボケ感の背景をきれいに描画できました。何を描いているのかがしっかりと識別できます。特に通行人の描き方がとても自然な感じで好印象です。
🖐指は、このモデルの最大の弱点のように思えます。指の本数が8本や10本など多かったり、複雑骨折していたりということがほとんどで、何かを持たせたり指でのジェスチャーは行わないほうが無難かもしれません。
🌸花は、無視されることが多いですね。人物や指が良い感じに描画されても、花が描画されていなかったためボツになった画像がたくさんあり、もったいない感じがします。
第6位 : RealModelBase LCM


独特な雰囲気の目の描画を行うモデルですが、印象は悪くなく、むしろ美的な顔を生成します。ただ、そのせいで顔が純粋な日本人っぽくなく、ハーフっぽい顔になってしまうことが多いです。
🌈全体としては、ちょっとクセのある画像を生成する変わり者ですが、このモデルが生成した画像の女性の表情は、雑に扱えない妙な魅力があります。
👧日本人女性の描画は少し苦手なようです。というのも、目の描画のせいかハーフ顔になりがちです。ただし、ハーフ顔ではありますが美人で、顔自体は乱れることなくきれいに描画してくれることが多いです。髪型は多いですが見慣れた顔が良く出てくる印象です。
👗カジュアルというワードで和服ではない服が各種生成されますが、色を指定しないと白になるのか、ほとんどの服が白のみでした。
🏡街の描画は背景ですが、背景のボケ感はちょっとキツい感じで、何を描画しているかがわかりにくい感じがします。
🖐指の描画は、気のせいか、あえて難しい形状を描画しているような気がします。そのせいか乱れることも多いと感じました。
🌸花は、なぜかほとんど無視されます。描画されてもほんの一部として登場し、メインになることはありませんでした。
第5位 : Quick LCM
※このモデルはクレジット表記が必要です

(generated by Quick LCM)

(generated by Quick LCM)
平均的なモデルですが、全体の雰囲気としてみると悪くない印象です。
クレジット表記がなければもっと気兼ねなく使えるモデルだったかもしれません。
🌈全体としての雰囲気は、少しぼんやりした感じはありますが平均的で、それほど悪い印象はありません。むしろ弱点のない良いモデルと言えそうです。
👧日本人女性の描画も平均程度です。髪型のバリエーションは多いため、同じ人が何度も登場する感じが少ないですが、遠くからの描画で顔のパーツが若干雑になるようです。
👗カジュアルな服の描画もバリエーションも普通ですが、少し和装が多い感じでした。和装だと、日本人の感覚では「カジュアル」っぽくないと感じられてしまいます。
🏡街は、ボケ感が良い感じですが、取り上げるような特徴がない感じです。ということは、違和感がなくて良いのかもしれません。
🖐指の描画はやはり苦手ですが、雑過ぎる感じはありません。成功したときの描画がきれいなので、やはり平均的な感じです。
🌸花は、持っているか、服やアクセサリーに取り込まれるか、無視されるかでした。花の存在自体も控えめですが、花の種類はそれなりにありそうでした。
第4位 : Photographer Alpha


少し全体が暗い印象はありますが、きれいな描画が行えるモデルです。
顔がハーフになりがちですが、なのは少し残念ですが、それを差し引いても高速タイプで指の描画がここまでできるのは素晴らしいです。ライセンスの縛りもないので、高速タイプではおすすめできるモデルです。
🌈全体として、少し暗さはあるものの、平均的な描画です。プロンプトの再現性もそこそこでした。
👧日本人女性は全体的にバランスは良いですが、少しハーフ顔な人が現れます。ハーフ顔ではない純粋な日本人っぽい顔も現れるため、バリエーションが適切に表現できるということかもしれません。
👗カジュアルのバリエーションは、ほかのモデルに比べると少ないような印象です。色を指定していないためか白い服ばかりで、暗さもあって少し印象が悪くなっています。
🏡街の描画は平均的です。ボケ感や人物の描きこみは現実写真に近く好印象でした。やはり、少し暗めな感じになりがちでした。
🖐指は、きっと苦手なはずですが、思いのほか上手に描画できることが多いです。半分ぐらいは失敗しますが、逆に言えば半分ぐらいは正しく描画される気がします。
🌸花は、なぜか無視が多いです。描画されたときはそれなりにきれいですが、バリエーションが少ないかもしれません。
第3位 - Momentary - LCM
※このモデルはクレジット表記が必要で、さらに生成画像の販売ができません

(generated by Momentary - LCM)

(generated by Momentary - LCM)
このモデルによる画像生成は、本当に高速タイプかと思わせるような完璧さがあります。
要クレジット表記と販売禁止というダブルのライセンス制限がなければベストなモデルですが、その制限により第3位に落ち着きました。
🌈全体としては、現実的写真をうまく描画できる優秀なモデルです。ここまで描画できるのであれば、1024x1024での出力を行う兄弟モデルがあっても良さそうだと思えるほどです。
👧日本人女性は、たまにドキっとするような完璧な顔が描画されます。種類も単調ではなく、良く勉強したと褒めたくなるモデルです。
👗カジュアルで出現する服のバリエーションも豊富で、和服に偏ったりすることなく、質感の良いものがたくさん生成できます。
🏡街の描画もこのタイプでは言うことなし。くっきりとボケの中間ですが、描画内容もはっきり認識できます。たまに街の中のお花畑が描画されるのも、プロンプトを忠実に再現できている証拠です。
🖐指の描画は、成功率にしてしまうと10%ぐらいですが、このタイプの他のモデルに比べると優秀です。成功したときの描画がとても自然な感じなので、ついほかの項目で評価しがちですが、指に関しては文句がありません。
🌸花の出現率はやや低いものの、先述したお花畑もあり、花自体の描画は問題ありません。せっかく花が出現しても、その時に指がうまく描画できていないという残念な思いをすることが多いです。
第2位 - Realistic LCM
※このモデルはクレジット表記が必要です

(generated by Realistic LCM)

(generated by Realistic LCM)
クレジット表記は必要なものの、どの項目も平均以上の評価が得られるモデルです。人物の描画がくっきりしている分、背景のボケ感が調和できてない感じがしますが、今回のプロンプトに限った話かもしれません。
クレジット表記が必要なければ、1位をとれたと思います。
🌈全体としては、とても自然な感じの現実的写真を生成できます。光の加減や全体の構図も短時間で良く生成できるなと感心させられます。
👧日本人女性は、言うことなしですね。思いっきり美人というわけではありませんが、まるで息をしているかのようなとても自然な女性が描かれています。
👗カジュアルで和服が現れることも少なく、形や質感も申し分ない描画が行えています。肌と触れ合う感じもうまく表現できています。
🏡街は若干ボケ感があり、もう少し描きこんでも良さそうな感じでした。プロンプトで調整できるかもしれませんが、もう少し人物と調和できそうな気がします。
🖐指の描画は、短時間でということを考慮すれば優秀です。手の甲の質感(肌感)も素晴らしく、血管が存在しているようにも思えます。
🌸花は描画されてしまえばきれいな状態でした。色や形もそれなりに豊富で、かなり好印象に描画が行えます。
第1位 - CyberRealistic LCM


名前からすると近未来的な写真を生成するのに向いている感じですが、評価用プロンプトで最も好印象な画像を生成できました。ということで「CyberRealistic LCM」が第1位です。
ライセンスによる制限もないため、50枚とか100枚とか連続して生成して、その中から良いのを選ぶという高速タイプの覇者です。
🌈全体としては、地味過ぎず派手過ぎずというのが現実的写真っぽさをうまく表現しています。
👧日本人女性は、とにかくどこかに現実に居そうな人が自然と描かれます。すぐにでも会話を始まられそうなレベルです。
👗カジュアルは、少し偏りのある独特な形状の服が現れました。プロンプトを指定すれば問題ないレベルですが、色味も若干地味な気がします。
🏡街は、描きこみとボケ感のバランスがパーフェクトです。人物と背景の調和が完璧に行われることが多い印象でした。
🖐指の描画は、このタイプでこれ以上は望めません。両手の指を同時にこのくらい描いてくれるのはとても実用性が高いです。
🌸花は少し極端に描画されました。小さかったり大きかったりとバリエーションは豊かですが、もう少し自然な感じで登場して欲しかったです。
高速タイプのまとめ
高速タイプのモデルをランク順にまとめた一覧は次の通りです。

Elap. は測定環境における生成時間です。
Limit はライセンスによる制限事項です。🖊は「要クレジット表記」、🚫は「画像の販売禁止」です。
🌈全体/👧日本人女性/👗ファッション/🏡街/🖐指/🌸花は各評価項目です。5段階(💩❌➖✅⭐)で評価しています。
次回予告
今回と同様に、標準タイプについてまとめます。
高速タイプと比べて時間が掛かりそうですので、しばらくお待ちください。
おまけ
勝者「CyberRealistic LCM」によるウイニングラン。
プロンプト
ultra quality, realistic photo, a Japanese woman and a brown fox
超高品質、現実的写真、日本人女性と茶色い狐


