見出し画像

AI 画像生成サービスの違い


midjurney 、ernie vilg、mimic、stablediffusionを比較する

結論
手軽にあそぶならmidjurney 、ernie vilg
自分でAI画像生成関連のサービス作ったりするならstablediffusion
mimicは対象者や用途が絞られそう



midjurney


Discordでイラストが作れる。
下記公式ページのリンクから Sign in すると公式Dicordチャンネルに参加できる。

#newbies-〇〇 ルームで/imagine コマンドを使いpromptに生成したい画像の題名を入れることで画像作成できる。(画像生成までは1分程度)


作成例

A library in Harry Potter


簡単に画像生成ができ面白かった。
他の人がどんな言葉でどんな絵を作っているか見るのも面白い。
より思い通りの絵を書いてもらうためには描写力が求められる。
同じワードを入力しても異なるイラストができるため試行錯誤が必要になる。


料金体系




ernie vilg

Gitから強化済みモデルをDLして使う形式。デモサイトで簡単にイラスト作成もできるため手軽に遊ぶことも可能。

中国のIT大手Baidu(百度)が開発しているため英語以外にも中国語にも対応。
二次元キャラの生成に強いと言われている。



デモサイト

Generate imageの左側に作成したいイラストの題名を入力。
下のstyle のプルダウンで「水彩画」「油絵」「漫画」などイラストのテイストを選ぶことができる。


作成例

同じ題名でmidjurneyで作成したイラスト

同じ題名でもernie vilgの方が日本のアニメイラストに似通っていることがわかる。



mimic 

現在サービス停止中。ベータ版が2022年10月から再開予定。

実際にサービスを試すことはできなかったので公式サイトMimic作成者の方が登場する対談動画を参考にしている



上記2つのサービスと異なり、0からユーザーがサンプル画像を学習させる必要がある。(学習元イラストは最低30枚必要)
作成したモデルをもとに作られた画像の著作権は学習元の作者に帰属する。

上記制約からmidjurney、ernie vilgと異なり既にイラストが描ける人向けのサービスとなっている。
想定ユーザ体験としては、イラストレーターが自分の絵柄を振り返る用、背景やラフ画アシスタントなどが考えられる。

現在サービス中止になっている背景
他人のイラストを学習させたモデルを利用して作成したイラストを自分が書いたと言って発表するような事例が起こり炎上したためサービスが中止している。

学習元のイラストが本人が書いたものかを確かめるのは難しく、作成後のイラストについてもトレーシングとは異なりイラストが完全一致するわけではないので絵柄が似ているだけなのか判断が難しい。



stablediffusion

強化済みモデルをDLして使う形式。
Gitからコマンドプロンプトを実行してDLしたり、Pythonでライブラリをインストールしたりと使用のためにプログラミング知識が必須。

静止画のみならず動画生成も可能。
Japanese Stable Diffusionというモデルを使えば日本語でも画像作成可能。


中でも大きな特徴は
「AIモデルが無料で公開されただけでなく、商用利用も可能」
という点

こちらの記事のようにプログラミング知識さえあれば、自分でAI画像生成サービスを作ることも可能。


所感

話題のAI自動生成サービスを利用して簡単にクオリティが高いイラストが作成できて面白かった。
一方で自分が書いてほしいと思っているイラストをテキスト情報で伝えるのはなかなか大変で試行錯誤が必要だと感じた。
プログラムで絵を書けるので組み合わせワードさえ用意できればその試行錯誤自体も自動化可能ではある。

個人的には同じイラストを描くために試行錯誤するなら自分でイラストを描いた方が面白いと思う。
背景やラフ画のイメージが湧かないときに気軽に試すのに使っていくことはありそう。


またイラストを描きたいという人だけでなく、写真家が自分の写真を学習させたモデルを作ってあそぶ()という新たな需要も生まれてきている。

こういった新たな需要から今までにはないジャンルなどが出てきそうで楽しみ。


この記事が気に入ったらサポートをしてみませんか?