Bingで、画像生成AIの最新版Dall-E3が使えるので、試したら、文字も入れて作ってくれる!すごい!!w
ChatGPTは、使い方次第で、めちゃくちゃレバレッジが効くのに多くの人が、その可能性に気が付いてないことが残念だと思ってしまう 足立明穂です。まあ、だから、企業さんからご相談を受けるんだけどねw
さて、ChatGPTを開発したOpenAIの画像生成AI(なんかややこしい言い回しだなw)であるDall-E(ダリと読みます)の3が新しくリリースされました。
なんと、本家のOpenAIよりも先にマイクロソフトのBingから利用できるようになりました!!(マイクロソフトは、出資してるので、先に使えるのでしょうねぇ・・・ 大人な事情w)
かなり制度が上がってきてるので、界隈の人たちは、ワイのワイの騒ぎまくっています!!
どこがすごいのか? 分かりやすいことを試してみました。
※Bing経由では、商用利用禁止なのでご注意ください!
現状(2023年10月)では、利用規約に生成物の商用利用禁止と書かれています。なので、その点にはご注意を。
画像に文字を入れることができる呪文 typography
画像生成AIに文字を入れ込んで作らせようとすると、何語か分からないような文字、あるいは、文字らしき模様が入るだけで、うまくいきませんでした。
例えば、『Cool Japan』って文字を指定しても・・・
どれも、おしい感じの絵になります。
ところが、今回は、typography(タイポグラフィ)という呪文をつけて、その後に「」で入れたい文字列を書けば表示してくれます。
例えば
typography"COOL JAPAN"
なかなか、イケてませんか?w
では、日本語だったら、どうなるでしょうか?
typography"日本"
うーん・・・ やろうとしている努力は認めるけど、なんだかなぁwww
『不気味な指』問題はどうなったか?
画像生成AIは、指とかを認識してるわけではないので、手を描かせると気持ち悪いことになります。
指の数が多かったり、少なかったり、不自然に曲がっていたり・・・
例えば・・
刺身を切っているのを指定したのですが、刺身もなんか変ですよね。
では、これが、Dall-E3になったら、どこまでうまくいくでしょうか?
以下の画像を作成してください。
===
日本の料亭の板前さんが、熟練の職人技で、刺身を切っている手元のアップ
3枚目と4枚目は、不気味なところがありますが(^^;)、1枚目、2枚目は、パッと見みても違和感を感じないと思います。
そりゃ、イラストやアートを描いている人からすれば、どれもこれも気持ち悪いぃ!!ってなるでしょうけど、多くの人は、熟練職人の手だと思ってしまうかも。
かなりよくなってます。
設定が『入れ子』になっている場合の描写
『入れ子』になっている設定とは、こういう例です。
犬の絵を描いている猫の画家
まず、『犬の絵』という設定があって、さらに、それを含む『絵を描く猫』という設定があります。
こういうのを描かせるのって、大変なんですw
意味を理解しているのではないので、犬が猫を描いていたり、犬が犬を描いていたり(猫はどこ?w)、猫と犬が両方とも画家だったり・・・・w
さて、Dall-E3は、どうでしょうか??
1枚、明らかにおかしいのがありますが(笑)、こちらの意図している絵が出てきています。
はたして、タヌキは描けるのか??
日本では、タヌキって、身近な動物であり昔話にも出てくるのですが、海外、特にアメリカやヨーロッパにはいない動物です。
なので、タヌキを描かそうとすると、アライグマになってしまいます。
では、Dall-E3では、どうなるでしょう??
『たぬき』を描いてください
あー・・・ やっぱり・・・・
せっかくなので、Bingに確認してもらいましょう。
それは、アライグマですよね? 『タヌキ』は、どんな動物か知ってますか?
では、その特徴を考慮した上で、改めて『たぬき』を描いてください。
それって、アライグマ・ラスカルのアニメに似てきてますよ!! 信楽焼の狸は知ってますか?
では、信楽焼の狸をイメージして描いてください
おっと! この信楽焼の狸は、OKなのか?www
でも、まだまだ、アライグマ。
日本の狸がAIに認識される日は、まだまだ、遠い・・・orz
P.S.
やればやるほど、いろんな意味で遠くなっていく(^^;
もう、アライグマでもなく、猫やんw
で、もう、最後の手段ということで(?)、こんな指示を出しました。
落ち着いて、深呼吸してから、ステップ・バイ・ステップで、論理的に手順を踏まえて、信楽焼の狸を正確に緻密に描いてください。
そういう意味では・・・・ でも、最後のは嫌いじゃないぞw