ブログ記事や学会での発表、論文などで著作権フリーの画像入手に困ったことはないでしょうか。私自身、数多く発表していく中で”目的とする画像がない”、”著作権が心配”という問題に直面してきました。
AIを用いて画像を作成する方法はこの問題を解決してくれる素晴らしい方法と思います。今回代表的な2つのサイトと、作成した画像についてご紹介します。
今回の要約
・Stable DiffusionとDALL·Eはテキストから画像を作成するAIです。
・現状DALL·Eの精度が高いのですが、今後を注視する必要があります。
DALL·Eとは
ChatGPTで話題になっているOpenAIが開発した画像生成のAIです。
現在ではDALL·Eを改良したDALL·E2が使用可能です。
DALL·E2になったことで画像のクオリティが劇的に向上したことが伺えます。
Stable Diffusionとは
一方でStable Diffusionはいかがでしょうか。
DALL·EとStable Diffusionで画像を作成して比較してみた
試しに"knee joint swelling in elderly women"と両者で入力して出力された画像を比較しました。
⒈ DALL·Eで作成した画像
⒉ Stable DIffusionで作成した画像
いかがでしょうか。DALL·Eで出力された画像は自然なのに対しStable DIffusionは構造が人体と異なっており違和感を感じると思います。
promtの内容で調整できるのでしょうが、現状の精度としてはDALL·Eに軍配が上がると感じました。
まとめ
テキストから画像を作成するAIの代表的な2つであるDALL·EとStable Diffusionで画像を作成して比較をしてみました。
発展途上の分野であり、今後について注視する必要があります。
tm-ortho.hatenablog.com
tm-ortho.hatenablog.com
tm-ortho.hatenablog.com