
プレゼン資料を劇的にアップグレード!生成AIを活用した挿絵作成術
スライドの挿絵はい○すとやには私も大変お世話になりましたが、画像生成AIを使えばお洒落な感じの挿絵が欲しい形で自分で作れる時代になりました。
(2024.8.31追記)
スライド素材の新しい選択肢✨
— 限界助教|ChatGPT/Claudeで論文作成と科研費申請 (@genkAIjokyo) August 30, 2024
ImageFXがいい感じ
特に実写が強くて日本的な物の違和感が少ない👍
イラストも意図した事を盛り込みやすい👍
生成拒否が多いのが玉に瑕👎
ChatGPTに「医学用語を一般的で視覚的な表現に置換え教育目的を強調して」で変換が吉
プロンプトはALTに
ImageFXのリンク👇 pic.twitter.com/COP9ijq1EQ
今回紹介するのはImageFXです。無料で使えます!2024年8月末にImagen3が搭載されてかなり正確な絵が描けるようになりました。日本語でプロンプトの入力は可能ですがうまくいかないので英語で入力する必要があります。詳細なプロンプトは必ずしも必要はないですがChatGPTやClaudeにお願いしてプロンプトを作成してもらう際に細かく描写してもらうと、かなり忠実に生成してくれます。商用利用についての記載は見つけられませんでした(多分ダメだと思います)。
生成拒否が多いのが玉に瑕で、しかも何のワードがトリガーになっているのか非常にわかりにくいです。
ChatGPTやClaudeに「生成拒否されたので医学用語を一般的で視覚的な表現に置換え教育目的を強調して」で変換してもらってください。
その点ではXの課金ユーザーが使えるGroqに実装されているFluxは規制緩めで使いやすいです。
過去のBingと同じプロンプトを入れてどうなるか見てみましょう。(Bingのもシンプルが故に注目を引きすぎないので良いと思いますが)
日本人を出したい時はJapaneseを使ってください。






1年ちょっとでモデルが大きく進化していることを実感できると思います。
モデルの特徴として実写(Photo-realistic)に強く、これまでのモデルで今一つであった日本人や日本風の物の描写が上手です。

また画像の左下にある画像編集を押すと画像の一部にインペイントして修正することが可能です。

(以下は2023.5.4記載)
今回紹介するのはBing image Creatorです。2023年9月末にDALL-E3が搭載されてかなり正確な絵が描けるようになりました。日本語でプロンプトの入力が可能であり初期の画像生成AIに必要であった詳細なプロンプトは不要になっています。
Bing image Creatorの入力窓にプロンプトを入れると4枚の絵が出てくるので気に入った絵を1枚選ぶと下記のような画面になります。ダウンロードを選択すればOKです

思ったような絵にならない場合は描写を細かくしてみてください。
なおBing Image Creatorの利用規約には「合法的な個人的、非商業的な目的であれば、オンライン サービス外で創作物を使用することができます。」とありますのでその点ご留意下さい
以下作例を示します。キャプション部分がプロンプトです。






上の絵のようにDALL-E3へのアップデートで英語であれば絵の中に文字を入れることもできるようになりました。
日本語は残念ながら今のところできません
今回は詳細は触れませんが無料で使えるもので他にオススメのサイトには以下のものがあります。
Lexica
無料だと月100枚まで。モデル選択でStable Diffusion 1.5を選択すれば無料で商用利用も可能。
Clipdrop(StableDiffusionXL)
商用利用可能
Ideogram
文字の入った絵の生成に強いです。商用利用不可。
発表の後には論文化しましょう
プレゼンの質問対策はこちらをどうぞ
ChatGPTにスライド作成してもらうにはこちら
https://note.com/genkaijokyo/n/n1bda424901c3
いわゆるスライドのデザイン系の本を読んだことのある方には目新しさはないと思いますが、スライドデザインについての本をまだ読んだことのない先生には最初の1冊としてお勧めです。CureAppのUXを担当されている精神科の先生が執筆されているそうで、さすがプロの仕事という感じです。