見出し画像

画像生成AIには○○が足りない…!マイビジョンを解説!


私は昨日のnoteでも説明したように

あまりAIの性能を重視していません



その理由の一つとして

私が思い描くビジョンを達成できていないと思っているから


と説明しました!


昨日のnoteを見ていない方は、ぜひ見てみてください!
(見なくても内容の理解はできるので、見たい方だけで大丈夫です!)


今回は上記の告知通り!

思い描くビジョンの詳細について


解説したいと思います!



理想の画像生成AI


私が思う理想の画像生成AIは

文章の指示でプロンプトに使われた言語を反映してくれるAIです!



例えば、私たちの場合

画像生成AIに入力するプロンプトは日本語ですよね!


いきなりですが以下の画像をご覧ください!

この画像は、昨日投稿したnoteで使用したものです。

あまり変なところはないように見えますが、上部にある文字…


中国の屋台の文字みたいで、あまり雰囲気と合っていないですよね…


そこでここに反映される文字が

プロンプトに入力される言語に自動変換されて入力できれば

良いのではないかと考えました!



しかし、もしツールとして普及させようと考えている場合

上記能力だけでは

弱く、真似されやすい


ため、他の機能の追加も考えています!



具体的に考えている機能は二つです!

一つ目は

文字フォントの設定です!


日本語をうまく反映できるようになったら

文字フォントを、あらかじめ決められたプロンプトを入力することで

手軽に変更できるような機能が欲しいと思っています!

(入力コードみたいな感じです!)



最初のうちは、日本語を反映することが難しいという壁にぶち当たると思うので

ツール内に画像編集機能を設けたり、画像を切り取って適切な部分のみ

簡単に反映できるようにしたり…



現時点では、かなり《机上の空論》ですが

強く望んでいる機能の一つです!



二つ目は、画像を5つ以上アップロードして

機械学習させる機能です!



やはり日本語の反映だけでは、アンバランスになる気がしているので

デザインのもととなる画像をあらかじめアップロードして学習させ

それをもとに画像を生成する機能が必要だと感じました!



しかし、現時点でも画像をアップロードして学習させる機能はあるかもしれないので

もう一歩踏み込んだ案を提案しておきます!


それは…

Webデザインのノーコードツールのように

画像に配置するデザインの大枠をあらかじめ決める機能を付与すること

です!



例えば

画像の左上に言葉…

画像の右側部分を人物画像…

それ以外を画像背景…

のように視覚的に設定しておくことで
AIも画像を作りやすくなるのではないかと考えています!



これが正確に実現できれば

YouTubeのサムネイル

広告のデザイン

映画紹介画像

を簡単に実現できるようになるのではないか?


と思いました!



もちろん、私はAI関連のツールに関しては「ド素人」なので

かなり難しい…

もしくは


すでに一部は実現できている!


という意見があるかもしれませんが、一素人の意見として聞いていただければと思います!



今後AIがどのような進化を見せるのかわかりませんが

一つだけ確信していることがあります!


それは…

進化の過程は人間より早い


ことです!




その進化の過程のみを追い続け

鑑賞することがこれからの楽しみです。



今日の記事は以上です!

良ければいいね、コメントお願いします!




いいなと思ったら応援しよう!

花岬イブ@雑食SEOライター
サポートしていただけると今後の情報収集の幅が広がり、より質の高いコンテンツを追及できます。 どうかあなたの力を貸してください!

この記事が参加している募集