見出し画像

【画像生成もできる】検索AI Genspark(ジェンスパーク)の進化がすごいので色々試してみた

このnoteは2024年12月30日のYouTubeの動画の内容をもとにAIで文字起こししたものです。

【プロフィール】

Oh my teeth CEO 西野誠(にしのまこと)
1994年生まれ。大学在学中にオープンロジにて創業期を経験。ワークスアプリケーションズに新卒入社し、大規模基幹システム開発に従事。2019年、Oh my teethを創業。日本初の通わない歯科矯正ブランドを東京と大阪6ストアで展開。体験者数は5万人を突破。Onlab 21th「DemoDay」最優秀賞 & オーディエンス賞、ICC 2022「D2Cカタパルト」優勝、ICC 2024「DXカタパルト」優勝、Forbes NEXT100 2024受賞。

▼YouTubeはこちら

メンバー:お疲れ様です。今日はGensparkの紹介ということで。

Nishino:変化がすごいです。今Genspark Fashionみたいなのも出てて、こういうお手本のコーデと自分の写真を組み合わせると自分が着たい服を仮想的に着れるみたいな。こんなのが出てきたりとか、元々Gensparkって検索AIじゃないですか。検索どこ行ったみたいな話なんですけど、そういう試着AIが出たりとか、あと画像生成AIも使えるようになって。面白いのは、例えば猫が泳いでいるとかやるじゃないですか。そうすると以前紹介した天秤AIの画像版みたいな感じで、複数のAIエンジンから画像生成AIから画像を出してくるみたいな。

Gensparkの画像生成

こっから面白いのはさらに、このオートプロンプトっていうのがすごくて。猫が泳いでるっていうのだけだとこんなぐらいのクオリティなんですが、
この自動プロンプトっていうのを押すとこういう風にやるといいですよみたいな。プロンプトを作ってくるんですよ4つ。これは考えることを結構放棄しがちだと思うんですけど。例えば水中で泳ぐ猫。楽しそうな表情、毛並みが水に浮かんでいる様子、クリスタルの水中とか…。っていうのができたり。

オートプロンプトで生成された画像

これスタイルが設定できてSoraでいうプリセットみたいな感じで。リアリティック、漫画とか。

Gensparkのスタイル設定

Gensparkってもうリサーチでしか使ってなかったけど、画像AIも結構こんなに発展してるって思って楽しんでます。

この後試したいのが天秤AIみたいな感じで、これ画像だけれども普通のタスクも各AIに同じプロンプトで投げてその結果をまとめるとかそういうこともできるんですよ。意外とGenspark、画像生成タスク得意ですよって話を紹介しました。

メンバー:プロンプトを提案してくれるAIって他になかったですよね。

Nishino:多分ないと思う。GPTとかに猫が呼んでる画像生成したいからプロンプト作成しろとか言ったらそれはできるけど、それもめんどくさいからこのぐらいでちょうどいいなっていう。どんどん楽できるなって感覚はしてます。こんな感じで結構まだ本当に触ったばっかりだけど、画像生成意外と今後ジェンスパークでやるのもありなのかなって思ってたりします。

過去昔僕がよくやってたのは、「!」が入ったパーカーとか。

メンバー:Nishinoさんが今着てるやつですね。

Nishino:はい。やっぱりまず最初に自動プロンプトが出来上がるあたりがめちゃくちゃいいですね。今まで自分やってたことがもう2.3って先読んでやられてるから、ストレスがないですね。やっぱり僕も今までやってたことってGPTで画像生成してもらって、そのプロンプトが読み取れるから、そのプロンプトを変更したりとか加工したりとかして作りたいような写真を作ってたけどなんかそれがもう自動でやられてる感じがして。

あーもうすごいわめっちゃ。すごいよね。でかいけど。

「!」がついたパーカーを着てるモデルを生成してもらった

日本人にして、びっくりマークはもう少し控えめにと。一旦自動プロンプトオンにしてやってみますか。

あーすごい。あなたは以前生成した画像をもとに日本人の男性が控えめな!マークが入ったパーカーを着ている…。マジ完璧。なんかこの意図、理解がいいっすよね。

短い指示でも意図を汲み取ってくれるGensparkさん

言語化、言語化ってめっちゃ言うじゃないですか。「言語化が全てだ」みたいな。なんかそれ不要になってく気もしてるんすよね。だから僕それよりやっぱ大事なのは、今まで多分説明が上手い人の方が良かったけど、そうじゃなくて「こうしたい」みたいな明確にビジョンがあるみたいな。説明能力、言語化能力とかわかりやすく説明する能力みたいなのはAIで得られるから。これまで研究者とかってなんかそこが苦手であんまり世に入れなかったとか、後から見つけられてこの人実はみたいなのあるじゃないですか。こうなるとIQが今回のでわかるように、「説明してください」とか言ったら出てくるわけだから。

おー小さくなってる。だいぶすごいんじゃない。日本人っぽさもありますね。

プロンプトがしっかり反映されている!

結構感動したな。これって会話の連続ってわかってるのかなと思ったけど。以前生成した画像をもとにちゃんとそこも補完してくれてる。

これをだからさ、秋じゃなくて冬にしてみたいな感じにしたらどうなんだとう。あえてこんくらいの言語化能力でいいのかっていうのを今練習してます。

雑なプロンプトでも理解力がすごい

完璧っすね。別に前回の画像とか一切書いてないじゃないですか。だけどこれが秋だったよねみたいな話から、冬にしてっていう言葉が来たということはこうだよねみたいな感じで。リフレクションして4パターンぐらい提案して、このスピードですよね。中身何使ってるんだろうな?4o miniって書いてあった気がする。

僕がありがたいのは本当にその言語化ですね。そこにリソースがさかない気楽さみたいなのがすごいある気がします。何が求められるかが本当変わった気がしますね。雑でもいいからなんかとにかく指示出せる人が強いみたいになってきそう。意志があるというか、こうしたいんだみたいな。冬なんだみたいな。これではないみたいなこと言っておけば100パターンとか出してくれるわけじゃないですか。そしたらこれだって言えるわけじゃないですか。逆にそういう意志がなかったらもうこれでいいんじゃないみたいになっちゃうと。

おー冬になった。

冬ver

しかもさこれを黒のパーカーとかぐらい指定してあげると文脈理解できるのかな。

ちゃんと読み取る

!は控えめとか言ってないけど控えめな白の感嘆符ってなってるね。

これ最後試そう。この人にしてってできるのかな。これできたらマジで感動だよね。

メンバーの顔は読み取れるのか?

この人にしてること文脈理解するのかな。でもさやっぱこういうAIのおかげなのか、人だったらさすがに雑というかさ、遠慮するかみたいなものをさ投げれるっていうのは人のリソースとか考えなくて言えそう。無邪気に試したいみたいな。

以前にアップロードされた画像の人物のスタイルを参考にしてほしいと要望がありますと。Taisukeさんの髪型は厚い髪を後ろに流したスタイルなんだ。(笑)スタイリッシュな髪型、髪を整えたボリュームのある。なんか髪型だけ特徴を捉えてる。

生成されたものw

でも髪変わってますね。次は顔もお願いしますとか言ったらどうなんだろう。ここで思ったのが、Gensparkは僕、逆に何を目指してるのか分かんなくなってきたっていう面白さがあります。これまで信頼できるAIの回答みたいな。「時間を節約より、良い結果」。効率よく回答集めるっていうことだと思ったけど、これ深いなと思ったのはあらゆることでそうなのかもしれないですね。会社のスローガンじゃないですけど、Gensparkの未来って画像であっても信頼できる回答を節約しより良い結果を得ようみたいな。

メンバー:これは仕事だったらどういう感じで使えそうですか?

Nishino:いいなと思ったのはこの「サイズ」。これもちろんGPTとかで画像生成する時も横長とか16対9でとかって指定するけど、これはデフォルトで指定できる。16対9、つまりこれはもうスライドのサイズなので例えば深刻そうな。実は日本人の2人に1人が歯並びに悩みを抱えている、矯正未治療というデータがありますというスライドに適切な挿入写真みたいな感じで言ってみると、、

爆速のプロンプト生成

とにかく早くない?いや本当にすごいと思った。やっぱね、僕o-1 Proとか使ってるけど、意外と最近遅いんですよ全てが。出てくるアウトプットの精度に驚くことはあるけど、なんかこの速さかみたいな。もともとこの速さすごかったねっていうのは忘れてたけど、これ見て改めて速いのが今すごすぎるなと思っちゃった。

なるほどね、もっと深刻そうな感じ。

生成された画像

こう見るとやっぱり複数に一気に動いてるなって感じしますよね。多くの人を手に入れた感じがありますよね、仲間に。デモ的にやるならば隠れ歯並びコンプレックスみたいなのがあるとした時に16対9になってないけど、こういう時はこんな感じで。なんかもうできそうじゃないですか。

今度イラストとかでやってみましょうか。なんかアイデアもいいですよね。今までこういうのって自分で考えたけど、一気にアイデアの切り口が提案されるのとかがまさに。

Gensparkに再度作成してもらったもの

すごいなと思ったのはさ、これ以前にSoraを使ってた時に僕プロンプトで指示してたの覚えてます?日本語と英語で平気してアウトプット出してくださいっていうのを自動でやってくれてるあたりが完璧というか、分かってますよね。

スライド Before

↓↓↓

スライド After

めっちゃ良い感じ。スライドについては過去の動画を見てほしいですけど、合ってるか分かんないけど。

分かった。このトーンで通院が面倒というシーンを作成してと。するとなんかシリーズものみたいにできないかなという。このトーンでって言ったのがなんかトンマナじゃなくて、深刻そうっていうそのトーンとかを意識してるとだとしたら多分アウトプットは違うくなりそう。

Oh!出てきた!

ちょっと違うけど、こんな感じ。

でもなんか使うイメージはついたと思います。全然スライドの印象が変わりましたね。こんな感じで使えるということです。

ここまで読んでくださりありがとうございました!
本内容は、YouTubeで毎朝7時に配信しているので、チャンネル登録して聞いていただけると嬉しいです。それでは本日もOh!全開でいきましょう


Oh my teeth 採用情報

Oh my teethでは、最速で未来の歯科矯正体験を社会実装する仲間を募集しています。我々と一緒にリアルとTechを駆使した事業創りを経験しませんか?
一緒に戦える仲間をたくさん募集中です!
▼職種の例
・マーケター
・ストアマネージャー
・セールスリーダー
・プロダクトマネージャー
・歯科衛生士少しでも興味持った方、物作りしたいなとか世界中に届ける物作りしてみたいという方はぜひまずは僕と15分面談させてください。

▼興味がある方は、西野と15分面談をしましょう!

Oh my teeth マウスピース矯正

通わないマウスピース矯正、Oh my teethが今大好評です。サクッと歯並びをきれいにしたい方、ぜひ無料診断に来てください。今導入クリニック大阪東京6店舗で展開しています。

無料診断はたったの3ステップ!
Step1: Oh my teethの専門クリニックに行く
🔎Step2:歯型スキャンスタート
3Dスキャナーで実施いたします。結果は最短即日でLINEでゲット!
🧑‍🔬Step3:矯正相談・プランのご提案
理想的な歯並びの擦り合わせを行います。

▶️無料診断を予約する
ついでにNishinoのLINE追加もお願いします!採用について、矯正について、気になることがあればお気軽にご連絡ください!

▼WebCMが配信中!

いいなと思ったら応援しよう!