圧倒的な結果を出し続ける極予測AIとは?AI広告の仕組みをエンジニアが徹底考察
マーケターのみなさんなら、サイバーエージェントの「極予測AI」は当然、ご存知ですよね?
極予測AIは従来型と比べて2.6倍に迫る勝率を叩き出した、AI広告サービスの最先端。成果報酬型で既存1位超えのスコアを出した広告のみを提案してくれる、どこまでも”極まった”AIツールなんです!
当記事ではそんな極予測AIについて、その仕組みを徹底解剖。内部のAIモデルや処理フローについて、弊社エンジニアの予想をお届けします!
完読いただくと、広告運用のヒントが得られるかも……
ぜひ最後までお読みくださいね。
サイバーエージェントの「極予測AI」とは
「極予測AI」は、株式会社サイバーエージェントが送るAI搭載型の広告サービスです。その機能は……
バナー広告の効果予測・提案
動画広告の効果予測・提案
バナーと動画を併せた効果予測・提案(クロスフォーマット機能)
バナーの自動生成
というもの。先行テストにおいて、従来型のAI広告比で2.6倍に迫る勝率を叩き出しました。※1
さらにユーザーが支払う報酬は「成果報酬型」で、広告効果があった時にのみ発生。極予測AIは名前どおり、”極まった”広告サービスなんです。※2
なお、広告生成用のAIツールについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→生成AIで広告を自動作成するツール5選!注意点や企業事例を徹底解説!
「極予測AI」で使われているAIモデル予想
さてここからは、極予測AIの仕組みについて弊社エンジニアの見解を紹介。まずは極予測AIを構成しているであろう各AIモデルを解説していきます。
弊社エンジニアのリサーチによると、極予測AIには……
拡散モデル(画像生成AI)
画像認識モデル
予測モデル(回帰モデル)
の3種類のAIモデルが使用されているとのことです。まずは拡散モデルから、詳しくみていきましょう!
拡散モデル(画像生成AI)
極予測AIの広告バナー生成機能には、「拡散モデル」が搭載されています。
この拡散モデルは、テキストから画像を生成する(Text-to-image)AIモデル。Stable Diffusion / Midjourney / DALL-E 3などなど、主流の画像生成AIに採用されています。※3
その仕組みは以下のとおり、意外とシンプルです。
学習時:画像をノイズで塗りつぶす工程(拡散)を学習
画像生成時:学習時の逆処理で、ノイズから画像を生成
画像認識モデル
極予測AIの判断基準は、既存1位の広告スコアです。下図のとおり、それ以上のスコアを残した新規広告のみが公開されます。
この広告スコアの算出・比較の方法は、おそらく……
極予測AIの広告スコア算出方法
既存広告について、1位とそれ以外を分ける要因を抽出する
抽出した要因を数値化、既存1位の広告スコアとする
新規広告について、先ほどの要因を満たす度合い(スコア)を算出する
既存1位vs.新規でスコアを比較
というふうになっているはず。もしそうであれば、広告効果を分ける要因の抽出には、「画像認識モデル」が使われているでしょう。
予測モデル
極予測AIにおいて、新規広告の広告スコアを算出するのは「予測モデル」の役割です。
予測モデル(回帰モデル)は過去の出来事に対する数値変動から、未来の数値変動を予測するAIモデル。1位とそれ以外を分ける要因、つまり「広告の勝ちパターン」を基準にスコアを出しています。
「極予測AI」の仕組み
極予測AIは以下の流れで広告案を出している、というのが弊社エンジニアの予想です。
画像生成AI:広告バナーを生成
画像認識モデル:生成バナーから要点を抽出
予測モデル:生成バナーの広告効果を算出
予測モデル:算出したものを既存1位のスコアと比較
ユーザー:既存1位を超えた広告案を公開
この流れを図式化すると、下図のようになります。
ユーザーが極予測AIにプロンプトを入力すると、まずは画像生成AIが新規バナーを生成。命令文中の位置情報を参考に、レイアウトまで決定します。
その後生成したバナーを分析するのは、画像認識モデルです。広告効果に寄与する要素(勝ちパターン)だけを次の予測モデルに渡します。
最後は予測モデルの出番です。予測モデルは画像分析の結果から広告効果のスコアを算出し、既存1位のスコアと比較。既存1位を超えるスコアを出した広告のみをユーザーに提案します。
なお、各AIモデルについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→AIモデルとは?種類一覧やそれぞれの仕組み・開発における選び方を解説
その他「極予測AI」に関連するAIツール
最後に「極予測AI」に使われているモデルと関係があるAIツールを紹介します。それは……
Stable Diffusion 3
CogVLM
の2つです。それぞれ、概要をみていきましょう。
Stable Diffusion 3
「Stable Diffusion 3」は2024年2月に発表された、画像生成AI・Stable Diffusionの最新モデル。これまでのモデルと比べて、
画像内での文字の表現能力
複数の主題をもつ画像の生成能力
画像の品質
テキスト生成の品質
が大幅にUPしています。とくに文字の生成における進化は目覚ましく……
このように、ちゃんと読める文字が生成できちゃうんです。
ちなみにモデルチェンジにあたっては、ニューラルネットワークを見直しています。従来のU-Net畳み込みニューラルネットワーク(CNN)を廃止、なんとGPT-4やSora同様の「Transformer」を採用しているんです。
公式サイト:SD 3 Waitlist — Stability AI
CogVLM
「CogVLM」は画像の認識・理解ができるLLM、つまりマルチモーダル生成AIです。
その強みは、画像の細部をも見逃さない点にあります。同じくマルチモーダル生成AIのGPT-4VとCogVLMのそれぞれに、画像中の家の数を答えてもらうと……
なんとCogVLMは画像の右端に映り込む屋根を認識、「画像中に家は4軒ある」と正しく答えてくれるんです!
公式サイト:GitHub – THUDM/CogVLM: a state-of-the-art-level open visual language model | 多模态预训练模型
なお、CogVLMについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【CogVLM】GPT 4を超える精度のマルチモーダルAI!?サイゼリアの間違い探しをAIにやらせてみた | WEEL
目指すは既存1位超えの「極予測AI」
当記事では株式会社サイバーエージェントの「極予測AI」について、内部のAIモデルや処理フローを予想していきました。以下にてもう一度、極予測AIの処理の流れをみていきましょう!
画像生成AI:広告バナーを生成
画像認識モデル:生成バナーから要点を抽出
予測モデル:生成バナーの広告効果を算出
予測モデル:算出したものを既存1位のスコアと比較
ユーザー:既存1位を超えた広告案を公開
このように、既存1位を超えた広告のみを提案するのが極予測AIの特徴です。しかも報酬が発生するのは、広告の効果があった場合のみ。”極”の名は、伊達じゃありませんね。
参考記事