見出し画像

圧倒的な結果を出し続ける極予測AIとは?AI広告の仕組みをエンジニアが徹底考察

マーケターのみなさんなら、サイバーエージェントの「極予測AI」は当然、ご存知ですよね?

極予測AIは従来型と比べて2.6倍に迫る勝率を叩き出した、AI広告サービスの最先端。成果報酬型で既存1位超えのスコアを出した広告のみを提案してくれる、どこまでも”極まった”AIツールなんです!

当記事ではそんな極予測AIについて、その仕組みを徹底解剖。内部のAIモデルや処理フローについて、弊社エンジニアの予想をお届けします!

完読いただくと、広告運用のヒントが得られるかも……

ぜひ最後までお読みくださいね。

サイバーエージェントの「極予測AI」とは

「極予測AI」は、株式会社サイバーエージェントが送るAI搭載型の広告サービスです。その機能は……

  • バナー広告の効果予測・提案

  • 動画広告の効果予測・提案

  • バナーと動画を併せた効果予測・提案(クロスフォーマット機能)

  • バナーの自動生成

というもの。先行テストにおいて、従来型のAI広告比で2.6倍に迫る勝率を叩き出しました。※1

さらにユーザーが支払う報酬は「成果報酬型」で、広告効果があった時にのみ発生。極予測AIは名前どおり、”極まった”広告サービスなんです。※2

なお、広告生成用のAIツールについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
生成AIで広告を自動作成するツール5選!注意点や企業事例を徹底解説!

「極予測AI」で使われているAIモデル予想

さてここからは、極予測AIの仕組みについて弊社エンジニアの見解を紹介。まずは極予測AIを構成しているであろう各AIモデルを解説していきます。

弊社エンジニアのリサーチによると、極予測AIには……

  • 拡散モデル(画像生成AI

  • 画像認識モデル

  • 予測モデル(回帰モデル)

の3種類のAIモデルが使用されているとのことです。まずは拡散モデルから、詳しくみていきましょう!

拡散モデル(画像生成AI)

極予測AIの広告バナー生成機能には、「拡散モデル」が搭載されています。

この拡散モデルは、テキストから画像を生成する(Text-to-image)AIモデル。Stable Diffusion / Midjourney / DALL-E 3などなど、主流の画像生成AIに採用されています。※3

その仕組みは以下のとおり、意外とシンプルです。

学習時:画像をノイズで塗りつぶす工程(拡散)を学習
画像生成時:学習時の逆処理で、ノイズから画像を生成

画像認識モデル

極予測AIの判断基準は、既存1位の広告スコアです。下図のとおり、それ以上のスコアを残した新規広告のみが公開されます。

この広告スコアの算出・比較の方法は、おそらく……

極予測AIの広告スコア算出方法

  1. 既存広告について、1位とそれ以外を分ける要因を抽出する

  2. 抽出した要因を数値化、既存1位の広告スコアとする

  3. 新規広告について、先ほどの要因を満たす度合い(スコア)を算出する

  4. 既存1位vs.新規でスコアを比較

というふうになっているはず。もしそうであれば、広告効果を分ける要因の抽出には、「画像認識モデル」が使われているでしょう。

予測モデル

極予測AIにおいて、新規広告の広告スコアを算出するのは「予測モデル」の役割です。

予測モデル(回帰モデル)は過去の出来事に対する数値変動から、未来の数値変動を予測するAIモデル。1位とそれ以外を分ける要因、つまり「広告の勝ちパターン」を基準にスコアを出しています。

「極予測AI」の仕組み

極予測AIは以下の流れで広告案を出している、というのが弊社エンジニアの予想です。

  1. 画像生成AI:広告バナーを生成

  2. 画像認識モデル:生成バナーから要点を抽出

  3. 予測モデル:生成バナーの広告効果を算出

  4. 予測モデル:算出したものを既存1位のスコアと比較

  5. ユーザー:既存1位を超えた広告案を公開

この流れを図式化すると、下図のようになります。


ユーザーが極予測AIにプロンプトを入力すると、まずは画像生成AIが新規バナーを生成。命令文中の位置情報を参考に、レイアウトまで決定します。

その後生成したバナーを分析するのは、画像認識モデルです。広告効果に寄与する要素(勝ちパターン)だけを次の予測モデルに渡します。

最後は予測モデルの出番です。予測モデルは画像分析の結果から広告効果のスコアを算出し、既存1位のスコアと比較。既存1位を超えるスコアを出した広告のみをユーザーに提案します。

なお、各AIモデルについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
AIモデルとは?種類一覧やそれぞれの仕組み・開発における選び方を解説

その他「極予測AI」に関連するAIツール

最後に「極予測AI」に使われているモデルと関係があるAIツールを紹介します。それは……

  • Stable Diffusion 3

  • CogVLM

の2つです。それぞれ、概要をみていきましょう。

Stable Diffusion 3

「Stable Diffusion 3」は2024年2月に発表された、画像生成AI・Stable Diffusionの最新モデル。これまでのモデルと比べて、

  • 画像内での文字の表現能力

  • 複数の主題をもつ画像の生成能力

  • 画像の品質

  • テキスト生成の品質

が大幅にUPしています。とくに文字の生成における進化は目覚ましく……

参考:https://ja.stability.ai/blog/stable-diffusion-3

このように、ちゃんと読める文字が生成できちゃうんです。

ちなみにモデルチェンジにあたっては、ニューラルネットワークを見直しています。従来のU-Net畳み込みニューラルネットワーク(CNN)を廃止、なんとGPT-4やSora同様の「Transformer」を採用しているんです。

公式サイト:SD 3 Waitlist — Stability AI

CogVLM

「CogVLM」は画像の認識・理解ができるLLM、つまりマルチモーダル生成AIです。

その強みは、画像の細部をも見逃さない点にあります。同じくマルチモーダル生成AIのGPT-4VとCogVLMのそれぞれに、画像中の家の数を答えてもらうと……


参考:https://github.com/THUDM/CogVLM

なんとCogVLMは画像の右端に映り込む屋根を認識、「画像中に家は4軒ある」と正しく答えてくれるんです!

公式サイト:GitHub – THUDM/CogVLM: a state-of-the-art-level open visual language model | 多模态预训练模型

なお、CogVLMについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
【CogVLM】GPT 4を超える精度のマルチモーダルAI!?サイゼリアの間違い探しをAIにやらせてみた | WEEL

目指すは既存1位超えの「極予測AI」

当記事では株式会社サイバーエージェントの「極予測AI」について、内部のAIモデルや処理フローを予想していきました。以下にてもう一度、極予測AIの処理の流れをみていきましょう!

  1. 画像生成AI:広告バナーを生成

  2. 画像認識モデル:生成バナーから要点を抽出

  3. 予測モデル:生成バナーの広告効果を算出

  4. 予測モデル:算出したものを既存1位のスコアと比較

  5. ユーザー:既存1位を超えた広告案を公開

このように、既存1位を超えた広告のみを提案するのが極予測AIの特徴です。しかも報酬が発生するのは、広告の効果があった場合のみ。”極”の名は、伊達じゃありませんね。

参考記事

いいなと思ったら応援しよう!