見出し画像

Azure AI FoundryへのStability AI Generative Visual Models の紹介

AI - Machine Learning Blog が良かったのでまとめてみた。

The Future Of AI: Deconstructing Contoso Chat - Learning GenAIOps in practice

🚀この記事のポイント

  • Stability AIとの協業により、Azure AI FoundryにStable Diffusion 3.5 Large、Stable Image Ultra、Stable Image Coreが導入された。

  • Stable Diffusion 3.5 Largeは81億パラメーターを持ち、高品質のテキスト・画像生成と初めてのimage-to-image機能を提供する。

  • Stable Image Ultraはフォトリアリスティックな生成に特化し、広告やマーケティングに最適。

  • Stable Image Coreは効率性と高品質を両立するモデル。

  • 広告、メディア、ゲーム、教育など、幅広い業界での活用が想定される。

  • 安全かつ責任あるAI運用を重視し、Azure AI FoundryのデフォルトでContent Safetyが有効。

  • Azure AI Foundryでは、数ステップでモデルをデプロイでき、データセキュリティやプライバシーも強化されている。


MicrosoftはAIによるビジュアル生成のリーダーのひとつであるStability AIと協業し、Stable Diffusion 3.5 Large、Stable Image Ultra、Stable Image CoreをAzure AI Foundryのモデルカタログにもたらすことを嬉しく思う。

Stable Diffusion 3.5 Large

パラメーター数81億に達するStable Diffusion 3.5は、Stable Diffusionファミリーで最も強力なモデル。MicrosoftとStability AIの協業によって、この洗練されたモデルが当社のカタログに加わり、Azure AI Foundryに初めてimage-to-image機能を導入する。テキストから画像への生成において優れた品質とプロンプトへの忠実性を発揮し、1メガピクセルの解像度でのプロフェッショナルなユースケースに最適となる。

上記の画像はすべてStable Diffusion 3.5 Largeを使用して作成されたもの。

Stable Diffusion 3.5 Largeは多様な出力を生成し、世界を反映するさまざまな肌の色や特徴を備えた画像を、詳細なプロンプトを必要とせずに作り出す。

上記の画像はすべてStable Diffusion 3.5 Largeを使用して作成されたもの。

Stability AIによると、このモデルは比類のない多様性を備え、3Dや写真から絵画や線画に至るまで、ほぼあらゆるスタイルのビジュアルを生成する。さらに彼らの分析では、Stable Diffusion 3.5 Largeはプロンプトへの忠実性で市場をリードし、より大規模なモデルと比べても画像品質で引けを取らないと示されている(Stability AIの分析による)

上記の画像はすべてStable Diffusion 3.5 Largeを使用して作成されたもの。

Stable Diffusion 3.5 Largeはテキストから画像への生成だけでなく、画像から画像への生成も行うことができる。画像から画像へのAIとは、元の構造を保ちながら、スタイルや内容、コンテクストなどを変えて、一つの画像を別の形に変換する生成的人工知能技術を指す。

Image-to-Imageモデルの応用例

  • スタイル転送: 写真を水彩やペン画など、特定のスタイルに似せた絵画へ変換する

  • 画像の修復: ノイズの除去、色補正、欠損部分の補完などによって、画像の明瞭度や品質を向上させる

Stable Diffusion 3.5 Largeは非常に高性能なAIモデルである一方、人や歴史的事象を事実に即して再現するようには訓練されていない。実際の正確性や真実性を必要とする用途は避けるべきであり、このモデルは事実を正確に再現することよりも、創造的・イラスト的な目的に最適化されている。

Stable Image Ultra

Stable Diffusion 3.5 Largeの高度な機能によって支えられるStable Image Ultraは、フォトリアリズムにおける新たな基準を打ち立てる。マーケティングや広告における製品イメージに最適であり、タイポグラフィ、動的照明、鮮やかな色彩表現にも秀でている。

Stable Image Core

強化されたSDXLを活用するStable Image Coreは、Stable Diffusionモデルに象徴される高品質な出力を維持しながら、卓越した速度と効率性を実現する。

Key Use Cases

Stability AIのモデルは幅広い業界をサポートするよう設計されており、プロフェッショナルが多様な用途に向けてプロレベルのビジュアルメディアを生成できるようにする。

  • 広告 & マーケティング: 高品質な製品画像やキャンペーン素材を作成する。

  • メディア & エンターテインメント: 映画、TV、オンラインコンテンツ向けのビジュアルを生成する。

  • ゲーム & メタバース: 没入感のあるゲームアセットや仮想環境を開発する。

  • 教育 & トレーニング: 教育用イラストや指導用ビジュアルを制作する。

  • 小売 & Eコマース: フォトリアリスティックな画像を用いて製品ディスプレイを強化する。

  • 出版: 独自のAI生成イラストによって編集コンテンツを支援する。

Responsible AI Considerations

Stability.aiによると、安全で責任あるAIの運用を信条としており、開発の初期段階からインテグリティを確保するために慎重な対策を講じているとのこと。これは、Stabilityが悪意ある利用者によるStability AIモデルの悪用を防ぐために、妥当な措置を既に行い、今後も継続して行うことを意味する。Stability AIの安全かつ倫理的なAI開発への取り組みについて詳しくは、Stable Safetyを参照。Azure AI Foundryのモデルカタログでは、Stability AIのモデルスイートにおいてAzure AI Content Safetyがデフォルトで有効になっており、無効化はできない。

Why Azure AI Foundry for Stability AI?

  • 強化されたセキュリティとデータプライバシー: Azureは顧客データを保護するため、データプライバシーとセキュリティを重視している。Azure AI Foundryのモデルカタログからモデルをデプロイする際のデータ取り扱いについては、こちらの記事を参照。

  • APIエンドポイントのプロビジョニング: 数秒でStability AIのエンドポイントを作成することが可能。

  • 実験: Azure AI Foundryのプレイグラウンドで試したり、一般的なLLMアプリ開発ツールと統合したりできる。

  • 安全に構築: Azure AI Content Safetyを活用して、信頼性が高く安全なアプリケーションを作り上げる。

How to deploy Stability AI models in model catalog?

Azure AI Foundryを使って最初のモデルをデプロイするには、以下の手順に従う:

  1. 慣れる: Azure AI Foundryが初めての場合は、まずこのドキュメントを参照し、基本を理解して最初のプロジェクトをセットアップする。

  2. モデルカタログにアクセス: AI Foundryでモデルカタログを開く。

  3. モデルを探す: MaaSアナウンスカードにある「View models」ボタンをクリックする。

  4. モデルを選択: リストからStability AIのモデルを開く。

  5. モデルをデプロイ: 「Deploy」をクリックし、マネージドコンピュートオプションを選択する。

Watch the Fireside Chat

経営層の視点やStability AIに関するより深い洞察を得るには、Stability AIのCEOであるPrem AkkarajuとのFireside Chatを視聴する。
Watch Microsoft VP Marco Casalaina interview Prem Akkaraju, CEO of Stability AI - YouTube

1. Stabilityの概要と取り組み
Generative Mediaへの特化
Stabilityは「生成系AI(Generative AI)」という呼称ではなく、あえて「Generative Media」と呼んでいる。
AIの中でも映像や音声などの生成に特化しており、Stable Diffusionで知られているが、動画や3D、言語モデルを含む幅広い分野の生成技術を扱っている。
ターゲットとする市場
対象とするのは「ビジュアルメディア市場」であり、映画・TV、ゲーム、広告、マーケティングなど、ビジュアル表現を行うあらゆるクリエイターを想定。
この領域の市場規模は5000億ドルから1兆ドルとも言われ、Stabilityはこの巨大市場を「変革(ディスラプト)」することを目指している。

2. クリエイティブ業界の反応
脅威としての捉え方
新技術導入の際には常につきまとう問題として、一部のクリエイターは「自分たちの仕事が奪われるのでは」という不安や脅威を感じている。
新たなテクノロジーがもたらす混乱や抵抗感は歴史的にも繰り返されてきた。
ツールとしての受容
一方で、多くのクリエイターは生成系AIを「新たな道具」として捉えている。AIの出現はマイクやカメラと同様に、創作をサポートするツールの一つに過ぎないという見方もある。
AIは機械的な作業や人間の苦手とする大量処理を得意とするが、ストーリーテリングや本質的な創造性は人間にしかできないという認識がある。

3. 責任あるAI(Responsible AI)へのアプローチ
大きな責任とパワー
「大きな力には大きな責任が伴う」という有名な言葉を引用し、強力な生成技術を扱う上で責任が重要だと強調。
政治家や著名人の偽映像・偽音声、ディープフェイクなどの悪用可能性への懸念が大きい。
オープンソースとデータセット管理
Stabilityは「本当の意味でのオープンソース」を標榜し、誰でも利用できるようにしている。
同時に、著名人や政治家の肖像・音声などを学習データから除外することで、悪用を防ぐ仕組みを取り入れている。
フィルタリング機能も導入し、不適切なコンテンツ(有名人の合成やアダルト表現など)が生成されないよう対策をしている。

4. Microsoft Azureとの提携
Azure AI Foundryとの連携
AzureのクラウドインフラとAI関連サービスを活用することで、Stabilityの生成モデルを大規模に効率よく動かせる。
アーティストやクリエイターがAIを気軽に使える環境を提供するというStabilityのビジョンと、Azureのインフラとセキュリティへの取り組みが一致している。
モデルカタログへの新たな可能性
Azure AI Foundryには主に大規模言語モデルが登録されているが、Stabilityのような画像・動画生成モデルはまだほとんどない。
AzureのプラットフォームにStabilityのモデルが加われば、多様な生成系AIを一括して利用できる環境が整い、ユーザーにとって大きなメリットとなる。

5. 今後の展望
「変わる部分」と「変わらない部分」
AIが進化してクリエイティブなプロセスを効率化しても、人間が生み出すストーリーテリングや本質的なアイデア出しのプロセスは今後も変わらないと考えている。
従来の手作業で多くの時間がかかる部分をAIで削減することで、より「創造性」に集中する環境を作りたいという意図がある。
「非クリエイティブな作業」の排除
クリエイターが持つ多くの「反復的・雑務的」タスクをAIが肩代わりすることで、より本質的な創造活動に時間を割くことができる。
Stabilityは、このワークフローの合理化と強化を目指す。

6. まとめ
Stabilityは、映像や音声といった「ビジュアルメディア生成」に特化したAI企業であり、大きな市場をターゲットとしている。
クリエイターには新技術に対する脅威と期待の両面があるが、Stabilityは「AIは新たなツールに過ぎない」と位置づけている。
責任あるAIの実装として、安全なデータセットの使用やフィルタリングを重視し、悪用リスクを最小化しようとしている。
Microsoft Azureとの連携により、スケーラブルで安全なAI活用環境を作ることができ、Stabilityのモデルをより多くの人に使ってもらうことが可能になる。
今後は、クリエイターの「本質的な創造作業」にフォーカスできるよう、非クリエイティブ部分の効率化を進めていく方針である。

Watch Microsoft VP Marco Casalaina interview Prem Akkaraju, CEO of Stability AI

Get Started with Stability AI

画期的な多様性、リアリズム、効率性を備えたStability AIのモデルは、プロレベルのビジュアルメディア制作においてAIがどのように支援できるかを再定義し、企業やクリエイターが簡単に魅力的な画像を生み出せるようにしている。Azure AI Foundryのモデルカタログを訪れて、高品質なビジュアルの生成を始める。

いいなと思ったら応援しよう!