見出し画像

本日の日記 - Midjourneyを超えたMystic V2の表現力、4k(5,440 x 3,072)で生成できる画像生成AIはMystic V2だけ/Diary 2024/10/01

Ce journal est une sorte de mémo sur les activités quotidiennes du projet Generative AI.

  • この日記は「自分用のメモ」であり、SNSの代替

  • 公式のライブ配信がある日は更新されない

  • PCを使っていると「ですます調」、スマホで書いていると「である調」になりやすい


10月1日(火)午前

今朝、追加で灯油を調達。先月からストーブなしでは生活できないくらい寒くなっている。こちらは冬間近である。

10月になった。
残り3か月(91日)となり、2025年度の計画も大詰め(急げ!)。

先月は公式のライブ(ゲスト出演)が多かったので、日記を更新できなかったが今月は通常のペースに戻りそう。
リアル参加はほぼ不可能な状況なので、全てリモート出演だったが有意義なイベントばかりで感謝。

早朝3時26分、Luma Dream Machine V1.6 リリース。
KLINGは19日にV1.5になり、1080pで生成できるようになっている。さらにモーションブラシも近々実装される。
Runway Gen-3 Alphaも一昨日、トリム機能が追加されていた。
動画生成AIの新機能追加、仕様変更のスピード、とにかく速い。


こちらには野良ネコがいないので(キツネは時々見かける)、ネコ好きとしては寂しい日々を送っているが、Xのフィードには猫動画しか流れないので若干の癒しにはなっている。

本日の宇宙猫:

A super cute Scottish Fold in a big shiny pink ball space suit is floating in a devastated futuristic city at night. --ar 16:9 --q 2 --style raw --s 500 --v 6.1

Midjourney V6.1


早朝、AdobeのAIとビデオに関する新しい動画が公開されていたので視聴。
5部構成で今回はエピソード3である。映像業界のベテラン達と対談するシリーズで、映像とAIテクノロジーについて語る。


1日(火)午後

次世代の画像生成AI「Mystic V2 (Beta)」

Midjourney V6.1を超えた次世代の画像生成AI「Mystic V2 (Beta)」の検証。
Mystic V2 (Beta)の詳細については、先週の報告会で話している(ダイジェスト版のアーカイブ動画を公開中)。Midjourney V6.1との比較も。

Midjourney V6.1の生成画像をCreative Upscalerで品質向上させたレベルと同等。しかも、4Kである。
4Kサイズで生成できる画像生成AIは、Mystic V2 (Beta)だけ。

  • 2k(2,720 x 1,536) - 7クレジット消費

  • 4k(5,440 x 3,072) - 22クレジット消費

Mystic V2 (Beta)
Mystic V2 (Beta)
Mystic V2 (Beta)
Mystic V2 (Beta)
Mystic V2 (Beta)

FLUXベースだが、Magnificのテクノロジーが入っているので生成画像の品質が高い。前述したとおり、Midjourney V6.1の生成画像をCreative Upscalerで品質向上させたレベル。つまり、Midjourney V6.1を上回っている。

Mystic V2 (Beta)はMagnificで提供されている

問題はコストである。Magnificで提供されているので、月額5,900円。
Midjourney並みの使い方をすると、Proプランでもクレジットが足りない(Midjourneyは1回4画像生成するがMystic V2 (Beta)は1画像しか生成しない)。

  • Proプラン:月額 5,900円

  • Premiumプラン:月額 14,500円

  • Enterpriseプラン:月額43,600円

生成AIを導入しているデザイン制作会社などは、Magnificは必須のツールになっているので、すでにMidjourneyの代替として検証を始めている。

生成画像を使って写真集を表現したいなら、MidjourneyよりMystic V2 (Beta)の方が適している。
ただ、Midjourneyは新バージョンのV6.2が控えているのであくまで「今のところ」Mystic V2 (Beta)の方が優れている、という評価。

Mystic V2 (Beta)
Mystic V2 (Beta)
Mystic V2 (Beta)

まだベータ版なので、時々処理が止まる。
Runway Gen-3 Alphaよりは少ない(Runwayは毎週何らかの障害が発生する)。

エラー発生で生成停止

生成される画像がリアル過ぎるので、好みではない人もいると思うが、パラメータ設定で(過度に美化する)AI顔の人物も生成可能。
以下は、Creative detailingの値を80にしているのでリアリズムが強調されている。値を下げるとAI画像らしく美化される。

Creative detailingの数値を上げるとリアリズムが増す、下げるとクリエイティビティが増す


Midjourney V6.1と比較:

ディテールの精度がかなり違う。

Kinemacolor 1960s Japan. Streetscapes of Japan's Showa Era, Old Japanese candy store, gothic style, severe thunderstorm, thick fog, surreal vintage Burglary messy, dark ambient, Lonely pay phones in Japan, dark dramatic, wide angle, moody, sad, dark.

Midjourney V6.1
Mystic V2 (Beta)


KLING AIにリップシンク機能搭載

KLINGにリップシンク機能が実装されたので試してみる。

KLING 1.5

10秒のビデオを生成して、リップシンクさせてみた(10秒のサウンドファイルをアップロード)。
仕様はRunwayと同じ。近々実装されるモーションブラシもそうだが、Runway対抗機能である。

Match Mouth Type (Lip Sync)

数回試してみたが、悪くはない。
ビデオの内容によってリップシンクの結果が異なるので試行錯誤は必要だが、期待どおりの結果が得られることもある。
Runwayのリックシンクでうまくいかない場合、KLINGで試すことが可能になった。
KLING 1.5の生成ビデオは「1,888 x 1056」、Runway Gen-3 Alphaは「1280 x 768」。


1日(火)夜

Adobe Fireflyの生成画像を映像化するテスト

Runway Gen-3 Alphaのポートレートモード (9:16) で生成。

Adobe Firefly
Runway Gen-3 Alpha
Adobe Fireflyの生成画像をRunway Gen-3 Alphaで動画化


1日(火)深夜

深夜12時49分、Pikaがバージョン1.5に。

第3世代の動画生成AIがまた1つ増えた。Pika復活。

約4か月ぶりにPikaにアクセス。
生成処理にすごい時間がかかりそうなので明日の朝まで待ってみよう。

Pika 1.5


2024年10月3日(木)へ


更新日:2024年10月1日(火)/公開日:2024年10月1日(火)

いいなと思ったら応援しよう!