本日の日記 - Midjourneyを超えたMystic V2の表現力、4k(5,440 x 3,072)で生成できる画像生成AIはMystic V2だけ/Diary 2024/10/01
Ce journal est une sorte de mémo sur les activités quotidiennes du projet Generative AI.
この日記は「自分用のメモ」であり、SNSの代替
公式のライブ配信がある日は更新されない
PCを使っていると「ですます調」、スマホで書いていると「である調」になりやすい
10月1日(火)午前
今朝、追加で灯油を調達。先月からストーブなしでは生活できないくらい寒くなっている。こちらは冬間近である。
10月になった。
残り3か月(91日)となり、2025年度の計画も大詰め(急げ!)。
先月は公式のライブ(ゲスト出演)が多かったので、日記を更新できなかったが今月は通常のペースに戻りそう。
リアル参加はほぼ不可能な状況なので、全てリモート出演だったが有意義なイベントばかりで感謝。
早朝3時26分、Luma Dream Machine V1.6 リリース。
KLINGは19日にV1.5になり、1080pで生成できるようになっている。さらにモーションブラシも近々実装される。
Runway Gen-3 Alphaも一昨日、トリム機能が追加されていた。
動画生成AIの新機能追加、仕様変更のスピード、とにかく速い。
こちらには野良ネコがいないので(キツネは時々見かける)、ネコ好きとしては寂しい日々を送っているが、Xのフィードには猫動画しか流れないので若干の癒しにはなっている。
本日の宇宙猫:
早朝、AdobeのAIとビデオに関する新しい動画が公開されていたので視聴。
5部構成で今回はエピソード3である。映像業界のベテラン達と対談するシリーズで、映像とAIテクノロジーについて語る。
1日(火)午後
次世代の画像生成AI「Mystic V2 (Beta)」
Midjourney V6.1を超えた次世代の画像生成AI「Mystic V2 (Beta)」の検証。
Mystic V2 (Beta)の詳細については、先週の報告会で話している(ダイジェスト版のアーカイブ動画を公開中)。Midjourney V6.1との比較も。
Midjourney V6.1の生成画像をCreative Upscalerで品質向上させたレベルと同等。しかも、4Kである。
4Kサイズで生成できる画像生成AIは、Mystic V2 (Beta)だけ。
2k(2,720 x 1,536) - 7クレジット消費
4k(5,440 x 3,072) - 22クレジット消費
FLUXベースだが、Magnificのテクノロジーが入っているので生成画像の品質が高い。前述したとおり、Midjourney V6.1の生成画像をCreative Upscalerで品質向上させたレベル。つまり、Midjourney V6.1を上回っている。
問題はコストである。Magnificで提供されているので、月額5,900円。
Midjourney並みの使い方をすると、Proプランでもクレジットが足りない(Midjourneyは1回4画像生成するがMystic V2 (Beta)は1画像しか生成しない)。
Proプラン:月額 5,900円
Premiumプラン:月額 14,500円
Enterpriseプラン:月額43,600円
生成AIを導入しているデザイン制作会社などは、Magnificは必須のツールになっているので、すでにMidjourneyの代替として検証を始めている。
生成画像を使って写真集を表現したいなら、MidjourneyよりMystic V2 (Beta)の方が適している。
ただ、Midjourneyは新バージョンのV6.2が控えているのであくまで「今のところ」Mystic V2 (Beta)の方が優れている、という評価。
まだベータ版なので、時々処理が止まる。
Runway Gen-3 Alphaよりは少ない(Runwayは毎週何らかの障害が発生する)。
生成される画像がリアル過ぎるので、好みではない人もいると思うが、パラメータ設定で(過度に美化する)AI顔の人物も生成可能。
以下は、Creative detailingの値を80にしているのでリアリズムが強調されている。値を下げるとAI画像らしく美化される。
Midjourney V6.1と比較:
ディテールの精度がかなり違う。
KLING AIにリップシンク機能搭載
KLINGにリップシンク機能が実装されたので試してみる。
10秒のビデオを生成して、リップシンクさせてみた(10秒のサウンドファイルをアップロード)。
仕様はRunwayと同じ。近々実装されるモーションブラシもそうだが、Runway対抗機能である。
数回試してみたが、悪くはない。
ビデオの内容によってリップシンクの結果が異なるので試行錯誤は必要だが、期待どおりの結果が得られることもある。
Runwayのリックシンクでうまくいかない場合、KLINGで試すことが可能になった。
KLING 1.5の生成ビデオは「1,888 x 1056」、Runway Gen-3 Alphaは「1280 x 768」。
1日(火)夜
Adobe Fireflyの生成画像を映像化するテスト
Runway Gen-3 Alphaのポートレートモード (9:16) で生成。
1日(火)深夜
深夜12時49分、Pikaがバージョン1.5に。
第3世代の動画生成AIがまた1つ増えた。Pika復活。
約4か月ぶりにPikaにアクセス。
生成処理にすごい時間がかかりそうなので明日の朝まで待ってみよう。
更新日:2024年10月1日(火)/公開日:2024年10月1日(火)