本日の日記 - 次世代の画像生成AIはプロフェッショナルユーザー向け/Mystic V2 (beta)検証の続き/Diary 2024/10/03
Ce journal est une sorte de mémo sur les activités quotidiennes du projet Generative AI.
この日記は「自分用のメモ」であり、SNSの代替
公式のライブ配信がある日は更新されない
PCを使っていると「ですます調」、スマホで書いていると「である調」になりやすい
10月3日(木)午前
厚めのダウンジャケットを調達して寒さ対策。
先月後半から石油ストーブをフル稼働しているが、外出時も防寒対策が必要になった。
こんな感じのダウンジャケット。
次世代の画像生成AI
デザイン業界・意見交換会で報告。
Mystic V2 (beta)の登場で次世代の画像生成AIが見えてきた。
2K / 4KがデフォルトなのでGPU負荷が大きくユーザーが負担するコストも高いので、プロフェッショナルユーザー向けと言ってよいかもしれない。
一般ユーザー(コンシューマー向け)には、現在のFLUXやImagen 3(ImageFX)のレベルで十分なので明確に差別化される。
そろそろリリースされる(はずの)Midjourney V6.2でもこのレベルではなく、V7.0まで待つことになりそう。
COLORSプロジェクトのファッション雑誌の生成画像は全てやり直すことにした(今までMidjourney V6.1で生成した画像は破棄する)。
Mystic V2 (beta)を使用。
Midjourney V5.2からV6.0に変わった時も生成し直したが、今回はかなり大掛かりになりそう。いきなり4Kサイズがデフォルトになり、品質も大幅に向上しているからだ。
映像制作では引き続き、Midjourneyがメインになる。
Mystic V2 (beta)をフルに使いたいが、数倍の費用がかかってしまう。
3日(木)午後
昨日Apple公式で公開されたWWDC22の切り抜き動画を観ておく。
本日のオンライン研究会のために、念のためImagen 3の論文を確認。
オンライン研究会でも、Mystic V2 (beta)について解説。
まだベータ版なので評価はできないが、プロフェッショナル仕様の先取りとして注視すべき画像生成AI技術であることは間違いない。
プロンプトはしっかり書く必要がある。
Mystic V2 (beta)は高価なので、プロンプトの試行錯誤はMidjourenyでやっておいて、ある程度まとまったものを使った方がよい。
6,500 tokens/moの月額14,500円プランを使える人は必要なし(2,500 tokens/moの月額5,900円では足りないので…)。
そして、これが(次に来る)第4世代の動画生成AIではディテールを保持したまま動くようになる…
3日(木)夜
寒いので急遽、防寒マフラーを探す。
室内は暖房で暖かいが、外に出ると風が冷たい。
Adobe Elements ブランドから、Photoshop Elements 2025 と Premiere Elements 2025が登場。どちらも19,580円。両方使えるバンドル版は、27,280円。
一般ユーザーを対象としたコンシューマー製品。
※Adobe Elements ブランドはサブスクリプションではない。1回限りの購入で3年間のライセンスが付与される。
数十年前だが、パソコンやスキャナー、デジカメなどにPhotoshop Elementsがバンドルされていた時代があり(CD-ROMが付属していた)、誰でも無料で使用することができた。子供の頃からPhotoshop Elementsに慣れ親しんでいた人の一部が現在、Photoshopの達人として活躍している。
オンラインで2025年度の講座に関する意見交換。
Firefly Videoのベータ版がリリースされたら、シラバスのたたき台を作成する予定。Firefly Video、MAXの14日にくるかどうか。
Runway Gen-3 Alpha、早くモーションブラシを実装してほしい。
プロンプトでは一部の領域を動かすことができないので、Gen-2でやっていた映像演出手法が使えない。
Runwayにまた新しいUIが…
「Video to Video」のボタンをクリックすると、生成したビデオを対象にプロンプトで映像の内容を変更できる。
動画生成AIは毎週何かアップデートされるので、Discordで公式のアナウンスをチェックしていないと気がつかない。特にUIの改善はXなどのSNSには投稿しないので。
更新日:2024年10月3日(木)/公開日:2024年10月3日(木)