見出し画像

本日の日記 - 次世代の画像生成AIはプロフェッショナルユーザー向け/Mystic V2 (beta)検証の続き/Diary 2024/10/03

Ce journal est une sorte de mémo sur les activités quotidiennes du projet Generative AI.

  • この日記は「自分用のメモ」であり、SNSの代替

  • 公式のライブ配信がある日は更新されない

  • PCを使っていると「ですます調」、スマホで書いていると「である調」になりやすい


10月3日(木)午前

厚めのダウンジャケットを調達して寒さ対策。
先月後半から石油ストーブをフル稼働しているが、外出時も防寒対策が必要になった。

こんな感じのダウンジャケット。

Midjourney V6.1によるイメージ


次世代の画像生成AI

デザイン業界・意見交換会で報告。

Mystic V2 (beta)の登場で次世代の画像生成AIが見えてきた。
2K / 4KがデフォルトなのでGPU負荷が大きくユーザーが負担するコストも高いので、プロフェッショナルユーザー向けと言ってよいかもしれない。
一般ユーザー(コンシューマー向け)には、現在のFLUXやImagen 3(ImageFX)のレベルで十分なので明確に差別化される。

そろそろリリースされる(はずの)Midjourney V6.2でもこのレベルではなく、V7.0まで待つことになりそう。

生成画像(Raw Image: 無加工)
生成画像(Raw Image: 無加工)
生成画像(Raw Image: 無加工)
生成画像(Raw Image: 無加工)
生成画像(Raw Image: 無加工)
生成画像(Raw Image: 無加工)
生成画像(Raw Image: 無加工)

COLORSプロジェクトのファッション雑誌の生成画像は全てやり直すことにした(今までMidjourney V6.1で生成した画像は破棄する)。
Mystic V2 (beta)を使用。

Midjourney V5.2からV6.0に変わった時も生成し直したが、今回はかなり大掛かりになりそう。いきなり4Kサイズがデフォルトになり、品質も大幅に向上しているからだ。

生成画像(Raw Image: 無加工)

映像制作では引き続き、Midjourneyがメインになる。
Mystic V2 (beta)をフルに使いたいが、数倍の費用がかかってしまう。


3日(木)午後

昨日Apple公式で公開されたWWDC22の切り抜き動画を観ておく。

馴染みのあるナビゲーションパターンを採用することで、App内の情報を簡単に調べることが可能になり、不必要な混乱を避けることができます。既存のナビゲーション構造を活用して、Appの特性を損なうことなく複雑なインタラクションを簡素化する方法を紹介します。タブバーやモダリティなどを扱う際のベストプラクティスや、よくある落とし穴をご確認ください。

https://www.youtube.com/watch?v=Kd02qR_LyA0


本日のオンライン研究会のために、念のためImagen 3の論文を確認。

https://arxiv.org/pdf/2408.07009


オンライン研究会でも、Mystic V2 (beta)について解説。
まだベータ版なので評価はできないが、プロフェッショナル仕様の先取りとして注視すべき画像生成AI技術であることは間違いない。

Mystic V2 (beta) - Magnific AI

close up, short brown hair super cute 18 japanese party kei fashion photography. young woman. white background.

Mystic V2 (beta)

プロンプトはしっかり書く必要がある。
Mystic V2 (beta)は高価なので、プロンプトの試行錯誤はMidjourenyでやっておいて、ある程度まとまったものを使った方がよい。
6,500 tokens/moの月額14,500円プランを使える人は必要なし(2,500 tokens/moの月額5,900円では足りないので…)。

Mystic V2 (beta)

そして、これが(次に来る)第4世代の動画生成AIではディテールを保持したまま動くようになる…

Mystic V2 (beta)


3日(木)夜

寒いので急遽、防寒マフラーを探す。
室内は暖房で暖かいが、外に出ると風が冷たい。

Midjourney V6.1によるイメージ


Adobe Elements ブランドから、Photoshop Elements 2025 と Premiere  Elements 2025が登場。どちらも19,580円。両方使えるバンドル版は、27,280円。
一般ユーザーを対象としたコンシューマー製品。
※Adobe Elements ブランドはサブスクリプションではない。1回限りの購入で3年間のライセンスが付与される。

数十年前だが、パソコンやスキャナー、デジカメなどにPhotoshop Elementsがバンドルされていた時代があり(CD-ROMが付属していた)、誰でも無料で使用することができた。子供の頃からPhotoshop Elementsに慣れ親しんでいた人の一部が現在、Photoshopの達人として活躍している。


オンラインで2025年度の講座に関する意見交換。
Firefly Videoのベータ版がリリースされたら、シラバスのたたき台を作成する予定。Firefly Video、MAXの14日にくるかどうか。

Available later this year, new Firefly-powered Text to Video and Image to Video capabilities will be available on Firefly.Adobe.com, and Generative Extend will be embedded directly into Premiere Pro, an industry-leading video editor.

https://news.adobe.com/news/2024/09/091124-adobe-previews-firefly-video-model


Runway Gen-3 Alpha、早くモーションブラシを実装してほしい。
プロンプトでは一部の領域を動かすことができないので、Gen-2でやっていた映像演出手法が使えない。

Runway Gen-3 Alpha

Runwayにまた新しいUIが…

Runway Gena-3 Alpha、「Video to Video」のボタンも追加されている

「Video to Video」のボタンをクリックすると、生成したビデオを対象にプロンプトで映像の内容を変更できる。

動画生成AIは毎週何かアップデートされるので、Discordで公式のアナウンスをチェックしていないと気がつかない。特にUIの改善はXなどのSNSには投稿しないので。

2024年10月5日(土)へ


更新日:2024年10月3日(木)/公開日:2024年10月3日(木)

いいなと思ったら応援しよう!