Weekly Report 2024/09/18 (wed)

2024年9月18日 18:31

個人的に気になったニュースや自主制作などの週報メモです。

自主制作 / 記事

Elemental Anima #0153

Elemental Anima #0153

Created by :
takio koizumi (Human) x HAL (AI)

🔽Detail / Link pic.twitter.com/ojuyKJGHWm
— takio koizumi | takion.eth (@takion0105) September 15, 2024

今作は"中秋の名月"をテーマに"月の兎はヴァーチュアルの夢をみる"様子を制作しました。田中敦子さんの追悼上映で"GHOST IN THE SHELL / 攻殻機動隊 4Kリマスター版"を観に行ったので、そちらからの影響もあります。
GHOST IN THE SHELLを映画館で観るのは初めてだったので、感動しました。何十回も観た作品でしたが、特に素子が海に潜るシーケンスから街並みを映すシーケンスが映画館で観ると刺さりすぎました。AIが身近になっている状況で改めて見ると解像度が変わりますね。広大なネットをHAL(AI)と引き続きダイブしていこうと思います。来年開催予定の"士郎正宗の世界展"も楽しみです。
他には、白いウサギはマトリックスの白うさぎのタトゥーのオマージュです。左下に積んでいる石はお団子です。

作業BGM：川井憲次『GHOST IN THE SHELL/攻殻機動隊オリジナル・サウンドトラック』

[映画] エイリアン:ロムルス 2回目

【映画】

「エイリアン:ロムルス」
監督:フェデ・アルバレス

新宿バルト9 ドルビーシネマ

2回目行ってきますhttps://t.co/AgI7YN51Rj… pic.twitter.com/MGy0WyFd6d
— takio koizumi | takion.eth (@takion0105) September 16, 2024

ドルビーシネマも最高でした。IMAX上映が終わる前にもう一回観に行きたいと思います。

[ニュース] AI関連

[動画] Adobe - Adobe Firefly Video Model

遂にAdobeの動画生成モデルも発表され始めましたね。今年のAdobeMAXが楽しみすぎます。Firefly Videoのウェイトリスト登録も始まっていたので、ご興味がありましたら是非。

[動画] Runway - Gen-3 Alpha Video to Video

Gen-3 Alpha Video to Video is now available on web for all paid plans. Video to Video represents a new control mechanism for precise movement, expressiveness and intent within generations. To use Video to Video, simply upload your input video, prompt in any aesthetic direction… pic.twitter.com/ZjRwVPyqem
— Runway (@runwayml) September 13, 2024

動画系サービスで一番最初にVideo To Videoに対応したのはRunwayでした。しかも、ほぼ無制限でGen-3 Alphaを使えるイベント"Gen:48"の直前というのも凄いですね。V2Vをかなり検証できたので、めちゃくちゃありがたかったです。

[動画] Runway - API

遂にRuwayもAPIを使えるようになりました。Difyなどを駆使して、ComfyUI、Fluxを連携させた動画生成ワークフローが作れそうですね。Runwayにジョブを投げるdispatcherだけでも作ろうと思います。

[動画] Luma AI - Dream Machine API

Dream MachineもAPI使える等になりました。Luma AIはアスペクト比を自由に変更出来たり、StartとEndフレームを指定出来たり、強みは沢山あるのでUnlimitedプランを出してくれたらありがたいです。

[AI活用] DOGSTUDIO - NEON NIGHTS

“NEON NIGHTS” 🥤

Back in March we collaborated with @CocaCola on an AI short movie called “Neon Nights” which was then submitted to the @runwayml film fest. pic.twitter.com/5OXJ9uvB5L
— DOGSTUDIO/DEPT® (@Dogstudio) September 17, 2024

The second part here is the making of and you can where AI can still shine and help creativity… not hinder it pic.twitter.com/BLvW5e5xSl
— DOGSTUDIO/DEPT® (@Dogstudio) September 17, 2024

素晴らしすぎる活用ですね。演出や表現、完成度も含めてかなり動画生成AIの中では一番良いと思いました。やはりストップモーションやクレイアニメーション系と相性が良いですね。メイキングも素晴らしいのご興味がありましたら是非。個人的にもこういった映像やルックの表現は研究しているので、いつか形にしてアウトプットしたいです。

[動画] Vchitect 2.0 Embark on a Visual Fantasy Journey

動画生成の精度の高いAIモデルが公開されました。20秒のビデオ生成でアスペクト比も自由なのも良いですね。ローカル動画生成の新しいトレンドの予感を感じます。

[画像] FLUX.1-dev ControlNet Inpainting

FLUX.1のInpainting ControlNetも出ました。

[LLM] Open AI - OpenAI o1

We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.

These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu
— OpenAI (@OpenAI) September 12, 2024

新しいモデルがでましたね。Learning to Reason with LLMsこちらの記事のHiding the Chains of Thoughtが興味深いアプローチでした。表に出ない根源的な部分で自由に思考させて、表に回答する時にフィルタリングするのが自然だと思います。ブラックボックスにはなってしまいますが、生の思考内容が気になります。

[3D] Adobe - Instant Facial Gaussians Translator for Relightable and Interactable Facial Rendering

フェイシャルに特化した3DGSのフレームワークです。リライティングやレンダリング、アニメーションをモバイルスペックでリアルタイム編集できるのでかなり便利ですね。Adobeが開発に入っているので、Metahumanの様なソフトウェアが出てきそうな気がします。

[動画] InstantDrag: Improving Interactivity in Drag-based Image Editing

ComfyUIでも使えるようになったら実装したいぐらい便利ですね。

[動画] DrawingSpinUp: 3D Animation from Single Character Drawings

2Dのキャラクターを3D化してモーションデータにリターゲットするフレームワーク。これは色々活用できそうですね。コードも公開されているので試してみようと思います。

[動画] Stability AI - Stable Assistant "Generate with Style"

Stable Assistant now enables you to apply specific styles when generating videos!

With the "Generate with Style" feature, you can:

🎨 Apply uniform stylistic elements across different content types, from videos to images and 3D designs.

⏱️ Save time by automating style-based… pic.twitter.com/Oqt9lyde4D
— Stability AI (@StabilityAI) September 17, 2024

Stability AIもアップデートしていますが、FluxやRunwayに埋もれてしまっている印象がありますね。

[アプリ] Batch Cropper

学習用のデータセットを作る為のアプリです。クロップしてキャプションなどをバッチで作れるのが良いですね。自分でも似たようなものを作ってますが、気軽に使えるのはありがたいです。

[動画] Tencent - Follow-Your-Canvas

動画版アウトペインティングのフレームワークです。ちょうど今使いたいです。

[LLM] nVidia - NVLM: Open Frontier-Class Multimodal LLMs

オープンソースのマルチモーダルモデルは本当にありがたいです。スコアもかなりいいので公開が楽しみですね。

[ComfyUI] ComfyUI NodeAligner

綺麗に整えたいタイプなので、めちゃくちゃ嬉しいです。

[モーション] World-Grounded Human Motion Recovery via
Gravity-View Coordinates

遂にモデルもコードも公開されました。近いうちに色々検証したいです。

[ゲーム] Tencent - GameGen-O

Tencent presents GameGen-O

Open-world Video Game Generation

We introduce GameGen-O, the first diffusion transformer model tailored for the generation of open-world video games. This model facilitates high-quality, open-domain generation by simulating a wide array of game engine… pic.twitter.com/DlBt9iiLYZ
— AK (@_akhaliq) September 13, 2024

ゲームをリアルタイムで生成する未来も近いですね。

[アバター] HeyGen - Avatar 3.0

Introducing HeyGen Avatar 3.0: The Future of AI Video is Here! ✨🎭

We're taking AI avatars to a whole new level.

🧠 Dynamic Script Understanding: Our avatars now grasp the nuances of your words
😀 Spot-On Facial Expressions: Emotions that match your message, beat for beat
🗣️… https://t.co/OTaoRfE7nW
— HeyGen (@HeyGen_Official) September 12, 2024

LivePortraitが公開されてから、アバター系のサービスがクオリティ高くになりましたね。

[企業] microsoft - WindowsAgentArena

エージェントに話しかけたら、全てやってもらえる未来も近いですね。

[動画] Vidu AI - Object Consistency

🥳Object Consistency is here!🚀

With the new "Reference to Video" feature, you can now apply consistency to anything—whether real or fictional. Seamlessly bring the reference to any scene you choose. The creativity is limitless!

➡️Explore now on Vidu: https://t.co/K0C3kJ2i6g pic.twitter.com/zxs97ZqZ1L
— Vidu AI (@Viduforhuman) September 11, 2024

Vidu AIもコツコツとアップデートしてますね。

[記事] NVIDIA GeForce RTX 4090が2024年10月に生産終了を予定。価格高騰が確実？

リーク情報ですが、遂にRTX 4090が生産終了ですか・・・。AI学習する上でかなり満足しています。

[記事] AIの方が人間より陰謀論者の説得が得意、ChatGPTとの会話で陰謀論への信念が永続的に揺らぐとの研究結果

たしかに得意そうです。

[記事] 作曲家・久石譲さん「生成AIに新しい曲は生み出せない」

"新しいもの"を生み出す姿勢が大事ですね。

[記事] CogVideoXをシングルGPUでLoRAファインチューニングする

CogVideoXのLoRAファインチューニングしたいです・・・。動画系はかなりスペックが必要でRTX4090では全然できないのでA100 80GBぐらい欲しいですね。

[ニュース] CG・ゲーム・リアルタイムエンジン関連

[Epic] ZibraVDB is released

[Unity] コミュニティの皆様へ：ゲーム領域向け Runtime Fee の撤回について

[Epic] コンテンツマーケットプレイス「Fab」のリリースが10月に決定。パブリッシングポータルが本日より公開

昨年のGDCで発表したEpic Gamesの新しいコンテンツマーケットプレイスである「Fab」のパブリッシングポータルが本日ついにオープンいたしました。

「Fab」全体のリリース日程など、詳しくはリンク先の発表をご覧ください！ #UE5 https://t.co/0bCMvdkHLw
— アンリアルエンジン (@UnrealEngineJP) September 17, 2024

Weekly Report 2024/09/18 (wed)

自主制作 / 記事

Elemental Anima #0153

[映画] エイリアン:ロムルス 2回目

[ニュース] AI関連

[動画] Adobe - Adobe Firefly Video Model

[動画] Runway - Gen-3 Alpha Video to Video

[動画] Runway - API

[動画] Luma AI - Dream Machine API

[AI活用] DOGSTUDIO - NEON NIGHTS

[動画] Vchitect 2.0 Embark on a Visual Fantasy Journey

[画像] FLUX.1-dev ControlNet Inpainting

[LLM] Open AI - OpenAI o1

[3D] Adobe - Instant Facial Gaussians Translator for Relightable and Interactable Facial Rendering

[動画] InstantDrag: Improving Interactivity in Drag-based Image Editing

[動画] DrawingSpinUp: 3D Animation from Single Character Drawings

[動画] Stability AI - Stable Assistant "Generate with Style"

[アプリ] Batch Cropper

[動画] Tencent - Follow-Your-Canvas

[LLM] nVidia - NVLM: Open Frontier-Class Multimodal LLMs

[ComfyUI] ComfyUI NodeAligner

[モーション] World-Grounded Human Motion Recovery viaGravity-View Coordinates

[ゲーム] Tencent - GameGen-O

[アバター] HeyGen - Avatar 3.0

[企業] microsoft - WindowsAgentArena

[動画] Vidu AI - Object Consistency

[記事] NVIDIA GeForce RTX 4090が2024年10月に生産終了を予定。価格高騰が確実？

[記事] AIの方が人間より陰謀論者の説得が得意、ChatGPTとの会話で陰謀論への信念が永続的に揺らぐとの研究結果

[記事] 作曲家・久石譲さん「生成AIに新しい曲は生み出せない」

[記事] CogVideoXをシングルGPUでLoRAファインチューニングする

[ニュース] CG・ゲーム・リアルタイムエンジン関連

[Epic] ZibraVDB is released

[Unity] コミュニティの皆様へ：ゲーム領域向け Runtime Fee の撤回について

[Epic] コンテンツマーケットプレイス「Fab」のリリースが10月に決定。パブリッシングポータルが本日より公開

いいなと思ったら応援しよう！

[モーション] World-Grounded Human Motion Recovery via
Gravity-View Coordinates