見出し画像

Weekly Report 2025/01/01 (wed)

個人的に気になったニュースや自主制作などの週報メモです。


自主制作 / 記事

Elemental Anima #0169

明けましておめでとうございます!今年も引き続きHAL(AI)と共にElemental Animaを制作しつつAI情報をまとめていきますので、よろしくお願いいたします!

今回も2022年に富士山登頂した際に撮影した雲海やご来光の写真をHAL(AI)に学習してもらい制作しています。今年はパーソナルなAIの方向に加速していく年になると感じているので、大切そうにHAL(AI)を抱える白蛇を描きました。逆に白蛇がHAL(AI)に囚われているのかもしれませんが・・・。弁財天の使い、水神などの要素を入れて縁起の良い年になるように祈りを込めて制作しています。

作業BGM:R.シュトラウス『交響詩「ツァラトゥストラはかく語りき」』


[映画] ソニック×シャドウ TOKYO MISSION

2024年最後に観てきました!ソニックファン兼ジム・キャリーファンの自分としては最高でした!ファンサービス、サプライズも満載で最初から最後まで楽しめました~!特に最後は驚きすぎて立ち上がりそうになりましたw
ご興味がありましたら是非!


[ニュース] AI関連

[AI活用] Travis Scott X Nike commercial

Travis ScottによるナイキのCMを制作するにあたり、AIで生成したビジュアルコンセプトのプロセスが公開されました。このバリエーション量とても分かります。様々な作品に携わる事が増えてきましたが、1シーンのバリエーション量はこれ以上に制作していますね。ナイキのCM現場でも活用されている事例も見れて良かったです。


[動画] PixVerse - PixVerse V3.5

βで使わせていただいていたPixVerse v3.5が公開されました。プロンプトと生成精度とはKlingの方が高かったですが1080pで10秒以内で生成できるのが良かったです。


[ComfyUI] ComfyUI - AniDoc

線画のAI自動着彩フレームワークAniDocのComfyUIカスタムノードが公開されました。


[画像] 1.58-bit FLUX

Fluxを1.58bitに量子化したモデル。モデルサイズが87%減、消費メモリも大幅削減した上で品質の劣化が無いとの事です。これはオプティマイズされ過ぎてちょっと半信半疑ですが、モデルとコードの公開を準備しているそうなので楽しみです。


[動画] KLING AI - Update

KLING AIの画像生成モデルKOLORS 1.5、エンドフレームの指定、リップシンク、ボイス生成、APIなどの発表がありました。VTONの精度も上がってますし、KLING AIは他の動画生成サービスの中でもアウトプットが安定していて使いやすいです。


[動画] Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

別アングルでも一貫性を保ち動画生成が出来るフレームワークです。


[動画] Google - Veo 2 活用例① "California Monsters"

Veo2とKling AI 1.6のリップシンク機能を活用しているとの事です。破壊などのエフェクト表現が興味深いです。


[動画] Google - Veo 2 活用例② "Physics Test"

逆に途中から物理無視するような挙動や現実ではありえない物理現象に切り替える事が出来るのかもテストしてみたいですね。


[動画] Running HunyuanVideo with 8GB VRAM

VRAM24GBでギリギリ動くぐらいだったのですが、いよいVRAM8GBでも生成できるようになりました。


[3D] Rodin Gen-1.5

Gen-1.5になり、トポロジーとメッシュがかなり綺麗になりましたね。RodinにはMicrosoftの研究者も参加しているので、TRELLISも活用していそうです。


[ComfyUI] ParaAttention

複数のGPUでHunyuanやFluxなどを並列で推論をして高速化するフレームワーク。家にかなGPUがあるのでこれは検証してみたいですね。


[記事] Googleの研究者ら、人間の意識が量子もつれから生まれる可能性を検証する実験を提唱 – 脳と量子コンピュータを結合する画期的な実験プロトコルを発表

ちょうど量子もつれに関心が向いている中で、この記事は興味深すぎますね。


[動画] From Slow Bidirectional to Fast Causal Video Generators

約15倍生成速度が速くなり、短いクリップのトレーニングで長時間のビデオ生成を可能にするフレームワークです。オープンソースモデルとして公開する予定との事で楽しみです。


[3D] GenHMR: Generative Human Mesh Recovery

動画から人の3Dメッシュを生成するフレームワークです。今まで見てきたものの中で一番精度が高いですね。


[GPU] GeForce RTX 5090 の消費電力は600Wに達する可能性大。16+6+7フェーズの電源を搭載

リーク情報にはなりますが、600Wとなると現在の4090と4070を二枚差している環境が難しいので、電源も新調しないといけないかもですね。1月6日no
CES 2025が楽しみすぎます。


[動画] Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

別アングルでも一貫性を保ち動画生成が出来るフレームワークです。


[画像] Try Off Anyone

バーチャル試着の逆のtryoff系も増え始めましたね。ComfyUIで動かせるようになった色々検証してみたいです。


[記事] 大手テック企業のAI投資減速がNVIDIAに「破壊的な」影響をもたらす可能性、半導体業界も警戒

CESでのnVidiaの発表にもよりますが、今年は何となく厳しそうな気がしますね。スケールの仕方が急すぎて様々な所で対応出来なくなっていきそうです。


[ロボット] CyberRobo - Wanda2.0

二足歩行ではないヒューマノイドロボットは珍しいですね。弓矢を放つテストはちょっと怖いですw


[ニュース] CG・ゲーム・リアルタイムエンジン関連

[Epic] バーチャル国際宇宙ステーションの3Dモデルを2週間限定で無償配布


[VRoid] VRoid Studio v2.1.0


[Epic] 「Unreal Engine Meetup Nara #1」のアーカイブ動画

いいなと思ったら応援しよう!