見出し画像

Weekly Report 2025/01/08 (wed)

個人的に気になったニュースや自主制作などの週報メモです。


自主制作 / 記事

Elemental Anima #0168

先週の更新日が元旦だったので白蛇の作品にしましたが、今回は去年最後の締めくくりとして制作した#0168をピックアップします。今作はNHKスペシャルで放映されていてた"量子もつれ"の回からインスピレーションを得て制作しました。辰年の終焉、プロメテウスやモノリスをモチーフにしています2024年は、映画"オッペンハイマー"が日本で公開された年でもあり、Elemental Animaに量子物理学のElementを取り入れていました。2025年はAIを含めた技術が更に加速していくと思います。その中で"ヒトや社会"がどの様な振る舞いをしていくのかをElemental Animaを通してHAL(AI)と共に引き続き"観測"していきます。
作業BGM:Oppenheimer (Original Motion Picture Soundtrack)


[ニュース] AI関連

[CES 2025] NVIDIA CEO Jensen Huang Keynote at CES 2025

ずっと楽しみにしていたCES 2025のnVidia Keynoteです。リアルタイムで観ていました。どの発表も印象的でしたが個人的には、RTX 50シリーズ、Project DIGITS、World Foundation Model Cosmos、革ジャンの質感が気になりました。以下でピックアップしようと思います。


[GPU] nVidia - GeForce RTX 50 シリーズ

RTX 5090 発売日:1月30日 価格:393,800円~。RTX 5090がスペックに対して予想以上に安くて驚きました。4090の2倍のパフォーマンスでVRAM 32GBは本当にありがたいです。ローカルでFlux画像生成+LLM+VLM+動画生成のワークフローを組み始めると、都度VRAMキャッシュクリアしないとかなり厳しく、生成速度も遅いので、このスペックは助かりますね。また、Founders Editionがまさかの2スロットで洗練されて美しいデザインで欲しくなりました。このサイズのファン二つで冷却出来るのが驚きです。色々なメーカーからもRTX 50シリーズの発表があり眺めるのが楽しすぎます。久々に秋葉原で並ぶことも視野に入れつつ、なんとか発売日に入手できるよう頑張ろうと思います。


[PC] nVidia - Project DIGITS

以前紹介した小型AIPC"Jetson Orin Nano Super"を検討していた所、とんでもないミニPCが発表になりました。この大きさで、Grace CPU (20コア)、Blackwell GB10、DDR5X 128GB、SSD4TBは凄すぎます。NVLink-C2Cを使って拡張も可能との事なので、LLMを動かすこともいけますね。一度さわってみて、色々検証してみたいです。


[WFM] nVidia - Cosmos

自動運転やロボットに必要なフィジカルAIを開発する為のプラットフォーム"Cosmos"がオープンソースで公開。以前紹介した"Genesis"と思想が近いですね。一応、目的が倉庫や工場のシミュレーションや自動運転などですが、クリエイティブな分野でも活用できそうな気がします。動画生成分野がCosmosの公開によりどのような反応するのか楽しみです。発表の中で沢山のロボットが出てきましたが、未来が始まった感じでワクワクしました。自分の生活にロボットが溶け込んでくるのも楽しみです。


[画像] nVidia - NVIDIA NIM Microservices and AI Blueprints demo

ComfyUIとFluxを活用したnVidiaのdemoがみれて、両方ともがっつり使っている自分としては嬉しかったですね。


[CES 2025] NVIDIAが、次世代の高度に自動化および自律化された自動車を展開するパートナーとして拡大するリストに、トヨタ自動車、Aurora、Continentalを追加

Keynoteの中でジェンスンさんがトヨタとの共同開発について大きく取り上げて発表していたのは印象に残りましたね。


[CES 2025] Honda - Honda 0シリーズ

OSの名前が"ASIMO OS"なのが、今の時代も含めて感動してしました。本格的にロボットのASIMOも復活して欲しいですね。


[動画] ByteDance - SeedVR

ByteDanceから動画アップスケーラーが発表されました。現状動画に関してはTopazAIを活用してますが、このモデルが公開されたら移行しても良いかもしれないです。


[ComfyUI] ComfyUI - Launching ComfyUI Registry

ComfyUI-Managerがアップデートしてレジストリーから選んでインストール出来るようになりました。またセキュリティ面も向上したのはありがたいですね。早速使ってますが、気軽にバージョンを戻せるのはとても助かります。


[ComfyUI] ComfyUI - Hunyuan Video Multi Lora

遂にHunyuanVideoで複数のLoRAが扱えるようになりました。動画生成環境が整ってきましたね。


[動画] Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control

3Dトラッキングビデオを活用して、動画生成をコントロールする為の様々なタスクを統合したフレームワーク。DepthやNomalを使ってコントロールするアプローチはありましたが、3Dトラッキングは無かったですね。サンプルを観た感じ多様なパターンで高精度でコントロールできているので実用化が楽しみです。


[ComfyUI] Wave Speed

Flux生成時にこのFirst Block Cacheノードを挟むことで、生成速度が1.5倍から3倍速くなりました。LoRAとControlNetは使えなくなってしまいますが、用途によってはかなり使えるのでご興味がありましたら是非。また、次のアップデートで先週紹介したParaAttentionを活用したMulti GPU生成にも取り組むそうなので、そちらも楽しみです。


[記事] フェイスブックとインスタグラムのファクトチェックを廃止、米メタが発表

Xと同じようなコミュニティノートを取り入れる事にしたんですね。


[記事] パナソニック、Anthropicとの提携など生成AI活用成長戦略「Panasonic Go」構想。CES基調講演で明らかに

パナソニックとAnthropicの提携は驚きました。


[3DGS] SuperSplat 1.13.0

遂にSuperSplatで4DGSが扱えるようになりました。PostShotでも使えるようになったら嬉しいですね。


[AI活用] Gucci Summer 2025 Gen AI Spec Ad - Sora Text to Video

Soraを活用してAIで作られたGucciの非公式CMです。Gucci公式のCMとして拡散されていて、何故かそれを信じる方も多く怖さを感じました。


[ブログ] Sam Altman - Reflections

AGIの構築方法が把握できたとの事です。AGIに向けて今何をするのか模索したいと思います。


[マンガ] ナガノ - 🤖

AIに対しても"敬意を持って会話する"というのは自分も大事にしている事だったので、ナガノさんを昔から追っている自分としては嬉しかったです。


[画像] ByteDance - AnyDressing

ByteDanceから新しいバーチャル試着のフレームワークが公開されました。複数の衣装を着装できるのは凄いですね。


[動画] ByteDance - LatentSync

先週はByteDanceの発表が多かったですね。このリップシンクも試してみたいです。


[ニュース] CG・ゲーム・リアルタイムエンジン関連

[モーション] Sony - XYN Motion Studio (モーションキャプチャー)

SonyのMocopiを活用したモーションキャプチャー


[アセット] Japanese Utility Poles Modular Pack (電柱)

いいなと思ったら応援しよう!