見出し画像

Weekly Report 2024/12/11 (wed)

個人的に気になったニュースや自主制作などの週報メモです。


自主制作 / 記事

Elemental Anima #0165

かなり寒くなってきて完全に冬になったと感じたので、今作は"冬将軍"をイメージしたシロフクロウを制作しました。Wikipediaにある"冬将軍"のイメージがかっこよかったので、構図など少しオマージュさせていただきました。
また、来週末に東京ミネラルショーに行く予定で、楽しみにしていたのもありクリスタルが混ざってしまいました。次の作品も結晶になる可能性がかなり高いです。
作業BGM:amazarashi『永遠市』


[ショートフィルム] Monument Valley 3: The Lighthouse

小さい頃からエッシャーが好きだったのでMonument Valleyはリリース時から好きなゲームでした。このショートフィルムは、ゲームの雰囲気や音、パズル要素を上手く映像として取り入れ、CGならではのカメラワーク、演出、質感により素晴らしい映像化になっていて本当に感動しました。映像的に気持ちが良すぎてずっとリピートしてしまいます。もしご興味がありましたら是非見て下さい。


[ニュース] AI関連

[動画] OpenAI - Sora

遂にOpenAIのSoraが公開されました。公開された瞬間にログイン出来たので色々試してみました。精度に関しては実写系と物理現象への理解度が一番高いと感じました。また、UIもシンプルで編集機能やストーリーボード機能など使い易いですね。ですが、現状、クレジットの消費量が多く、アクセス集中による生成速度がかなり遅いです。少し試しに検証するぐらいにはちょうどいいですが、個人的にはオープンソースのHunyuanが現状一番バランスが良いかなと思います。残る動画生成AIは、GoogleとBlack Forest LabとMidjouneyですね。Soraの公開で環境がどのように変わっていくのか楽しみです。


[企業] Open AI - 12 Days of OpenAI

OpenAIが12日間、発表や公開をし続けています。Soraもその一環で公開されました。情報量が多すぎてまとめきれませんが、個人的にはOpenAI o1の精度とファインチューニングの発表が驚きました。Googleもその裏で量子チップやGeminiの新モデルを発表していたり、年末に向けて生成AI関連が活発化してますね。


[LLM] Google - Gemini exp-1206

そんなOpenAIの発表祭りの中、Googleがこっそり200万トークンのGemini exp-1206を発表して1位になっていました。o1-proのリーダーボードのスコアが気になりますが、Gemini exp-1206は無料で使えるのが強すぎますね。


[ゲーム] Google - Genie 2: A large-scale foundation world model

画像1枚からゲームを生成するAIモデルです。もう結構出来ちゃってますね・・・。Googleさんの勢いが凄すぎます。


[VLM] Google - Pali Gemma 2

googleさんVLMがアップデートしました。ファインチューニングもしやすいとの事なので、これを元にクオリティラインを学習させて、画像や動画のチェックするワークフローを更に良く出来そうです。


[動画] Runway - Act-One アップデート

Act-Oneがアップデートされて既存の動画から表情の演技を移し替える機能が使えるようになりました。


[企業] Luma AI × Amazon partnership

LumaAIには新しい動画モデルの公開を楽しみにしてます。


[画像] cat-vton-flux Update / cat-tryoff-flux

以前シェアしたバーチャル試着モデルCatVtonとFluxを合わせたcatvton-fluxがアップデートして、服を着ているモデルから服だけを抽出するTryoff機能が付きました。この機能は欲しいと思っていたのでありがたいです。すぐ実装しようと思います。


[3D] microsoft - TRELLIS

microsoftによる3D生成AIモデルです。ComfyUIも対応していたので検証しようと思います。Frolence 2も含めてmicrosoftのAIモデルは比較的軽量で精度も高くバランスが良くてありがたいです。


[3D] TEXGen: a Generative Diffusion Model for Mesh Textures

3Dアセットのテクスチャーを生成するフレームワークです。TRELLISと組みあせたらかなり効率が上がりそうですね。


[画像] X、AI「Grok」無料で試せるように 写真みたいな画像も生成できる

Grok 2が無料版ユーザーに解放され、Fluxの画像生成も可能になりました。


[動画] VISION XL: High Definition Video Inverse Problem Solver using Latent Diffusion Models

SDXLを活用した動画のアップスケーラーモデルです。動画のアップスケーラーは現状商用のTopazが一番優秀です。個人的には、ローカルでも出来るレベルの物が出て欲しとおもっていたので、Vision XLは楽しみです。


[動画] Google - Motion Prompting

今週はGoogleさん祭りですね。モーションにで欲しい機能が全てまとまったようなフレームワークです。サンプルが凄いので興味がありましたらぜひ。


[画像] nVidia - Generative Photography

これは、かなり興味深いアプローチですね。フォーカスやシャッタースピード、色温度などカメラの数値設定をプロンプトで使用できるようになっています。かなり細かい修正が出来るようになるのでこれは実装して欲しいですね。


[ComfyUI] Con Delta

プロンプトのConditioningから別のプロンプトを使って差し引くことが出来る。ネガティブプロンプトの様な感じですね。Fluxはネガティブプロンプトが使えないので、このアプローチはありがたいです。


[動画] Hunhuyan - video to video

ローカル環境で、この精度のVideo to Videoが出来るようになったのは本当に嬉しいですね。


[記事] 10の25乗年かかる計算を5分未満で Google、新量子チップ「Willow」発表 量子エラー訂正で「閾値以下」達成

OpenAIが色々発表しまくっている中、遂にGoogleから量子チップが発表されました。量子チップを使った自作PCが一般的に組めるようになるまではどれぐらいかかるのか。楽しみすぎますね。


[記事] 【コロプラ】Stability AIとパートナーシップを締結

コロプラもAIを活用していくのですね。ソシャゲ周りでのAI活用は広がっていきそうです。


[記事] Niantic - Splats Change Everything: Why a once-obscure technology is taking the 3D graphics world, and Niantic, by storm

NianticによるGaussian splatsの歴史と未来がまとまって待っていますので、ご興味がありましたら是非。


[ニュース] CG・ゲーム・リアルタイムエンジン関連

[カンファレンス] Mayaで始める!自作キャラクターをモデリングする楽しさとその実践 ~VRChatアバター作成のためのテクニック~


[記事] Live2D社、Live2Dデータベースを公開…Live2Dを利用した商用作品やそれに関わったクリエイターの叡智を蓄積・共有することを目的に

いいなと思ったら応援しよう!