見出し画像

Weekly Report 2024/12/18 (wed)

個人的に気になったニュースや自主制作などの週報メモです。


自主制作 / 記事

Elemental Anima #0166

先日、東京ミネラルショーに行ってきました。そのイベントで許可をいただき撮影した鉱物の写真や購入した鉱物を活用してデータセットを作りHAL(AI)に学習して今作を制作しました。沢山の種類の鉱物に触れて感じたエネルギーをHAL(AI)と共に作品として表現する為に、鉱物のElementを持つ蝶の鱗粉から鉱物が生まれる様子を描きました。欲しい鉱物が多すぎて沼にハマりそうです。いつか自分で実際に作ってみたいですね。
作業BGM:『Moana 2 (Original Motion Picture Soundtrack)


[イベント] 2024 第33回 東京ミネラルショー / データセット

初めての参加しましたが東京ミネラルショーの規模が予想以上に大きすぎて驚きました。昔から鉱物を観るのが好きだったので楽しすぎました。奥さんには天青石をクリスマスプレゼントしました。沢山ある中から好みの透明度、色、デザイン、形などを選ぶ経験は興味深かったです。あと、シリコンウェハーも販売されているブースもあり驚きました。ちょうどElemental Animaの作品で使う為に探していたのでありがたかったです。


[ニュース] AI関連

[動画 / 画像] Google - Veo 2, Imagen 3

Googleさん強すぎますね・・・。ここ数日OpenAIの発表が目立っていましたが、結局Googleが全ての精度とコスト面でも上回っていて戦い方が凄いです。OpenAIだけじゃなく全てのLLM, 画像, 動画のスコアを塗り替えています。とりあえず、おとなしくVeo 2のウェイトリスト登録しました。


[LLM] Google - Gemini 2.0 Flash Experimental

Gemini 2.0 Flashは精度高すぎますし、無料で使えて、プロンプトフィルタリング規制が無かったり、今の所Google一強な気がしています。


[画像] Adobe - Reflection Removal tool

窓越しに撮影した写真に写り込む反射を除去できるツール。これはかなり実用的なAI活用ですね。プレビュー版のAdobe Camera Rawで使えるのでご興味がありましたら是非。


[動画] Meta - LinGen

Metaから長時間の動画生成が可能なフレームワークが発表されていました。他の動画モデルは精度は上がっても動画の尺が伸びると破綻していく問題はずっとあるので、このアプローチは素晴らしいですね。


[画像] midjourney - Moodboards

画像のコレクションを使ってモデルをパーソナライズできる「ムードボード」機能。気軽にカスタムモデルを作れるのはありがたいですね。


[GPU] nVidia - CES 2025

CES 2025 nVidiaのティザー画像が出ました!リファレンスモデルのデザインと中央に"50"があるのでRTX 5000シリーズきますね。楽しみすぎます。


[動画] Pika - Pika 2.0

Pikaの新しいモデルが発表されました。アップデートが速いですね。2.0のアーリアクセスの募集もしているのでご興味がありましたら是非。


[企業] Meta - Meta FAIR

Metaも新しいオープンソースAIの研究を発表していました。個人的には、Meta Motivoが気になりました。


[動画] tencent - Hunyuan Video fp8

オープンソースの動画生成モデルHunyuan Videoのfp8モデルが公式リリースされました!軽量版をすぐ出してくれるのは本当にありがたいです。先日Kijaiさんがfp8を出してくれたばかりですがw あと、何故かHunyuanの公式Xからフォロバされて驚きました。


[ComfyUI] virtual try-on Comfyui_leffa

ヴァーチャル試着の新しいモデルleffaに対応したComfyUIのカスタムノードです。


[ComfyUI] Hunyuan Video Model ネイティブ対応

ComfyUIの公式でHunyuan Videoがネイティブ対応しました。ですが、最近公式のアップデートはバグが多いので落ち着くまで控えようと思います。FluxやSD3.5などすぐに対応してくれるのはありがたいですが、逆に早すぎて色々な所で問題が出ているのでバランスを取って欲しいです。


[ComfyUI] Comfy3D Update

先週紹介したMicrosoftのTRELLISも対応したので試してみようと思います。


[画像] Mitsua Likes公開&公式サイトリニューアル

自分もDiscordに参加していますが、素晴らしい活動ですね。Mitsua LikesがFairly Trained認定されたのも嬉しいです。


[画像] Tencent - ColorFlow Release

モノクロの画像を自動で着彩するフレームワークです。モデルも公開されました。


[ComfyUI] Hunyuan Loom

Hunyuanの開発がかなり活発ですね。以前紹介したFlowEditとHunyuanを活用してVideo to VideoをComfyUIで出来るようにするCustomNodeです。


[声] にじボイス 正式リリース

にじボイスが正式リリースされました。日本語の声が必要な際には活用してみようと思います。


[声] Alibaba - CosyVoice 2.0

精度の高い音声生成が出来るCosyVoiceがアップデートしました。モデルも公開されていて無料で生成できるのでこっちで良いかもしれないです。


[画像] Ideogram - Batch Generation

これは珍しいアップデートですね!バッチ生成機能はめちゃくちゃ助かります。自分の中でローカル生成でのメインのメリットにバッチ生成があったのでサービスで対応してくれるのはありがたいです。サービス側の負担はかなり大きくなりそうですが、全てのAIサービスでバッチ生成導入して欲しいです。


[LNM] Dataland - Living Encyclopedia: Large Nature Model (LNM)

大規模自然モデルを制作しているDatalandがBlack Forest LabsとコラボレーションとLiving Encyclopediaのアナウンスをしました。このコラボは嬉しいですね。LNMはアクセス殺到し過ぎてまだ使えないですが、Datalandのコンセプトは自分の作品にも通じるところがあるので動向を追っていこうと思います。


[ComfyUI] IF_MemoAvatar

音から画像を喋らせることが出来るオープンソースなモデルMEMOのComfyUI カスタムノードが公開されました。最近この手の需要も増えてきたのでありがたいです。


[AI活用] "Judgment Day" - VIDU + Elevenlabs

AI生成動画と既存のエフェクト素材の活用などもうまいですね。


[記事] NVIDIA、AI性能が70%向上し半額になった小型AIボード「Jetson Orin Nano Super」

かなり気になります。消費電力が低いのもありがたいですね。学習や生成していると電気代がとんでもないので。実際に動かしている所をみたいです。


[ソフトウェア] Pinokio 3.0

ComfyUIやAutomatic1111などはStabilityMatrixを活用していますが、Pinokioはその他の細かいAIツールも幅広く対応しているので助かっています。

[記事] AIを使ったアニメ、アニメイトGが2025年春に公開 “95%以上”のカットでAI活用も「あくまで補助ツール」

レタッチは絶対に必要ですよね。具体的なメイキングとレポートが出たら嬉しいですね。


[ニュース] CG・ゲーム・リアルタイムエンジン関連

[Blender] CellFluids 2.0



[記事]「Motion Design」の導入から使い方、UE5.5の新機能までエピック ゲームズ ジャパン 向井 秀哉氏が解説した講演をレポート


いいなと思ったら応援しよう!