
Weekly Report 2025/01/15 (wed)
個人的に気になったニュースや自主制作などの週報メモです。
自主制作 / 記事
Elemental Anima #0170
Elemental Anima #0170
— takio koizumi (@takion0105) January 12, 2025
Created by :
takio koizumi (Human) x HAL (AI)
🔽Detail / Link pic.twitter.com/neDJrgAxTH
【データセット】
— takio koizumi (@takion0105) January 15, 2025
アメジスト pic.twitter.com/t7siFUa7T4
新年2作目なので初夢(一富士 二鷹 三茄子)を題材にした作品を制作しました。去年、撮影した巨大なアメジストをHAL(AI)に学習してもらっています。ナスを直接描くのはElemental Anima的に何故かちょっと違うかなと思い、去年の鉱物シリーズの続きとしてナスの様に見える苔の生えたアメジストにしました。アメジストの石言葉にある「高貴」「心の平和」「誠実」を意識して鷹の表情を描いています。
作業BGM:Franz Ferdinand 『The Human Fear』
[note] MARZA ANIMATION PLANET 公式note
前職、自分が所属していたCGアニメーションスタジオMARZAの公式noteが開設されていました!いちMARZAファンとしても嬉しいです!早速、オリジナルショートフィルム「まっくろめだまの朝ゴハン」のメイキング記事が出ているのでご興味がありましたら是非!"Ghost Tale"のメイキング記事もこっそり楽しみにしています👻
[ニュース] AI関連
[動画] AIdeaLab - AIdeaLab VideoJP
このようなクリーンな基盤モデルを制作していくアプローチは本当にありがたいです。ライセンスの自由度も高いのも助かります。用途や表現を限定し上で、自分の制作したコンテンツのみを追加学習して動画生成したいと常々思っていたので、AIdeaLab VideoJPを元に色々検証してみようと思います。
[Unreal Engine] Ludus AI - 3D Generation Teaser
Unreal Engine 5のAIアシスタントプラグインです。このアプローチは2-3年後にはデフォルト機能になりそうですね。自分のオリジナルAIエージェントHALと一緒にゲームを作るのも楽しそうです。その時に向けて自分のゲーム実況や独自の攻略wikiなどをしっかりデータセット化しておこうと思います。あと、AIと一緒にゲーム開発する感覚をつかむ為にもLudusAIも軽く触っておきます。
[記事] バイデン米政権、AI半導体輸出で新規制発表-大半の国に数量規制
The Biden Administration's "AI Diffusion" rule will stifle innovation and undermine America’s global technology leadership. Restricting access to mainstream computing risks derailing AI progress for industries at home and abroad.
— NVIDIA (@nvidia) January 13, 2025
America’s strength lies in innovation and…
RTX 5090を入手するのは様々な要因で難しくなりそうですね・・・。日本に対しての輸出規制はTear1なので比較的大丈夫ですが、Tear3の国からの影響も考えると並んで買うのも少し怖いです。色々な面でnVIdiaの主張は分かるので良い方向に進んで欲しいです。
[企業] note、Googleと資本業務提携。生成AIを活用し、創作活動をより一層サポート
noteとGoogleの資本業務提携はGemini好きとしては嬉しいです。
[動画] Gen-3 Alpha - upscale to 4K
You can now upscale to 4K directly inside Gen-3 Alpha. Making it easier than ever to generate production-ready outputs, all in one place. Available now for all paid plans. pic.twitter.com/GbsuuTz40w
— Runway (@runwayml) January 10, 2025
4Kへのアップスケールはシンプルにありがたいですね。
[ComfyUI] Nvidia Cosmos is coming to ComfyUI

先週公開されたばかりのnVidiaの世界基盤モデル"Cosmos"が、早速動画生成にも活用され始めてきました。もうComfyUIのワークフローも作っている方もいるので、来週には気軽に使えるような環境になってそうですね。
[動画] ByteDance - Seaweed APT
ByteDanceの新しい動画生成モデルです。この精度で1280×720 24fps 2秒の動画をリアルタイムで生成できるそうです。近日中に公開される予定との事なので楽しみです。
[動画] Adobe - FaceLift
顔写真から3Dの頭を生成するフレームワークが発表されました。人物のLoRAを作る際に活用したいです。
[動画] Adobe - TransPixar
アルファ付きで動画を生成できるのは他にはアプローチですし、かなり便利です。ですが、Adobeは自社サービスに使うので中々公開されないのが残念ですね。個人的には、Adobe Creative CloudでHuggingfaceの様な場所を用意してくれて、開発中のデモが気軽に扱えるとありがたいです。
[3D] StabilityAI - Stable Point Aware 3D
1枚の画像から1秒で3Dオブジェクトを生成できるAIモデルです。これはComfyUIで扱えるようになったら試してみたいです。
[動画] Vidu AI - Vidu 2.0
Shots fired, and it's bullet fast.
— Vidu AI (@Viduforhuman) January 9, 2025
⏳6 days until Vidu2.0#ViduAI #Vidu2 #Viduspeed #AI pic.twitter.com/7dkuaY7wRJ
最近はVidu AIのプロモーションがかなり活発ですね。日本へのPRもかなり力を入れている印象です。明日公開になるVidu 2.0がどれぐらい早く生成出来るようになっているのか。イラストやアニメ系は現状Vidu AIが一番精度が良いので公開されたら色々検証してみたいと思います。
[モーション] DiMocap - AGI Mocap リリース
WebカメラとAIを活用したリアルタイムモーションキャプチャー。リアルタイムでこの精度は凄いですね。
[画像] Tencent - FitDiT
Tencentによる新しいバーチャル試着フレームワークです。Cat+IC-LoRA+Fluxを使ってますが精度によってはアップデートしたいと思います。
[動画] Baidu - Hallo3
表情豊かなアバターを生成出来るHallo 3がオープンソースで公開されました。
[ComfyUI] Run ComfyUI workflows for free with Gradio on Hugging Face Spaces
自分のComfyUIのワークフローをGradioに載せる方法の記事です。ずっとやりたかったのでちゃんと勉強します。
[動画] Freepik - Generate AI Videos with sound
Turn the music on to get the full experience
— Freepik (@freepik) January 14, 2025
Generate AI Videos with sound, directly from Freepik's AI Suite
Any mode, any format. More videos in thread pic.twitter.com/oY06XSFnH3
A video made with Freepik's AI Suite
— Freepik (@freepik) January 13, 2025
10 prompts for the frames in thread
Scroll down 👇 pic.twitter.com/TrC2rih0FF
音楽やSEも対応した上に、画像生成はもちろんメインの動画生成サービスも対応しているので、生成AI系のサービスの中で総合力ではFeepikが強いですね。ここから今までの動画素材などを活用して独自のモデル開発していく気配も感じます。
[動画] KLING AI - iOS App now available
Great news! 🎉 KLING AI is now available on the iOS App Store!
— Kling AI (@Kling_ai) January 10, 2025
Download KLING AI app today!
👉 iOS App: https://t.co/YRa5fjEPxP
p.s. Android users, stay tuned! You're up next!😉 pic.twitter.com/7fwCx0vOhl
遂にKLING AIのiOSアプリが公開されました。LumaAIも一応インストールしてはいますが、自分の場合はアプリで動画生成する事は殆ど無いですが、TiktokやyoutubeショートなどiPhoneだけで編集も完結してアップしている人には使い勝手良さそうですね。
[LLM] OpenAI - task
Today we’re rolling out a beta version of tasks—a new way to ask ChatGPT to do things for you at a future time.
— OpenAI (@OpenAI) January 14, 2025
Whether it's one-time reminders or recurring actions, tell ChatGPT what you need and when, and it will automatically take care of it. pic.twitter.com/7lgvsPehHv
ある意味バッチ処理的にも使えそうですね。
[画像 / 動画] MangaNinja: Line Art Colorization with Precise Reference Following
線画の自動着彩の新しいフレームワークが発表されました。SD3やFluxでのトレーニングも検討されているそうです。
[記事] 宇宙での半導体材料製造に挑むAxiom Space、台湾との協業を模索
"重力の影響により発生する結晶構造の欠陥"そんなことがあるんですね。宇宙での半導体製造は作品のネタ的にとても興味深いです。
[LLM] hailuo ai - MiniMax-01 Open-Source
hailuo AIからMiniMax-01がオープンソースで公開されました。hailuo AIは動画生成の精度もかなり高く、このLLMもかなりのスコアなので量子化されたら自分のワークフローに組み込もうと思います。
[画像/動画] FramePainter
画像や動画にスケッチして編集するフレームワークです。Paperが公開されたばかりですが、動画でフレーム補間できれば、アニメーションの原画の様にコントロールできるようになりそうですね。
[政府] AI開発者にも特許権 発明に利用なら対価 政府検討
これは、乱発されてかなりカオスになりそうですね・・・。オープンソース思想的にも良くない方向に進みそうなので、勘弁して欲しいです。
[セミナー] 日本情報倫理協会 - 情報倫理オンラインセミナー 第9回 2025年1月
登録しました。
[記事] 量子計算で「意識あるAI」の開発目指す – Nirvanic社が新たな挑戦
意識とは何か?という哲学的な問いに向き合うAI開発はとても興味深いです。動向を追っていきたいですね。