
【生成AIニュース+】『fal-aiでveo2』『Skyreels gguf バージョン&LoRA』『MoCapade 3.0』『node-llama-cpp v3.6』『Signs』『LayerDiffuse-Flux』『NEO Gamma』『HunyuanVideo-GoWithTheFlow-unofficial』
まいどです。
本日……というか先日になっちゃいましたが(ゴメンナサイ)、生成AIニュース+テクノロジー情報。
■fal-aiでveo2
先日、FreePikでVeo2が使えるようになったとご紹介しましたが、続いてfal-aiでもVeo2が使用可能になりました。
GoogleはVeo2に関しては他でどんどん展開していく路線なのでしょうか。
🪂
— fal (@FAL) February 22, 2025
🏝️ 🏝️ 🏝️https://t.co/VmNOPr8UK0 pic.twitter.com/l1UItqyk9x
■Skyreels gguf バージョン&LoRA
人間を中心とした高品質な動画生成AIモデルとして開発されたSkyreelsに、gguf バージョン(量子化モデル)が追加されました。
ComfyUIで動作させることが出来て、VRAM12GBで生成が可能な事が確認されています。(但し、生成時間は長め)
どれくらいの物か、私もそのうち試してみます。
また、Image2VideoのLoRAを活用したワークフローも公開されています。
■MoCapade 3.0
MoCapade 3.0は、Meshcapadeが提供するマーカーレス(Markerless)モーションキャプチャ技術の最新バージョンです。
3Dアニメーションやデジタル人間の動きを生成するためのツールで、特別なスーツやマーカーを使わずに、単一のカメラ動画から高精度なモーションキャプチャを実現します。
Behind the scenes of our Valentine’s Day monsters—and yes, this magic started in PJs! 😆✨
— Meshcapade (@meshcapade) February 21, 2025
With our latest release, MoCapade 3.0, all it takes is a simple video—no suits, no markers, just motion straight from your camera. Watch as our animator goes from comfy to creepy cute in… pic.twitter.com/aXnT2WB2Sb
■node-llama-cpp v3.6
node-llama-cpp v3.6で、DeepSeek R1 モデルが完全にサポートされ、特に function calling (関数呼び出し) 機能が利用可能になりました。
また、node-llama-cpp には、多くのモデルで関数呼び出しを機能させるための工夫が組み込まれており、DeepSeek R1 向けには性能と安定性を向上させるための特別な調整も行われています。
■Signs
Signsは、アメリカ手話(American Sign Language、ASL)を教えるためのAIプラットフォームです。
聴覚障害者やその家族、ASLを学びたい人々が手話を効果的に学べるように設計されています。
無料で利用可能であり、リアルタイムフィードバックや3Dアバターを通じて効果的な学習体験を提供します。
Today we unveiled a new #AI platform, Signs, for teaching how to use American Sign Language.
— NVIDIA (@nvidia) February 20, 2025
Signs guides ASL learners through the process of forming words, using machine learning and computer vision to assess progress.
Learn more: https://t.co/JpYL1QA2uF pic.twitter.com/WwWGmJAt0f
■LayerDiffuse-Flux
LayerDiffuse-Fluxリポジトリは、Fluxモデルをベースに、LayerDiffuseという透明画像生成技術を実装し、高品質な透明画像生成を目指したプロジェクトです。
Fluxを改良し、透明な画像生成に特化したVAEやLoRAという技術を組み合わせることで、これまでよりもっと綺麗で自然な透明画像が作れるようになりました。
テキストで指示するだけで透明な画像を作ったり、お手持ちの画像を元に別の透明画像を作ったりできます。
📢 LayerDiffuseのFluxバージョン実装「RedAIGC/Flux-version-LayerDiffuse」が公開されました!✨
— 【Ai建築デザイナー】YUiCHI (@YUiCHI_Bi) February 22, 2025
✅ Flux適応のための透過VAEを新規トレーニング
✅ Flux微調整用LoRAで透明画像を生成
✅ 透明テキストから画像(T2I)生成
✅ 画像から画像(I2I)生成も可能
URLへ続く↓ pic.twitter.com/542SKg39mz
■NEO Gamma
NEO Gammaは、1Xが開発した人型(ヒューマノイド)ロボットの最新バージョンで、日常生活(特に家庭内)での使用を目的としています。
家事(洗濯や掃除など)や高齢者の支援、単純作業の自動化を可能にするロボットとして設計されています。
1X has unveiled NEO Gamma, a major leap toward bringing humanoid robots into daily life
— The Humanoid Hub (@TheHumanoidHub) February 21, 2025
⦿ Walks more naturally, can squat to pick up objects
⦿ 10x better hardware reliability, 10 dB quieter
⦿ Improved object manipulation + a custom-built LLM for natural language interaction pic.twitter.com/GAyLyvhguD
■HunyuanVideo-GoWithTheFlow-unofficial
GoWithTheFlow に基づいて、ビデオ生成の開始ノイズを形作ることによって、ビデオの動きを非常にうまく誘導できる HunyuanVideo のモデルです。
また、Skyreel の img2vid版のモデルもアップされています。
.@spacepxl trained a model for HunyuanVideo that allows you to subtly guide the motion of a video in a really nice way by shaping the starting noise of a video generation - based on GoWithTheFlow: https://t.co/7v2G6FeRgg
— POM (@peteromallet) February 22, 2025
Works with Skyreel's img2vid too! pic.twitter.com/eRSGTQQsUR
■fal-aiでveo2
先日、FreePikでVeo2が使えるようになったとご紹介しましたが、続いてfal-aiでもVeo2が使用可能になりました。
GoogleはVeo2に関しては他でどんどん展開していく路線なのでしょうか。
🪂
— fal (@FAL) February 22, 2025
🏝️ 🏝️ 🏝️https://t.co/VmNOPr8UK0 pic.twitter.com/l1UItqyk9x
本日……いえ、正確には先日の分ですが、以上になります。
いやー、たまにこういう日もあるのは仕方ないのですがね(本業で)。
と言うかもう眠いので今日はこれにて……Zzz。

それでは、また。