見出し画像

【生成AIニュース+】『fal-aiでveo2』『Skyreels gguf バージョン&LoRA』『MoCapade 3.0』『node-llama-cpp v3.6』『Signs』『LayerDiffuse-Flux』『NEO Gamma』『HunyuanVideo-GoWithTheFlow-unofficial』

まいどです。
本日……というか先日になっちゃいましたが(ゴメンナサイ)、生成AIニュース+テクノロジー情報。


■fal-aiでveo2

先日、FreePikでVeo2が使えるようになったとご紹介しましたが、続いてfal-aiでもVeo2が使用可能になりました。
GoogleはVeo2に関しては他でどんどん展開していく路線なのでしょうか。


■Skyreels gguf バージョン&LoRA

人間を中心とした高品質な動画生成AIモデルとして開発されたSkyreelsに、gguf バージョン(量子化モデル)が追加されました。
ComfyUIで動作させることが出来て、VRAM12GBで生成が可能な事が確認されています。(但し、生成時間は長め)
どれくらいの物か、私もそのうち試してみます。
また、Image2VideoのLoRAを活用したワークフローも公開されています。


■MoCapade 3.0

MoCapade 3.0は、Meshcapadeが提供するマーカーレス(Markerless)モーションキャプチャ技術の最新バージョンです。
3Dアニメーションやデジタル人間の動きを生成するためのツールで、特別なスーツやマーカーを使わずに、単一のカメラ動画から高精度なモーションキャプチャを実現します。

https://www.meshcapade.com/


■node-llama-cpp v3.6

node-llama-cpp v3.6で、DeepSeek R1 モデルが完全にサポートされ、特に function calling (関数呼び出し) 機能が利用可能になりました。
また、node-llama-cpp には、多くのモデルで関数呼び出しを機能させるための工夫が組み込まれており、DeepSeek R1 向けには性能と安定性を向上させるための特別な調整も行われています。


■Signs

Signsは、アメリカ手話(American Sign Language、ASL)を教えるためのAIプラットフォームです。
聴覚障害者やその家族、ASLを学びたい人々が手話を効果的に学べるように設計されています。
無料で利用可能であり、リアルタイムフィードバックや3Dアバターを通じて効果的な学習体験を提供します。


■LayerDiffuse-Flux

LayerDiffuse-Fluxリポジトリは、Fluxモデルをベースに、LayerDiffuseという透明画像生成技術を実装し、高品質な透明画像生成を目指したプロジェクトです。
Fluxを改良し、透明な画像生成に特化したVAEやLoRAという技術を組み合わせることで、これまでよりもっと綺麗で自然な透明画像が作れるようになりました。
テキストで指示するだけで透明な画像を作ったり、お手持ちの画像を元に別の透明画像を作ったりできます。


■NEO Gamma

NEO Gammaは、1Xが開発した人型(ヒューマノイド)ロボットの最新バージョンで、日常生活(特に家庭内)での使用を目的としています。
家事(洗濯や掃除など)や高齢者の支援、単純作業の自動化を可能にするロボットとして設計されています。


■HunyuanVideo-GoWithTheFlow-unofficial

GoWithTheFlow に基づいて、ビデオ生成の開始ノイズを形作ることによって、ビデオの動きを非常にうまく誘導できる HunyuanVideo のモデルです。
また、Skyreel の img2vid版のモデルもアップされています。


■fal-aiでveo2

先日、FreePikでVeo2が使えるようになったとご紹介しましたが、続いてfal-aiでもVeo2が使用可能になりました。
GoogleはVeo2に関しては他でどんどん展開していく路線なのでしょうか。


本日……いえ、正確には先日の分ですが、以上になります。
いやー、たまにこういう日もあるのは仕方ないのですがね(本業で)。
と言うかもう眠いので今日はこれにて……Zzz。

SeaArtAI

それでは、また。

いいなと思ったら応援しよう!

この記事が参加している募集