RMBG-v1.4 x Transformers.jsで超高速背景除去他 / Catch up on AI 2024.3.10

2024年3月10日 20:35

Pick up

WebGPU Background Removalは従来の50倍もの速度を実現したブラウザで動作する背景除去フレームワーク。凄まじい精度と速度。

以下のURLからオンラインで試せます。

WebGPU Background Removal
https://huggingface.co/spaces/Xenova/remove-background-webgpu

【速度が50倍に!】
WebGPU Background Removalは、RMBG-v1.4モデルとTransformers.jsを利用して、超高速でブラウザで動作する背景除去フレームワーク。

従来9秒から、180ミリ秒で処理完了!
デモの動画はリアルタイム。とんでもない速さです。#AI pic.twitter.com/xjkvsMDJ5O
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 9, 2024

Catch up on AI

GroqでGemma 7B Instructが利用可能に。超高速の推論が凄い

【早すぎる推論】@GroqIncで、Gemma 7B Instructが利用可能に。予測変換レベルで回答を生成。速度と精度はトレードオフですが、未来はそれも乗り越えていきそう。

速度というのは、それだけに価値になる場合があるのでこの組合せで何ができるのか考える。#LLM #AI pic.twitter.com/5btbanNAtG
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024

長時間の自動運転のための言語モデルELM

【長時間の自動運転のための言語モデル】
ELMは、長期的な運転シナリオを理解するための初の実体化言語モデル。幅広い新しいタスクを拡張し、様々なアプリケーションで大幅な改善を達成。

自動運転もAIの発展でますます現実味を帯びてきた。車の中の常識も大幅に変わっていくと推測

続く>>#AI #ELM pic.twitter.com/06q5tKJEP7
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024

NVIDIA CEOのJensen HuangはAIが5年以内にAGI化すると語った

【AGIは5年以内に】
NVIDIA CEOのJensen Huangは、AIシステムは5年以内に人間のあらゆるテストに合格し、AGIとなると語った。

2045年と言われている、シンギュラリティですが、このAIの進化を見る限りもう少し、早まりそうです。#AI #生成AI pic.twitter.com/cG6T2qd8ox
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024

Kopiaが衣料品ブランド向けのAI試着システムを開発

@trykopiaが、衣料品ブランド向けのAI試着を開発。ECでのショッピング中、様々なアイテムを着用した自分の姿を見ることができる。ブランドにとっては販売率の向上と返品率の低下に貢献。

課題は実際とのギャップだがこれも改善できそう。AI試着は当たり前になりそう。#AI pic.twitter.com/76mntUW96r
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024

Claude3の画像認識を試す

【Claude3の画像認識を試す】
認識させたい画像をドロップして説明してと指示するだけ。自分よりも、はるかに言語化が詳細。

このあたりは、人間よりさらに先を行っている感じがします。真剣にAIに負けない部分を探さないと。#生成AI #Claude3 pic.twitter.com/GLyEqJbmiE
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024

AIアニメ x 効果音サウンドエフェクト機能をアニメで！

【AIアニメ x 効果音】@pika_labsがリリースした新しいサウンドエフェクト機能をアニメで！

効果音についてはかなり精度が良く、プレビューしながら同期もできるため世界に深みが出る。一方で、口の動きが必要なもの（例：犬の鳴き声）は難しいみたい。#AI #動画生成AI pic.twitter.com/ifLM8wDyzZ
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024

iPhoneで様々なLLMが動作

【iPhoneで様々なLLMが動作】
MLX Swift LLMが以下のモデルに対応!

・Mistral / Llama 🦙
・Phi-2 🧠
・Qwen 1.5 🤖
・Starcoder 2 ✨

Qwen 1.5の0.5Bモデルは、私のiPhone 14上で16ビットモードにすると量子化でも非常に高速に動作。

続く>>#LLM #AI pic.twitter.com/ACJRfkuEUT
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 9, 2024

Pikaにサウンド生成機能リリース

【Pikaにサウンド生成機能リリース】
動画生成AI Pika（@pika_labs）にビデオを生成する際に、サウンドをシームレスに生成できる機能がリリース。

公式からデモ。かなり正確にそして臨場感があふれる効果音が付与されている。

是非音声ONで！！#生成AI pic.twitter.com/GBcvQh1A3r
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 9, 2024

AIのNewsやアートワーク情報を更新中⚡

X（Twitter）ではAIの最新情報を発信中🐦

Tweets by taziku_co

RMBG-v1.4 x Transformers.jsで超高速背景除去 他 / Catch up on AI 2024.3.10

Pick up

Catch up on AI

いいなと思ったら応援しよう！

RMBG-v1.4 x Transformers.jsで超高速背景除去他 / Catch up on AI 2024.3.10