
RMBG-v1.4 x Transformers.jsで超高速背景除去 他 / Catch up on AI 2024.3.10
Pick up
WebGPU Background Removalは従来の50倍もの速度を実現したブラウザで動作する背景除去フレームワーク。凄まじい精度と速度。
以下のURLからオンラインで試せます。
WebGPU Background Removal
https://huggingface.co/spaces/Xenova/remove-background-webgpu
【速度が50倍に!】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 9, 2024
WebGPU Background Removalは、RMBG-v1.4モデルとTransformers.jsを利用して、超高速でブラウザで動作する背景除去フレームワーク。
従来9秒から、180ミリ秒で処理完了!
デモの動画はリアルタイム。とんでもない速さです。#AIpic.twitter.com/xjkvsMDJ5O
Catch up on AI
GroqでGemma 7B Instructが利用可能に。超高速の推論が凄い
【早すぎる推論】@GroqIncで、Gemma 7B Instructが利用可能に。予測変換レベルで回答を生成。速度と精度はトレードオフですが、未来はそれも乗り越えていきそう。
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024
速度というのは、それだけに価値になる場合があるのでこの組合せで何ができるのか考える。#LLM #AIpic.twitter.com/5btbanNAtG
長時間の自動運転のための言語モデルELM
【長時間の自動運転のための言語モデル】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024
ELMは、長期的な運転シナリオを理解するための初の実体化言語モデル。幅広い新しいタスクを拡張し、様々なアプリケーションで大幅な改善を達成。
自動運転もAIの発展でますます現実味を帯びてきた。車の中の常識も大幅に変わっていくと推測
続く>>#AI #ELM pic.twitter.com/06q5tKJEP7
NVIDIA CEOのJensen HuangはAIが5年以内にAGI化すると語った
【AGIは5年以内に】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024
NVIDIA CEOのJensen Huangは、AIシステムは5年以内に人間のあらゆるテストに合格し、AGIとなると語った。
2045年と言われている、シンギュラリティですが、このAIの進化を見る限りもう少し、早まりそうです。#AI #生成AIpic.twitter.com/cG6T2qd8ox
Kopiaが衣料品ブランド向けのAI試着システムを開発
@trykopiaが、衣料品ブランド向けのAI試着を開発。ECでのショッピング中、様々なアイテムを着用した自分の姿を見ることができる。ブランドにとっては販売率の向上と返品率の低下に貢献。
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024
課題は実際とのギャップだがこれも改善できそう。AI試着は当たり前になりそう。#AIpic.twitter.com/76mntUW96r
Claude3の画像認識を試す
【Claude3の画像認識を試す】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024
認識させたい画像をドロップして説明してと指示するだけ。自分よりも、はるかに言語化が詳細。
このあたりは、人間よりさらに先を行っている感じがします。真剣にAIに負けない部分を探さないと。#生成AI #Claude3 pic.twitter.com/GLyEqJbmiE
AIアニメ x 効果音 サウンドエフェクト機能をアニメで!
【AIアニメ x 効果音】@pika_labsがリリースした新しいサウンドエフェクト機能をアニメで!
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024
効果音についてはかなり精度が良く、プレビューしながら同期もできるため世界に深みが出る。一方で、口の動きが必要なもの(例:犬の鳴き声)は難しいみたい。#AI #動画生成AIpic.twitter.com/ifLM8wDyzZ
iPhoneで様々なLLMが動作
【iPhoneで様々なLLMが動作】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 9, 2024
MLX Swift LLMが以下のモデルに対応!
・Mistral / Llama 🦙
・Phi-2 🧠
・Qwen 1.5 🤖
・Starcoder 2 ✨
Qwen 1.5の0.5Bモデルは、私のiPhone 14上で16ビットモードにすると量子化でも非常に高速に動作。
続く>>#LLM #AIpic.twitter.com/ACJRfkuEUT
Pikaにサウンド生成機能リリース
【Pikaにサウンド生成機能リリース】
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 9, 2024
動画生成AI Pika(@pika_labs)にビデオを生成する際に、サウンドをシームレスに生成できる機能がリリース。
公式からデモ。かなり正確にそして臨場感があふれる効果音が付与されている。
是非音声ONで!!#生成AIpic.twitter.com/GBcvQh1A3r
AIのNewsやアートワーク情報を更新中⚡
X(Twitter)ではAIの最新情報を発信中🐦