ログイン
会員登録
画像理解
書いてみる
関連タグ
#モデル (16,168)
#タスク (8,612)
#画像 (22,071)
#画像認識 (774)
#128kトークン (1)
#20万字 (2)
人気
急上昇
新着
定番
有料のみ
9件
人気の記事一覧
【小説2冊分を理解する?!】「Kimi k1.5」・日本語OKの中国製AIがGPT-4oを超える😲数学・コード生成・画像理解をこなすマルチモーダルAIの秘密に迫る💖最大128kトークン処理&長期CoTも強力✨
葉加瀬あい (AI-Hakase)🎈動画&Note でAI解説🎥https://x.gd/F2Mvl
12日前
94
Making Large Multimodal Models Understand Arbitrary Visual Prompts
Ikemen Mas Kot
9か月前
2
Dragonfly: Multi-Resolution Zoom Supercharges Large Visual-Language Model
Ikemen Mas Kot
8か月前
1
「GPT-4 Turbo」、「Vision(画像理解)」「DALL·E 3(画像生成)」を全てLINEで試せるようにしてみた。
三野輪 慎太郎 / Shintaro Minowa
1年前
3
Ferret-v2: An Improved Baseline for Referring and Grounding with Large Language Models
Ikemen Mas Kot
9か月前
2
2022年1月に新設・改訂されるIPC(国際特許分類)
野崎篤志@イーパテント-知財情報コンサルティング®
3年前
16
BLINK: Multimodal Large Language Models Can See but Not Perceive
Ikemen Mas Kot
9か月前
Hidden Flaws Behind Expert-Level Accuracy of GPT-4 Vision in Medicine
Ikemen Mas Kot
1年前
SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs
Ikemen Mas Kot
1年前