ログイン
会員登録
モデル評価
書いてみる
関連タグ
#モデル (14,515)
#評価 (20,441)
#機械学習 (150,637)
#タスク (7,547)
#データセット (883)
#AI (319,385)
人気
急上昇
新着
定番
有料のみ
20件
人気の記事一覧
KLダイバージェンスの具体的な計算方法は?
おからだ治療院
4週間前
1
【お知らせ】香川未来創造DAOの学習カリキュラムが厚生労働省「人材開発支援助成金(人材育成支援コース)」の対象になりました。
TOMMY・YOSHIDA(吉田勉)
10日前
1
No "Zero-Shot" Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance
Ikemen Mas Kot
6か月前
2
LLMOps:基盤モデルに基づくアプリケーション開発のワークフロー
Weights & Biases Japan
1年前
37
オープンソースLLMの日本語評価結果 - W&Bローンチで誰でも再現可能に
Weights & Biases Japan
1年前
53
Ferret-v2: An Improved Baseline for Referring and Grounding with Large Language Models
Ikemen Mas Kot
7か月前
2
【データサイエンティストさん🌟必見✨】pythonコードで実行していることをChatGPTで読み解いてPowerPointでまとめてみた(機械学習「モデル評価と改善」)
¥360
みーけ
1年前
7
振り返るとそこには「Python機械学習プログラミング」②承
ネイピア DS
1年前
5
〜初心者がPythonで小売データ分析をやってみた〜
ZunZun
1年前
3
【論文要約:自動運転関連】LingoQA: Visual Question Answering for Autonomous Driving
george
1か月前
Unveiling Selection Biases: Exploring Order and Token Sensitivity in Large Language Models
Ikemen Mas Kot
5か月前
Dynabench: Rethinking Benchmarking in NLP
Ikemen Mas Kot
5か月前
Mitigating Exaggerated Safety in Large Language Models
Ikemen Mas Kot
6か月前
KNVQA: A Benchmark for evaluation knowledge-based VQA
Ikemen Mas Kot
6か月前
UltraEval: A Lightweight Platform for Flexible and Comprehensive Evaluation for LLMs
Ikemen Mas Kot
7か月前
DesignQA: A Multimodal Benchmark for Evaluating Large Language Models' Understanding of Engineering Documentation
Ikemen Mas Kot
7か月前
Advancing Spatial Reasoning in Large Language Models: An In-Depth Evaluation and Enhancement Using the StepGame Benchmark
Ikemen Mas Kot
10か月前
Lo-Hi: Practical ML Drug Discovery Benchmark
Ikemen Mas Kot
1年前
A Comprehensive Performance Study of Large Language Models on Novel AI Accelerators
Ikemen Mas Kot
1年前
Pythonでフィットネスクラブによる退会予測をしてみた【Aidemy成果物】
tora
2年前
1