人気の記事一覧

【デジタルMATSUMOTOの考察(2024/9/2)】これってAIの正しい理解?03「とにかくパラメータ数を膨大にすれば良い?」

LLMの学習で調整するパラメータは、マルチヘッドアテンション層よりもフィードフォワード層の方が多い

3日前

LLM In-Context Recall is Prompt Dependent

5か月前

No "Zero-Shot" Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance

4か月前

You Only Cache Once: Decoder-Decoder Architectures for Language Models

4か月前

7月登場の大規模言語モデルパラメータ数ランキング

1年前

SoundStream: An End-to-End Neural Audio Codec

4か月前

Training Compute-Optimal Large Language Models

5か月前