D.B.Curry
AI勉強中。AIで金儲けするのが目標
https://github.com/DB-Curry
最近の記事
論文メモ:Instruction Pre-Training:Language Models are Supervised Multitask Learners
よく来たな。継続事前学習をしたくていろいろ調べていたら、以下の論文を見つけた。よってこれを読む。なんやかんやで全部翻訳してしまった。 今年の6月に出ている最新の論文なので、非常に楽しみだ。 https://arxiv.org/pdf/2406.14491 Abstract『継続的事前学習では、指示事前学習によりLlama3-8BがLlama3-70Bに匹敵するか、それ以上の性能を発揮することができます。』 これは期待できる。自分はgemma-2bを追加で事前学習したいの