マガジンのカバー画像

AI

62
運営しているクリエイター

#大規模言語モデル

Qwen2.5-Maxとは?大規模MoEモデルの進化と可能性

Qwen2.5-Maxとは?大規模MoEモデルの進化と可能性

カテゴリ:LLM・AI・テクノロジー
読む時間:約5分

以下の記事が気になったので簡単にまとめてみました

概要Alibaba Cloudが開発した最新の大規模Mixture-of-Experts(MoE)モデル**「Qwen2.5-Max」が公開されました。本モデルは20兆以上のトークン**を使って事前学習され、教師あり微調整(SFT)と人間のフィードバックによる強化学習(RLHF)を経ていま

もっとみる
【論文】大規模言語モデル (LLM) の微調整について

【論文】大規模言語モデル (LLM) の微調整について

カテゴリ:テクノロジー・LLM
読む時間:約5分

以下の論文が気になったので簡単にまとめてみました

概要この論文は、大規模言語モデル(LLM)の微調整に関する包括的なレビューを提供しています。LLMの歴史的進化、さまざまな微調整手法、効率的なパラメータ調整方法、最新の技術、展開と最適化の戦略、そして今後の課題と機会について詳しく解説しています。

内容LLMの歴史的進化

LLMは、従来の自然

もっとみる
【論文】クリエイティブ産業における人工知能:2025年までの進歩

【論文】クリエイティブ産業における人工知能:2025年までの進歩

カテゴリ:テクノロジー
読む時間:約5分

以下の論文が気になったので簡単にまとめてみました

概要人工知能(AI)の急速な進化、特に生成AIや大規模言語モデル(LLM)は、創造産業におけるコンテンツ制作の革新、ワークフローの効率化、そしてクリエイティブツールへのアクセスの民主化を推進しています。本記事では、2022年以降の技術的進展を中心に、AIがどのように創造産業を変革しているかを探ります。

もっとみる
【論文】実在する人の性格や考えを忠実にコピーしたAI

【論文】実在する人の性格や考えを忠実にコピーしたAI

カテゴリ:テクノロジー・人工知能
読む時間:約5分

以下の論文が気になったので簡単にまとめてみました

導入:AIが人間を理解する一歩皆さんは、AIが1000人もの人間の行動をシミュレートできるとしたら、どう思いますか?まるでSF映画のようですが、スタンフォード大学の研究者たちが、それを現実のものにしようとしています。彼らの研究「Generative Agent Simulations of 1

もっとみる
【論文】より賢いLLMの作り方

【論文】より賢いLLMの作り方

カテゴリ:論文・AI・LLM・テクノロジー
読む時間:約5分

以下の論文が気になったので簡単にまとめてみました
間違っていたらご指摘ください

導入:もっと賢いAIって作れるの?最近よく聞く「AI」って、実は色々な種類があるんだけど、中でも「大規模言語モデル(LLM)」っていうのがすごい進化を遂げているんだ。例えば、ChatGPTとかもLLMの一種だよ。でも、今のLLMには実は弱点もある。間違っ

もっとみる