AI - 大規模言語モデル｜MASAKING

2025年2月6日 08:55

Qwen2.5-Maxとは？大規模MoEモデルの進化と可能性

カテゴリ：LLM・AI・テクノロジー
読む時間：約5分

以下の記事が気になったので簡単にまとめてみました

概要Alibaba Cloudが開発した最新の大規模Mixture-of-Experts（MoE）モデル**「Qwen2.5-Max」が公開されました。本モデルは20兆以上のトークン**を使って事前学習され、教師あり微調整（SFT）と人間のフィードバックによる強化学習（RLHF）を経ていま

もっとみる

MASAKING

2025年1月24日 05:29

【論文】大規模言語モデル (LLM) の微調整について

カテゴリ：テクノロジー・LLM
読む時間：約５分

以下の論文が気になったので簡単にまとめてみました

概要この論文は、大規模言語モデル（LLM）の微調整に関する包括的なレビューを提供しています。LLMの歴史的進化、さまざまな微調整手法、効率的なパラメータ調整方法、最新の技術、展開と最適化の戦略、そして今後の課題と機会について詳しく解説しています。

内容LLMの歴史的進化

LLMは、従来の自然

もっとみる

MASAKING

2025年1月18日 08:45

【論文】クリエイティブ産業における人工知能：2025年までの進歩

カテゴリ：テクノロジー
読む時間：約５分

以下の論文が気になったので簡単にまとめてみました

概要人工知能（AI）の急速な進化、特に生成AIや大規模言語モデル（LLM）は、創造産業におけるコンテンツ制作の革新、ワークフローの効率化、そしてクリエイティブツールへのアクセスの民主化を推進しています。本記事では、2022年以降の技術的進展を中心に、AIがどのように創造産業を変革しているかを探ります。

もっとみる

MASAKING

2024年12月16日 06:16

【論文】実在する人の性格や考えを忠実にコピーしたAI

カテゴリ：テクノロジー・人工知能
読む時間：約５分

以下の論文が気になったので簡単にまとめてみました

導入：AIが人間を理解する一歩皆さんは、AIが1000人もの人間の行動をシミュレートできるとしたら、どう思いますか？まるでSF映画のようですが、スタンフォード大学の研究者たちが、それを現実のものにしようとしています。彼らの研究「Generative Agent Simulations of 1

もっとみる

MASAKING

2024年12月9日 06:23

【論文】より賢いLLMの作り方

カテゴリ：論文・AI・LLM・テクノロジー
読む時間：約５分

以下の論文が気になったので簡単にまとめてみました
間違っていたらご指摘ください

導入：もっと賢いAIって作れるの？最近よく聞く「AI」って、実は色々な種類があるんだけど、中でも「大規模言語モデル（LLM）」っていうのがすごい進化を遂げているんだ。例えば、ChatGPTとかもLLMの一種だよ。でも、今のLLMには実は弱点もある。間違っ

もっとみる

AI

フォローしませんか？

#大規模言語モデル

Qwen2.5-Maxとは？大規模MoEモデルの進化と可能性

【論文】大規模言語モデル (LLM) の微調整について

【論文】クリエイティブ産業における人工知能：2025年までの進歩

【論文】実在する人の性格や考えを忠実にコピーしたAI

【論文】より賢いLLMの作り方