人気の記事一覧

【AI基礎論】「強化学習」(R1との対話)

5日前

Genesis 入門 (11) - 強化学習による移動ポリシーの学習 の コード解説

1か月前

人間はなぜ行動するか?強化学習理論について解説します。

C級botterになりたい男の記録 part2

2か月前

ChatGPT o1に匹敵?中国制作の『DeepSeek-R1』の性能と可能性を検証

【AI基礎論】主体論理体系(/理由の論理体系)を適正に進化させるには

9日前

【OpenAI、食われる?】DeepSeek-R1がすごすぎる!✨強化学習+思考プロセス付きの推論力がすごいLLMが登場!OpenAIより90%も安いのに高性能😍料金体系や使い方まで徹底解説💖

再生

【OpenAI、食われる?】DeepSeek-R1がすごすぎる!✨強化学習+思考プロセス付きの推論力がすごいLLMが登場!OpenAIより90%も安いのに高性能😍料金体系や使い方まで徹底解説💖

AI2nd#4ふりかえり(機械学習入門)

強化学習は奥の深い分野。LINEヤフーで技術と向き合い続けたい

【生成AI】DeepSeek-R1論文備忘録

2週間前

OpenAI o1再現モデルまとめ(2024年12月時点)

2か月前

【AI基礎論】大規模言語モデルに対する強化学習

1か月前

【AI基礎論】アルファ碁は囲碁を深く理解していると言えるのか?

1か月前

カフェとAIと、ちょっとした人生論

【論文瞬読】強化学習で進化する言語モデルの推論能力:DeepSeek-R1の挑戦

3週間前

第5章 AIの思考について学ぶ

OpenAI o1を再現しよう(Reasoningモデルの作り方)

2か月前

【論文解説】言葉で考えるAI:自然言語強化学習(NLRL)の衝撃

2か月前

3つのAIの使用感

1か月前

強化学習への関心

DeepSeek R-1:スプートニクショック再来?米中AI競争の新たな局面

2週間前

GRPOを試してみた

13日前

Deepseek R1は人間を超える方法を見つけた!?

2週間前

12 Days of OpenAI: Day 2  専門家だけを集めてベータテストを始めるだと!? もう、一般ピーポーは、「なんか難しいことしてんなぁ・・・」状態(^^;

【AI基礎論】「強化学習」では 適正な主体論理体系(/理由の論理体系)に到達しない

2週間前

OpenAI o1はどう作るのか(概要編)

5か月前

AI研究所は狂気と欲望の夢を見るか?

1か月前

DeepSeekの登場とAI業界への衝撃:ゲームチェンジャーの出現?

DeepSeek-R1

3週間前

DeepSeekの躍進でアメリカ半導体株価が下落した理由

2週間前

KIMI K 1.5が拓くAI新時代: 長大コンテキストとマルチモーダル推論の最前線

2週間前

うみゆき氏「LLMが人間を越えることはない」

マイクラと生成AIを使ってシミュレーターを作りたい

2か月前

熟考するAI「OpenAI o1」の凄さ -強いAI(汎用性AI)がついに見えてきた!

4か月前

【AI基礎論】強化学習に対するGPTo3miniの意見

2週間前

ついにAIが数学オリンピックの金メダリストに到達

21時間前

衝撃のOpenAI 12daysを徹底解剖!生成AIの未来を読み解く4つのメッセージ

DeepSeek-R1をざっくり理解する

機械学習モデルの種類~課題に合わせた手法を選択しよう!~

OpenAI o1はどう作るのか(詳細編)

5か月前

第17章 AIの未来展望とトレンドを学ぶ

ブルームバーグがとばしてきた!【DeepSeekがオープンAIから「蒸留」した証拠あり-米政府AI責任者】強化学習に他社AIへのプロンプトと出力データをつかった?正解不正解はどうやって判定? でも【AI出力に著作権はない】ですよね? https://x.com/BloombergJapan/status/1884430237108183331

2週間前

報酬予測誤差神経は報酬の効率的符号化を実現する

3か月前

推論と強化学習によるスポーツ、学業の業績向上について

¥1,000〜
割引あり
1か月前

DeepSeek-R1が技術的にすごい点

6日前

【4コマ】ChatGPTのファインチューニング #260

論文「Self Generated Wargame AI: Double Layer Agent Task Planning Based on Large Language Model」の紹介

7か月前

生成AIはフル活用しています。ただ、Deepseekに関しては疑わしいところがあるので、判明するまで使用しない方向です。 強化学習のみで実行可能なAIとは言われていますが、そうなるとGPUが大量に必要になります。NVIDIAの株価が下落したことと矛盾が生じ、違和感があります。

[学習手法のブレークスルー]7Bモデルと8Kデータで実現した驚異の数学推論

3週間前