「#強化学習」の人気タグ記事一覧｜note ――つくる、つながる、とどける。

【AI基礎論】「強化学習」（R1との対話）

5日前

9

Genesis 入門 (11) - 強化学習による移動ポリシーの学習のコード解説

1か月前

21

人間はなぜ行動するか？強化学習理論について解説します。

あおきしゅんたろう @ 福島県立医科大学

2週間前

9

C級botterになりたい男の記録 part2

2か月前

22

ChatGPT o1に匹敵？中国制作の『DeepSeek-R1』の性能と可能性を検証

ほぼほぼAIで

2週間前

16

【AI基礎論】主体論理体系(/理由の論理体系)を適正に進化させるには

9日前

7

【OpenAI、食われる？】DeepSeek-R1がすごすぎる！✨強化学習＋思考プロセス付きの推論力がすごいLLMが登場！OpenAIより90%も安いのに高性能😍料金体系や使い方まで徹底解説💖

葉加瀬あい (AI-Hakase)🎈動画&Note でAI解説🎥https://x.gd/F2Mvl

3週間前

113

【OpenAI、食われる？】DeepSeek-R1がすごすぎる！✨強化学習＋思考プロセス付きの推論力がすごいLLMが登場！OpenAIより90%も安いのに高性能😍料金体系や使い方まで徹底解説💖

葉加瀬あい (AI-Hakase)🎈動画&Note でAI解説🎥https://x.gd/F2Mvl

3週間前

68

AI2nd＃４ふりかえり（機械学習入門）

Tetsu Hama(田舎の人)

3週間前

8

強化学習は奥の深い分野。LINEヤフーで技術と向き合い続けたい

LINEヤフー採用

3か月前

40

【生成AI】DeepSeek-R1論文備忘録

2週間前

8

OpenAI o1再現モデルまとめ（2024年12月時点）

2か月前

77

【AI基礎論】大規模言語モデルに対する強化学習

1か月前

10

【AI基礎論】アルファ碁は囲碁を深く理解していると言えるのか？

1か月前

7

カフェとAIと、ちょっとした人生論

NebulaBee🌹2025年はRoblox開発

1か月前

10

【論文瞬読】強化学習で進化する言語モデルの推論能力：DeepSeek-R1の挑戦

3週間前

10

第5章 AIの思考について学ぶ

遊花：遊びながら学ぶ生成AI【フォロバ100】

1か月前

13

OpenAI o1を再現しよう（Reasoningモデルの作り方）

2か月前

60

【論文解説】言葉で考えるAI：自然言語強化学習（NLRL）の衝撃

2か月前

17

３つのAIの使用感

1か月前

12

強化学習への関心

くすぐったがり

7日前

4

DeepSeek R-1：スプートニクショック再来？米中AI競争の新たな局面

2週間前

19

GRPOを試してみた

13日前

6

Deepseek R1は人間を超える方法を見つけた!?

2週間前

4

12 Days of OpenAI: Day 2 　専門家だけを集めてベータテストを始めるだと！？　もう、一般ピーポーは、「なんか難しいことしてんなぁ・・・」状態（＾＾；

足立　明穂

2か月前

10

【AI基礎論】「強化学習」では適正な主体論理体系(/理由の論理体系)に到達しない

2週間前

3

OpenAI o1はどう作るのか(概要編)

5か月前

97

AI研究所は狂気と欲望の夢を見るか？

1か月前

10

DeepSeekの登場とAI業界への衝撃：ゲームチェンジャーの出現？

広瀬潔（HBR Advisory Council Member）

11時間前

7

DeepSeek-R1

3週間前

3

DeepSeekの躍進でアメリカ半導体株価が下落した理由

2週間前

3

KIMI K 1.5が拓くAI新時代: 長大コンテキストとマルチモーダル推論の最前線

2週間前

3

うみゆき氏「LLMが人間を越えることはない」

榊正宗＠AIクリエイター

2か月前

7

マイクラと生成AIを使ってシミュレーターを作りたい

2か月前

7

熟考するAI「OpenAI o1」の凄さ -強いAI(汎用性AI)がついに見えてきた！

4か月前

62

【AI基礎論】強化学習に対するGPTo3miniの意見

2週間前

2

ついにAIが数学オリンピックの金メダリストに到達

21時間前

7

衝撃のOpenAI 12daysを徹底解剖！生成AIの未来を読み解く4つのメッセージ

自習ノート【学校向け AI活用セミナー開催中】

1か月前

7

DeepSeek-R1をざっくり理解する

猫四郎🐾生成AIラボ

3週間前

4

機械学習モデルの種類～課題に合わせた手法を選択しよう！～

DATA MINDS編集部＠ワークスアイディDS東京

1か月前

7

OpenAI o1はどう作るのか（詳細編）

5か月前

59

第17章 AIの未来展望とトレンドを学ぶ

遊花：遊びながら学ぶ生成AI【フォロバ100】

3週間前

6

ブルームバーグがとばしてきた！【DeepSeekがオープンＡＩから「蒸留」した証拠あり－米政府ＡＩ責任者】強化学習に他社AIへのプロンプトと出力データをつかった？正解不正解はどうやって判定？でも【AI出力に著作権はない】ですよね？ https://x.com/BloombergJapan/status/1884430237108183331

2週間前

3

報酬予測誤差神経は報酬の効率的符号化を実現する

3か月前

6

推論と強化学習によるスポーツ、学業の業績向上について

¥1,000〜

割引あり

1か月前

3

DeepSeek-R1が技術的にすごい点

6日前

2

【4コマ】ChatGPTのファインチューニング　#260

なごみ@まいにち４コマ

4か月前

12

論文「Self Generated Wargame AI: Double Layer Agent Task Planning Based on Large Language Model」の紹介

7か月前

36

生成AIはフル活用しています。ただ、Deepseekに関しては疑わしいところがあるので、判明するまで使用しない方向です。強化学習のみで実行可能なAIとは言われていますが、そうなるとGPUが大量に必要になります。NVIDIAの株価が下落したことと矛盾が生じ、違和感があります。

けんいちくん

2週間前

2

[学習手法のブレークスルー]7Bモデルと8Kデータで実現した驚異の数学推論

3週間前

3