記事一覧
Prover-Verifier ゲームによる言語モデル出力の可読性向上
原論文: https://cdn.openai.com/prover-verifier-games-improve-legibility-of-llm-outputs/legibility.pdf Claude: https://claude.site/artifacts/1fb7c1fe-2d0c-45de-…
計算のある生命: 単純な相互作用から整形された自己複製プログラムが出現する仕組み
原論文: [2406.19108] Computational Life: How Well-formed, Self-replicating Programs Emerge from Simple Interaction (arxiv.org) Claude Artifact: https://claud…
計算のある生命: 単純な相互作用から整形された自己複製プログラムが出現する仕組み
原論文: [2406.19108] Computational Life: How Well-formed, Self-replicating Programs Emerge from Simple Interaction (arxiv.org)
Claude Artifact: https://claude.site/artifacts/fe966da8-b0e4-471b-a8ce-68d2
STaR: 自己教師あり推論器(フルバージョン)
原論文: 2203.14465 (arxiv.org)推論による推論の自己学習
Eric Zelikman1, Yuhuai Wu12, Jesse Mu1, Noah D. Goodman1
1スタンフォード大学コンピュータサイエンス学科
2Google Research
{ezelikman, yuhuai, muj, ngoodman}@stanford.edu
概要数学や常識的な質問応
STaR: 自己教示型推論器 - 推論による推論のブートストラップ
要旨STaRは段階的な「思考の連鎖」根拠生成を通じて、複雑な推論タスクのパフォーマンスを向上させる新しい手法です。
下記の論文をまとめてみました。
2203.14465 (arxiv.org)
STaRの主要プロセス少数ショットプロンプトで根拠生成
誤答の場合、正解を与えて再度根拠生成(合理化)
正解を導いた根拠でファインチューニング
反復
合理化とは合理化は、モデルが正しく回答できなか
Monte Carlo Tree Search Self-Improvement (MCTSr) Algorithm: 革新的な数学的推論の最前線
はじめに数学オリンピックの問題を解くことができる人工知能を想像してみてください。これは単なる空想ではありません。Monte Carlo Tree Search Self-Improvement (MCTSr) アルゴリズムの登場により、この夢が現実になりつつあります。本記事では、この画期的なアルゴリズムが人工知能の世界にもたらす変革について深く掘り下げていきます。
MCTSrの本質:LLMとMC