Yuya Fujiwara

Yuya Fujiwara

最近の記事

Prover-Verifier ゲームによる言語モデル出力の可読性向上

原論文: https://cdn.openai.com/prover-verifier-games-improve-legibility-of-llm-outputs/legibility.pdf Claude: https://claude.site/artifacts/1fb7c1fe-2d0c-45de-9bc2-fbaacf8adee9 Jan Hendrik Kirchner*, Yining Chen*, Harri Edwards†, Jan Leike†,

    • 計算のある生命: 単純な相互作用から整形された自己複製プログラムが出現する仕組み

      原論文: [2406.19108] Computational Life: How Well-formed, Self-replicating Programs Emerge from Simple Interaction (arxiv.org) Claude Artifact: https://claude.site/artifacts/fe966da8-b0e4-471b-a8ce-68d2fcb75dca Blaise Agüera y Arcas†、Jyrki A

      • 人間のような無限コンテキストLLMのためのエピソード記憶

        原論文: 2407.09450 (arxiv.org) Claude Artifact 概要大規模言語モデル(LLM)は優れた能力を示していますが、長文脈の処理には課題があります。本研究では、人間の脳のエピソード記憶と事象認知の主要な側面をLLMに統合した「EM-LLM」という新しいアプローチを提案しています。これにより、計算効率を維持しながら実質的に無限の長さのコンテキストを効果的に処理できるようになりました。 主要なポイントEM-LLMはトークンの連続をベイズ的驚き

        • STaR: 自己教師あり推論器(フルバージョン)

          原論文: 2203.14465 (arxiv.org)推論による推論の自己学習 Eric Zelikman1, Yuhuai Wu12, Jesse Mu1, Noah D. Goodman1 1スタンフォード大学コンピュータサイエンス学科 2Google Research {ezelikman, yuhuai, muj, ngoodman}@stanford.edu 概要数学や常識的な質問応答などの複雑な推論タスクにおいて、段階的な「思考の連鎖」根拠を生成することで言語

          STaR: 自己教示型推論器 - 推論による推論のブートストラップ

          要旨STaRは段階的な「思考の連鎖」根拠生成を通じて、複雑な推論タスクのパフォーマンスを向上させる新しい手法です。 下記の論文をまとめてみました。 2203.14465 (arxiv.org) STaRの主要プロセス少数ショットプロンプトで根拠生成 誤答の場合、正解を与えて再度根拠生成(合理化) 正解を導いた根拠でファインチューニング 反復 合理化とは合理化は、モデルが正しく回答できなかった問題に対して、正解を提供し新しい根拠を生成させるプロセスです。これにより、モ

          STaR: 自己教示型推論器 - 推論による推論のブートストラップ

          Monte Carlo Tree Search Self-Improvement (MCTSr) Algorithm: 革新的な数学的推論の最前線

          はじめに数学オリンピックの問題を解くことができる人工知能を想像してみてください。これは単なる空想ではありません。Monte Carlo Tree Search Self-Improvement (MCTSr) アルゴリズムの登場により、この夢が現実になりつつあります。本記事では、この画期的なアルゴリズムが人工知能の世界にもたらす変革について深く掘り下げていきます。 MCTSrの本質:LLMとMCTSの革新的融合背景:LLMの限界に挑む 大規模言語モデル(LLM)は、自然言

          Monte Carlo Tree Search Self-Improvement (MCTSr) Algorithm: 革新的な数学的推論の最前線