ふぅー

機械学習やらAIやら、備忘録として使っています。

ふぅー

機械学習やらAIやら、備忘録として使っています。

最近の記事

「The Rise and Potential of Large Language Model Based Agents: A Survey」読んでみました。

 LLMの可能性を考えてみたく、今更ながら読んでみました。他サイトでもいろんな解説あると思います。遅咲き記事ですみません。この論文は、かなりページ数あるので偏りのある内容になっていると思いますので、あしからず。 論文「The Rise and Potential of Large Language Model Based Agents: A Survey」  引用文献除いて48ページの大作です。引用文献数は675。すごい。 要約 AIエージェントは、環境を感知し、意思決

    • DID-M3Dをカスタムデータで動かしてみる!ための調査備忘録。

      概要画像からの2D物体検出と3D物体検出何が違うの?という単なる興味本位から。 単眼3D検出技術「[2207.08531] DID-M3D: Decoupling Instance Depth for Monocular 3D Object Detection (arxiv.org)」のOSSをカスタムデータで動かすための調査メモ。 論文は、単眼での難しさが深度推定にあることとし、物体の深度を、物体のの視覚的な表面の深度(視覚的な深度)と物体の属性の深度(属性の深度)の組み合

    • 「The Rise and Potential of Large Language Model Based Agents: A Survey」読んでみました。

    • DID-M3Dをカスタムデータで動かしてみる!ための調査備忘録。