data:image/s3,"s3://crabby-images/1719a/1719a1fd15441e56568c2168a84ff8b914384c45" alt="見出し画像"
実験ノート:Open_Deep-Research(1)
OpenAIからDeep Researchが出て、24H以内に、オープンソースでこれをレプリケートするものがhuggingfaceで出たのが Open_Deep-Research。Huggingfaceのsmolagentsという、ライトウエイトなagentフレームワーク、というかcode agentを利用している。spaceが公開されており、お試しができる。その実力やいかに。
AIの記号接地について、ヴィトゲンシュタインの論考などを参考に、近年の大規模言語モデルや思考連鎖(CoT)能力をもつLLMの発展から、記号接地しているかどうか、していないならばする条件を明確にしたい
Step1:ヴィトゲンシュタインの哲学を調べる
data:image/s3,"s3://crabby-images/af40f/af40fc938af72b2c6deb8bd4e3c82e612d79c75c" alt=""
最初にweb search、ヴィトゲンシュタインと記号接地について調べる。検索文字列はこちら。
web_search(query="Wittgenstein on symbol grounding")
検索のコードは実行されてその結果がこちら、
data:image/s3,"s3://crabby-images/f12da/f12da52ce4de6943c2419b4d3d98e388ebf7132f" alt=""
記号接地関連の論文しか、かかってこない。
Step2:考察、関連性の高いテキスト情報の収集
data:image/s3,"s3://crabby-images/e3d59/e3d59155ca770452edf09f0caf9204a8fe783e45" alt=""
検索で得られた、関連性の高いurlを3つ選択し、これらの内容を得る。結果はこちら。
data:image/s3,"s3://crabby-images/f38cf/f38cf226d6ba3caddc44b28d92060a77b761a824" alt=""
べたでテキストをとってくるのね、ずいぶん長いテキストになるような。
Step3:考察、リソースの分析と、CoT関連文献調査開始
data:image/s3,"s3://crabby-images/48965/48965af72cb2b1ee0c298fa1fc454e8dac7ff12c" alt=""
得られた知見は2つ、1)ヴィトゲンシュタインと記号・言語、2)記号接地とは。CoTに関する検索を実施、検索ワードはこちら。
web_search(query="recent developments in LLMs chain-of-thought capabilities")
得られたCoTに関する調査結果はこちら。
data:image/s3,"s3://crabby-images/31cfa/31cfabc74eba36fb7649a59dca05504f310afeb6" alt=""
まあ、そういうもんでしょう。
Step4:考察、CoT深堀開始
data:image/s3,"s3://crabby-images/fcd65/fcd656176f264d54edefc3cdf9fc8c79bf6bad19" alt=""
関連性の高い、URLを3つ選んで深堀開始。結果はこちら。
data:image/s3,"s3://crabby-images/df427/df427387dc57ba1547f49be1cec6ce4e1913817e" alt=""
Step5:全体的な考察
data:image/s3,"s3://crabby-images/eb76a/eb76aa15f720f6c4876a309545083d4a55cd48a6" alt=""
いままでの検索と考察を、合体させた考察を展開。"Insight"なるまとめ方をしてきた。
data:image/s3,"s3://crabby-images/dc99f/dc99fb17b6e53861498910084cedf5baf2cd83b7" alt=""
現在のLLMが記号接地しているかどうかについての回答案が列挙される。そしてfinal_answerが呼ばれる。
final_answer("Current LLMs, like OpenAI's with CoT capabilities, demonstrate advanced reasoning but do not yet intrinsically ground symbols. Conditions for such grounding include intrinsic semantic comprehension, interactive learning, and embodied cognition.")
Step6:最終回答
data:image/s3,"s3://crabby-images/0b36f/0b36f408e2d9a5c4369708df4982f1af2ba83987" alt=""
つまり、現在のLLM、OpenAIのとか、はCoT能力があって、先進の推論能力を持つが、まだ内部的に記号接地していない。それには条件があって、内部的な意味の理解、インタラクティブな学習と、身体性をもった認識が、記号接地の条件である。
感想
まあ、smolagentsをつかって、検索とか、テキストの取得とかそういうのをやって、LLMで考察とかまとめをするみたいな流れは分かった。とうぜん本家やPeplexityよりも複雑な考察やレポートにはまとめてくれないが、検索とまとめを自動化する良いサンプルになっている。そりゃ24H以内にできるわな。速度が重要ということだ。