高松 真(Makoto Takamatsu)

科学技術のワクワクや驚きを読者にわかりやすく伝えることを大切に記事を書いています。 投稿の内容は、個人の意見であって、所属組織を代表するものではありません。

高松 真(Makoto Takamatsu)

科学技術のワクワクや驚きを読者にわかりやすく伝えることを大切に記事を書いています。 投稿の内容は、個人の意見であって、所属組織を代表するものではありません。

最近の記事

  • 固定された記事

AIが手を取り合う未来:Mixture of Agents(MoA)とは?

AIの進化は驚くべき速さで進んでいます。しかし、皆さんは「AI同士がチームを組んで仕事をする」未来を想像したことがありますか?実は、AIの未来はそんな世界へと向かっているのです。そのカギを握るのが、今回紹介するMixture of Agents(MoA)という技術です。 論文情報 はじめに 私たちはすでに、大規模言語モデル(LLM)を活用して、文章の生成や質問への回答、さらにはコードの作成など、さまざまなタスクをAIに任せることができるようになりました。とはいえ、これら

    • LLMとVLMが切り開くイノベーション:訓練不要なビデオ異常検出アプローチ

      大規模言語モデルで変革する、訓練不要のビデオ異常検出 ビデオ監視システムは、セキュリティ、交通モニタリング、産業機器の監視など、多岐にわたる分野で不可欠なツールとなっています。しかし、その核心を担う異常検出技術は、これまで大量のデータを用いた訓練が必須であり、コストや時間の面で大きな課題が存在していました。 そんな中、従来の手法を根底から覆す革新的な技術が登場しました。それが、大規模言語モデル(Large Language Model, LLM)を活用した訓練不要のビデオ

      ¥500
      • 位置特定技術の未来を先取り!「CLIP-Clique」で空間認識の新しいアプローチ

        Vision Language Modelsが切り開くオブジェクトベースのローカライゼーション技術 物体認識技術は急速に進化していますが、その複雑さと課題に直面する場面は依然として多く存在します。例えば、物体がどこに位置しているかを正確に把握することは、現実の環境では容易ではありません。特に、視覚データに基づいて正確な対応関係を特定するローカライゼーション(位置特定)技術には、解決すべき課題が山積していました。そんな中、新たなアプローチとして登場したのが「CLIP-Cliq

        • Depth anythingのデモでいろいろな画像のデプスマップを作成してみた。

          Depth anythingとは?Depth anythingをさまざまなデータで試してみる今回は、huggingfaceのspacesにデプロイされたDepth Anything で試します。 Coco2014にある画像データで深度推定する 検証のしやすさのためCOCO2014データセットに載っている画像ファイルで深度推定をしたデプスマップの作成を試みます。 以下の図に示すように、隣接するピクセルごとに、一貫性を持った深度マップが作成されている様子がわかります。

          ¥300
        • 固定された記事

        AIが手を取り合う未来:Mixture of Agents(MoA)とは?