CV - 人工知能｜thomas

2024年12月13日 16:02

Gemini 2.0 の 3D Spatial Understanding を試す

「Gemini 2.0」の「3D Spatial Understanding」を試したのでまとめました。

1. 3D Spatial Understanding「3D Spatial Understanding」(3次元空間認識) は、2D画像や動画から、現実世界の3次元空間を理解する能力や技術のことです。

2. Gemini API の準備「Google Colab」で Gemini API

もっとみる

npaka

2024年12月13日 15:04

Gemini 2.0 の 2D Spatial Understanding を試す

「Gemini 2.0」の「2D Spatial Understanding」を試したのでまとめました。

1. 2D Spatial Understanding「2D Spatial Understanding」(2次元空間認識) は、2D画像や動画から、平面上での物体の位置・形状や関係性を理解する能力や技術のことです。

2. Gemini API の準備「Google Colab」で Gem

もっとみる

npaka

2024年10月3日 18:41

OpenAI API の Vision Fine-Tuning を試す

「OpenAI API」の「Vision Fine-Tuning」を試したのでまとめました。

1. Vision Fine-Tuning「GPT-4o」の「Vision Fine-Tuning」が可能になりました。これにより開発者は、より強力な画像理解機能を持つようにモデルをカスタマイズできます。

2. データセットの作成今回は、「ぼっち・ざ・ろっく」の結束バンドのメンバーの名前を学習します。

もっとみる

npaka

2024年10月2日 09:45

OpenAI API の Vision Fine-Tuning の概要

以下の記事が面白かったので、簡単にまとめました。

1. Vision Fine-Tuning本日 (2024年10月1日)、「GPT-4o」の「Vision Fine-Tuning」が可能になりました。これにより開発者は、より強力な画像理解機能を持つようにモデルをカスタマイズできます。

2. Vision Fine-Tuning のしくみ「Vision Fine-Tuning」は、テキストによ

もっとみる

npaka

2024年8月16日 22:41

Google Colab で SAM 2 を試す

「Google Colab」で「SAM 2」を試したのでまとめました。

1. SAM 2「SAM 2」(Segment Anything Model 2) は、画像や動画のセグメンテーションを行うためのAIモデルです。目的のオブジェクトを示す情報 (XY座標など) が与えられた場合に、オブジェクトマスクを予測します。

具体的に何ができるかは、以下のデモページが参考になります。

2. セットア

もっとみる

npaka

2024年8月16日 11:45

Google Colab で Florence 2 を試す

「Google Colab」で「Florence 2」を試したので、まとめました。

1. Florence 2「Florence 2」は、Microsoftが開発した軽量なVLM (Vision Language Model) です。キャプション、物体検出、OCRなど、さまざまなビジョンタスクを単一モデルで処理することができます。

2. Colabでの実行Colabでのセットアップ手順は、次の

もっとみる

CQ出版Interface編集部

2022年9月23日 07:31

骨格推定ライブラリとしてよく使われているOpenPoseを試す

牧野浩二

　骨格推定ライブラリとして大学や研究所で利用されているOpenPose を使って，人間が写っている1 枚の画像から頭や手足を認識し，骨格を描画する方法を紹介します．本稿の方法を応用すれば，人間の頭や手足の座標を得ることができるので，画像や動画から人間がどこにいるのか，どんなことをしているのかなどが解析できるようになります．

1．できること● 人間の頭や手足の位置を推測できる
　Op

もっとみる

npaka

2024年1月5日 06:56

Google Colab で CartoonSegmentation を試す

「Google Colab」で「CartoonSegmentation」を試したので、まとめました。

1. CartoonSegmentation「CartoonSegmentation」は、漫画・アニメのキャラクターのインスタンスセグメンテーションとそれを中心に構築されたいくつかの視覚テクニックを含む、論文「 Instance-guided Cartoon Editing with a Lar

もっとみる

CV

フォローしませんか？

#人工知能

Gemini 2.0 の 3D Spatial Understanding を試す

Gemini 2.0 の 2D Spatial Understanding を試す

OpenAI API の Vision Fine-Tuning を試す

OpenAI API の Vision Fine-Tuning の概要

Google Colab で SAM 2 を試す

Google Colab で Florence 2 を試す

骨格推定ライブラリとしてよく使われているOpenPoseを試す

Google Colab で CartoonSegmentation を試す