- 運営しているクリエイター
#人工知能
OpenAI API の Vision Fine-Tuning を試す
「OpenAI API」の「Vision Fine-Tuning」を試したのでまとめました。
1. Vision Fine-Tuning「GPT-4o」の「Vision Fine-Tuning」が可能になりました。これにより開発者は、より強力な画像理解機能を持つようにモデルをカスタマイズできます。
2. データセットの作成今回は、「ぼっち・ざ・ろっく」の結束バンドのメンバーの名前を学習します。
Google Colab で SAM 2 を試す
「Google Colab」で「SAM 2」を試したのでまとめました。
1. SAM 2「SAM 2」(Segment Anything Model 2) は、画像や動画のセグメンテーションを行うためのAIモデルです。目的のオブジェクトを示す情報 (XY座標など) が与えられた場合に、オブジェクトマスクを予測します。
具体的に何ができるかは、以下のデモページが参考になります。
2. セットア
Google Colab で Florence 2 を試す
「Google Colab」で「Florence 2」を試したので、まとめました。
1. Florence 2「Florence 2」は、Microsoftが開発した軽量なVLM (Vision Language Model) です。キャプション、物体検出、OCRなど、さまざまなビジョンタスクを単一モデルで処理することができます。
2. Colabでの実行Colabでのセットアップ手順は、次の
骨格推定ライブラリとしてよく使われているOpenPoseを試す
牧野 浩二
骨格推定ライブラリとして大学や研究所で利用されているOpenPose を使って,人間が写っている1 枚の画像から頭や手足を認識し,骨格を描画する方法を紹介します.本稿の方法を応用すれば,人間の頭や手足の座標を得ることができるので,画像や動画から人間がどこにいるのか,どんなことをしているのかなどが解析できるようになります.
1.できること● 人間の頭や手足の位置を推測できる
Op
Google Colab で CartoonSegmentation を試す
「Google Colab」で「CartoonSegmentation」を試したので、まとめました。
1. CartoonSegmentation「CartoonSegmentation」は、漫画・アニメのキャラクターのインスタンスセグメンテーションとそれを中心に構築されたいくつかの視覚テクニックを含む、論文「 Instance-guided Cartoon Editing with a Lar