マガジンのカバー画像

CV

146
運営しているクリエイター

2024年10月の記事一覧

【論文要約:自動運転関連】A New Dataset for Monocular Depth Estimation Under Viewpoint Shifts

【論文要約:自動運転関連】A New Dataset for Monocular Depth Estimation Under Viewpoint Shifts

自動車のADAS(先進運転支援システム)および自動運転に関わる仕事をしています。
新しい技術が次々と登場するため、最新情報の収集が重要です。
その一環として、自動運転に関連する論文の紹介と要約を行っています。
興味のある論文については、ぜひ実際の論文をお読みください。
論文へのリンク:https://arxiv.org/abs/2409.17851

1. タイトル

原題: A New Data

もっとみる
【459_YOLOv9-Wholebody25】を試す

【459_YOLOv9-Wholebody25】を試す

459_YOLOv9-Wholebody25とは?高速かつ軽量な人体検出モデルです。25種類のクラスにラベル分けされており、性別、大人、子供のほかにも全身の部位の検出が可能なようです。更に頭の方向推定もできるそうです。
用途としては、店舗における顧客の見ている商品の解析や、筋トレのフォーム指導、わき見運転の警告、カンニングの防止など多岐にわたって考えられます。

詳細

推論に使用させていただいた

もっとみる
Depth Pro+YOLO11でカメラと人物の距離の推定を試してみた

Depth Pro+YOLO11でカメラと人物の距離の推定を試してみた


概要Appleが発表した単眼深度推定モデルのDepth Proを試してみました。

Depth Proはゼロショットで実際の距離の推定ができる点が特徴です。

YOLO11のセグメンテーションモデルと組み合わせて、カメラと人物の距離を推定してみました。

高速な推論を謳っていますが、あまり速くはありませんでした。

Google ColabのL4インスタンスで810×1080のサンプル画像に2秒

もっとみる
OpenAI API の Vision Fine-Tuning を試す

OpenAI API の Vision Fine-Tuning を試す

「OpenAI API」の「Vision Fine-Tuning」を試したのでまとめました。

1. Vision Fine-Tuning「GPT-4o」の「Vision Fine-Tuning」が可能になりました。これにより開発者は、より強力な画像理解機能を持つようにモデルをカスタマイズできます。

2. データセットの作成今回は、「ぼっち・ざ・ろっく」の結束バンドのメンバーの名前を学習します。

もっとみる
OpenAI API の Vision Fine-Tuning の概要

OpenAI API の Vision Fine-Tuning の概要

以下の記事が面白かったので、簡単にまとめました。

1. Vision Fine-Tuning本日 (2024年10月1日)、「GPT-4o」の「Vision Fine-Tuning」が可能になりました。これにより開発者は、より強力な画像理解機能を持つようにモデルをカスタマイズできます。

2. Vision Fine-Tuning のしくみ「Vision Fine-Tuning」は、テキストによ

もっとみる
YOLO11を試してみた

YOLO11を試してみた


概要YOLOv8を発表したUltralyticsが新しいYOLOシリーズのモデル YOLO11 を発表したので試してみました。

Ultralyticsのドキュメントもv8から11へ更新されています。

命名はこれまでと異なり「v」無しの YOLO11 です。

「v」付きの命名を避けたのは、既にYOLOv11という命名の悪戯リポジトリがあるためかもしれません

YOLOは物体検出モデルとして有

もっとみる