- 運営しているクリエイター
2024年10月の記事一覧
【論文要約:自動運転関連】A New Dataset for Monocular Depth Estimation Under Viewpoint Shifts
自動車のADAS(先進運転支援システム)および自動運転に関わる仕事をしています。
新しい技術が次々と登場するため、最新情報の収集が重要です。
その一環として、自動運転に関連する論文の紹介と要約を行っています。
興味のある論文については、ぜひ実際の論文をお読みください。
論文へのリンク:https://arxiv.org/abs/2409.17851
1. タイトル
原題: A New Data
Depth Pro+YOLO11でカメラと人物の距離の推定を試してみた
概要Appleが発表した単眼深度推定モデルのDepth Proを試してみました。
Depth Proはゼロショットで実際の距離の推定ができる点が特徴です。
YOLO11のセグメンテーションモデルと組み合わせて、カメラと人物の距離を推定してみました。
高速な推論を謳っていますが、あまり速くはありませんでした。
Google ColabのL4インスタンスで810×1080のサンプル画像に2秒
OpenAI API の Vision Fine-Tuning を試す
「OpenAI API」の「Vision Fine-Tuning」を試したのでまとめました。
1. Vision Fine-Tuning「GPT-4o」の「Vision Fine-Tuning」が可能になりました。これにより開発者は、より強力な画像理解機能を持つようにモデルをカスタマイズできます。
2. データセットの作成今回は、「ぼっち・ざ・ろっく」の結束バンドのメンバーの名前を学習します。
YOLO11を試してみた
概要YOLOv8を発表したUltralyticsが新しいYOLOシリーズのモデル YOLO11 を発表したので試してみました。
Ultralyticsのドキュメントもv8から11へ更新されています。
命名はこれまでと異なり「v」無しの YOLO11 です。
「v」付きの命名を避けたのは、既にYOLOv11という命名の悪戯リポジトリがあるためかもしれません
YOLOは物体検出モデルとして有