- 運営しているクリエイター
2024年7月の記事一覧
AIを用いて橋梁床版の画像からひび割れ検出を行ってみた
※本ブログはAidemy Premiumのカリキュラム「AI アプリ開発講座」の一環で、受講修了条件を満たすために公開しています。
成果物の橋梁床版ひび割れ検出アプリは下記です。
https://aidemy-final-output-jn.onrender.com/
0. はじめに ~この題材を選んだきっかけ~皆さま初めまして。著者は今ソフトウェアベンダーの技術営業として働いています。最近
【論文要約:自動運転関連】Deformable Convolution Based Road Scene Semantic Segmentation of Fisheye Images in Autonomous Driving
自動運転に関連する論文の要約をしています。
論文へのリンク:https://arxiv.org/abs/2407.16647
1. タイトル
原題: Deformable Convolution Based Road Scene Semantic Segmentation of Fisheye Images in Autonomous Driving
和訳: 自動運転における魚眼画像の変形可能
マルチモーダルembeddigモデルE5-Vを試してみる
画像と文字列を同じ埋め込みベクトル化できるマルチモーダルなembeddingモデルE5-Vというものを知ったので、試してみました。
画像と文字列を共にベクトル化できるとなると、先行するものとしてCLIPやSigLIPがありますが、このE5-Vは画像も理解するLLMであるLLaVA-NeXT-8Bをベースにしていることから、文章理解力が上がっているようです(上記論文参考)。
画像と文字列とでモダ
【論文要約:自動運転関連】SimPB: A Single Model for 2D and 3D Object Detection from Multiple Cameras
自動運転に関連する論文の要約をしています。
論文へのリンク:https://arxiv.org/abs/2403.10353
1. タイトル
原題: SimPB: A Single Model for 2D and 3D Object Detection from Multiple Cameras
和訳: SimPB: 複数のカメラから2Dおよび3Dオブジェクト検出のための単一モデル
2.
【論文要約:自動運転関連】HeightFormer: Explicit Height Modeling without Extra Data for Camera-only 3D Object Detection in Bird’s Eye View
自動運転に関連する論文の要約をしています。
論文へのリンク:https://arxiv.org/abs/2307.13510
1. タイトル
原題: HeightFormer: Explicit Height Modeling without Extra Data for Camera-only 3D Object Detection in Bird’s Eye View
和訳: Height
Youtubeストリーミング動画をYoloV10でリアルタイム物体認識する方法
UltralyticsでYoloV10が使えるようになりましたので、Youtubeストリーミング動画をリアルタイムで物体認識するコードを紹介していきます。
Pythonライブラリをインストールします。
pip install opencv-python yt-dlp numpy ultralytics tempfile
次に、youtubeyolov10.pyという名前で以下内容をコピーしま
UltralyticsのYoloV10でリアルタイムで物体認識する
UltralyticsでYoloV10が使えるようになりましたので、紹介していきます。
YoloV10で使えるモデルは、以下となります。
今回は、Yolov10-Sをダウンロードして使ってみます。
最初に、test.pyとして次のコードを張り付けてください。
import cv2import torchfrom ultralytics import YOLO# モデルの読み込みmodel