CV - 2024-02｜thomas

2024年2月4日 10:29

yolov8でとroboflowでアニメキャラの顔を見分ける(後編)

\Programs\Python\Python310\Lib\site-packages\ultralytics\cfg\datasets 環境により場所は違うかも。にできている、coco.yaml(ココヤムルと読むらしい)をコピーして、mycoco.yamlを作る。

賢い人コメントをつけてほしい

\Python\Python310\Lib\site-packages\ultralytics\

もっとみる

寺田英雄（㈱オープンストリームCTO）

2024年2月6日 13:35

論文調査メモ：NeRF-SLAM

＊この記事は自分の研究テーマに関連したメモです。SLAMやNeRFの知識がある人向けです。

元論文以下、文中の論文引用番号は上記の元論文に合わせている。

概要NeRF-SLAM は、単眼 Visual SLAM のマップ部分に NeRF を適用したもの。ローカライゼーション目的の単純な幾何学的マップとしてだけでなく、NeRFの特徴を活かして、視覚的（測光学的）にも精度の高いモデルを同時に獲得で

もっとみる

AIXTECH（AIクロステック）

2024年2月19日 14:51

第4号「コンピュータビジョンの深層学習ベース化」

Control Color: Multimodal Diffusion-based Interactive Image Colorization

画像に色のヒントを与えて着色するための拡散モデルです。

どんなもの？: 高度に制御可能な対話式画像着色手法であり、無条件および条件付き画像着色を支援し、色溢れや不正確な着色を解決します。

先行研究と比べてどこがすごい？: 複数の条件（テキストプロ

もっとみる

noguchi-shoji

2024年2月1日 21:43

WSL2でYOLO-Worldを試してみる

「強力なオープンボキャブラリー検出機能とグラウンディング機能を備えた次世代の YOLO 検出器」らしいYOLO-Worldを試してみます。

V100で52.0 FPSをたたき出す性能とのこと。これは楽しみです。

（注）Hugging Faceのリポジトリで試しています。GitHubのほう、requirements.txtがまだcommitされていないようでして。

使用するPCはドスパラさんの

もっとみる

AIXTECH（AIクロステック）

2024年2月7日 13:15

特別号「構成画像検索（Composed Image Retrieval）」

はじめに: 構成画像検索とは構成画像検索とは、画像とクエリ（テキスト）を使って画像を検索することです。例えば、魚の画像と「折り紙」というワードで画像を検索すれば入力した魚に近い折り紙の画像を検索できます。
従来のよくある全部の画像の埋め込みベクトルを事前に計算しコサイン類似度で画像検索するというやり方だと、入力画像との類似画像しか検索できないという問題やクエリを追加して柔軟に検索することができな

もっとみる

AIXTECH（AIクロステック）

2024年2月5日 03:51

第3号「セマンティックセグメンテーションの高精度化」

Exploring Simple Open-Vocabulary Semantic Segmentationどんなものか: 「S-Seg」は、画像の各ピクセルに意味的なラベルを割り当てるためのモデルで、任意の開放型語彙テキストセットから学習します。このモデルは、手動でアノテートされたセグメンテーションマスクや大規模な事前トレーニングを必要としません。

先行研究と比べてどこがすごいか: 既存の手

もっとみる

CV

フォローしませんか？

2024年2月の記事一覧

yolov8でとroboflowでアニメキャラの顔を見分ける(後編)

論文調査メモ：NeRF-SLAM

第4号「コンピュータビジョンの深層学習ベース化」

WSL2でYOLO-Worldを試してみる

特別号「構成画像検索（Composed Image Retrieval）」

第3号「セマンティックセグメンテーションの高精度化」