マガジンのカバー画像

Data

55
運営しているクリエイター

2023年11月の記事一覧

labelme2yoloの使い方~Segmentation編~

labelme2yoloの使い方~Segmentation編~

はじめにlabelme2yoloというpythonライブラリを発見

かなり新しいライブラリなので日本語記事が皆無

なら、私が書きましょう☆彡

動作環境Python:3.11.5

ultralytics:8.0.145

labelme:5.3.1

labelme2yolo:0.1.3 ★今回の主役!!

labelme2yoloの使い方labelme2yoloとは?

labelmeで作

もっとみる
日本語Wikipediaのマルチターン会話データセット10万個を作りました

日本語Wikipediaのマルチターン会話データセット10万個を作りました

GPT-3.5-Turboを使って、約一ヶ月かけて日本語のWikipediaの項目をもとに先生と生徒が会話するマルチターンデータセットを作りました。

GPT-3.5を使っているため取り扱いには注意が必要ですが、とりあえず「日本語の高性能LLM」を作ってみる実験はできるはずです。

GPT-4でもやってみようかなと思っていますが、GPT-3.5でも一ヶ月でかなりの出費があり、GPT-4で同じ分量の

もっとみる
GPT3.5を用いてマルチターン日本語会話データセット(16K)を作りました

GPT3.5を用いてマルチターン日本語会話データセット(16K)を作りました

npaka大先生と話をしていて、「日本語のマルチターンデータセットがあんまり公開されていない」というので、試しにWikipedia日本版データセット(izumi-lab/wikipedia-ja-20230720)とGPT-3.5-Turboでマルチターン会話データセットを作りました。一週間前から断続的に作ってましたが、11/6に追加された新機能のJSONモードを使ってさらにスピードアップしました

もっとみる