見出し画像

日本語オープンコンテンツデータセット

  • キャラクター会話

  • お嬢様会話

などの日本語データを無償で公開してくれている神がかったプロジェクト。NPCとの会話AIなどに活用できそう。

下記は、本家サイトからの引用。

コンテンツ向けAIの学習のために

本プロジェクトは、日本語コンテンツのシナリオから生成したデータセットを、権利者の許諾を得て配布するものです。いずれも商用可能なライセンスになっています。

主として大規模言語モデルなどの学習用途を想定していますが、ライセンスに違反しない使い方なら、自由に利用できます。

https://open_contents_datasets.gitlab.io/project_home/

この記事が気に入ったらサポートをしてみませんか?