見出し画像

開発用に調達した画像・映像データは加工していいのか?

こんにちは、野本です!
今回はタイトルにあるように、機械学習用に調達した画像・映像データの加工についてです。
データの加工可否については、実はPIXTAにお問い合わせいただくお客様からの質問としても多いんです。

手元にある画像・映像データを加工(データ拡張)することによって、データ量を増やして、研究に十分なデータ量を確保することはよくあると思います。
データの著作権などの権利について気になることが多い昨今、データの加工についてストックフォトサービス・PIXTAの視点から解説したいと思います。

CCライセンスなら加工はOK?

データ拡張(データ水増し)の手法は一般的にオープンソースのデータにも適用可能です。しかし、データセットごとに使用条件やライセンスが異なるため、加工が禁止されている場合もあります。ひとくちにオープンソースといっても、表示されているライセンスによっては加工(改変)が禁止されていることがあります。

オープンソースのライセンスの代表例として、Creative Commons (CC) ライセンスが挙げられます。丸印にCが2つ並んで入ったマーク、見たことありませんか?
CCライセンスなら著作権フリーで自由に加工しても大丈夫・・・というわけではありません。
CCライセンスには複数のバージョンがあります。

例えば、CC BY(表示)は加工や商用利用を許可していますが、CC BY-ND(表示-改変禁止)は改変を禁止しています。
そう、CCライセンスでも”CC BY-ND”ライセンスのデータセットでは、画像データの加工が許可されていない可能性があるんです。
CCライセンスがついているからといって、どれでも自由に加工してよいというわけではないんです。

調達時にはライセンスに注目

データの加工を想定して調達するのであれば、無料/有料に関わらず、加工してもよいライセンスを選ぶ必要があります。
オープンソースや無料データの場合は、CCライセンスの詳細や提供/使用条件を確認しましょう。
有料データの場合は、購入時に会員登録や発注書の提出が必要になることが多いので、サービスの利用規約や発注書の提供条件を確認しましょう。「わざわざお金を出して買うのに、いちいち確認が必要なの?」と思われるかもしれませんが、データのような無形商品には大抵の場合利用ルールがついてきます。ルールを守って使ってね、ということが利用規約や提供条件として記載してあります。お金を支払ったからには好きに使ってもいい!というわけではないため、予め注意が必要です。

サービスによって異なる制約

加工を禁止していなくても、どのような加工ならよいのか、また、どの程度なら加工してよいのかは、提供元によって異なります。
データ拡張の手法としては、画像の回転や平行移動、トリミング、拡大縮小、反転や変形、明るさや色調の調整などがあります。
他にも、工数はかかりますが、複数の画像を合成することによってバリエーションを増やすこともできます。
また、画像・映像の被写体が何なのかによって加工の可否や程度が異なる場合もあります。特に人物が被写体となっている場合は、人物以外が被写体になっている場合と比べて制限がつくことがあるので、利用検討時に確認しておくことをお勧めします。

PIXTAから購入した開発用データは加工してもよいのか?

PIXTAが提供するデータは、PIXTA利用規約に基づいてご利用いただくことに同意いただく必要があります。
PIXTA利用規約では、先に挙げたデータ拡張手法については、いずれも行っていただいて問題ありません。
もともと商用広告への利用が多いため、デザイン用途の加工にあたって禁止していることがいくつかありますが、データ拡張の加工と照らすと概ねどのような加工でも行っていただけます。
「この加工は大丈夫かな?」と気になることがあれば、お気軽に営業担当にご相談ください。


==================================
もし、
・必要な画像が調達できるのか知りたい
・費用感が知りたい
・点数や画像条件に応じた見積もりをしてほしい

という時には、お気軽にお問い合わせください。お待ちしております!
★お問い合わせはコチラから。

PIXTA機械学習用画像・動画データ提供サービス
https://pixta.jp/machinelearning-dataset

==================================
今後、定期的に更新していきますので、
ぜひこちらのアカウントをフォローしていただけると嬉しいです!
この記事への「スキ」もお待ちしています!