スクレイピングと法律について

エンジニア初心者がまず仕事を受けようと思ったときに最初に名前が挙がるのがスクレイピング。
ただし法律をよく知らないと、クライアントに言われるがままよくわからないまま法律に違反してしまうことがあるので、一応中退したが中大法にいた時期もある私が軽く説明しようと思う。
念のためだが、本稿はあくまで参考程度に読んでいただきたい。
実際に問題になるかどうかは弁護士に相談するべきであり、私の記事を読んでやったら法律に違反したといわれても責任を取れません。あしからず。

スクレイピングに関わる法律

大きくわけて5つの法律がかかわってくる。
・著作権法
・個人情報保護法
・刑法(偽計業務妨害罪、電子計算機損壊等業務妨害罪)
・民法(債務不履行・不法行為)
・スクレイピングの例外規定

著作権法

これは「ネット上に公開されている情報のほとんどには著作権が存在し、原則著作者の同意を得なければ第三者は使用できない」というもの。
当然スクレイピングによってウェブ上のデータを複製することも含まれるので、著作者がスクレイピング行為を禁止している場合、著作権法違反になる。
事前にウェブサイトの所有者がスクレイピング行為を禁止していないか確認するべきである。

個人情報保護法

ウェブスクレイピングを行った際に個人情報を同意なく取得、公開、売買してしまった場合、個人情報保護法に違反することになる。
個人情報を公開することに対する同意を得ることはほぼ不可能なので、個人情報が記載されている部分へのアクセスは避けるように(レアケースではある)。

刑法

スクレイピングを行う際に過度にウェブサイトにアクセスしてしまうと、サーバーへ負荷がかかり他のユーザーがそのウェブサイトを閲覧できなくなってしまう可能性がある。
そうなった場合にウェブサイトの運営に大きく支障が出てしまう。
この行為は偽計業務妨害罪に抵触する。
こちらは刑法なのでもし違反してしまうと前科がつく。
一般的にはサイトにアクセスする感覚を1秒以上開けていれば問題ないとされているが、多くのプログラマーは3秒から5秒程度実行間隔を空けている。
Pythonであればtimeのsleepを使用することが多い。
これは一番注意すべき要素である。

民法

利用規約にスクレイピング・クローリング行為を禁止することが記載されている(もしくはそれに該当する行為を禁止することが記載されている)場合、不法行為に該当することになる。
これは会員制のサイトでデータを取得する際にはほとんど該当する。
これらはサイトにログインした時点で発生するのが一般的である。
amazonの利用規約にもスクレイピングを禁止する旨が記載されているが、ログインしていない状態であればこの規約は効力を発しないため、ログインしていないのであればスクレイピング行為は行ってよい。
サイト側でAPIが用意されている場合があるので、そちらを利用するようにするべきである。
補足的な内容にはなるが、クライアントが会員でエンジニアは非会員であったとしても、エンジニアの行為は不法行為に当たる。
プログラムを書いた時点で故意ではあるのだが、故意と過失(規約に違反することを知っていてやったか、知らないでやったか)の両方で不法行為による損害賠償が発生する。
ただしクライアントがエンジニアを騙したり脅迫したりして作らせたなどの場合は、これに該当しない。

スクレイピングの例外規定

著作権法30条4項や47条5項で、データを公開したり譲渡せずに個人のデータ分析として使用する場合は、著作者の許可を取らずともデータの取得が可能であるという法律が近年整備された。
そのため上記の著作権法に関する項目以外に該当しない場合はスクレイピングは基本的に法律で認められるようになっている。

スクレイピング業務の実態として

スクレイピング自体は違法行為ではない上に法律でスクレイピングが可能な範囲が拡大しているが、一定数ウェブスクレイピング行為自体を禁止すべきだという人が存在する(特にウェブサイトの開発者など)。
クライアントおよびエンジニア側がスクレイピング行為に関する法律の知識不足に起因するものが多い。
法律に違反しているスクレイピング行為を行うエンジニアによってウェブサイトの運営に支障をきたすことが多かったり、そのようなスクレイピング行為を対策するためにコストがかかっているという現実がある。
これに対しエンジニアもそのようなサイトにスクレイピングを行えるようあらゆる手を尽くし、それに対策して…という負のループに陥ってしまっている。
エンジニアに法律を熟知しろというのは酷な話ではあるが、エンジニア側としてできることは、マナーと法律を守って使うことである。

法律違反から身を守るために

クラウドソーシングサービスでもこの手の案件は数多く転がっている。
案件を見分ける要素として
・スクレイピング行為が法律違反になる可能性があることを知っていること
・会員制のサイトをスクレイピングするときは利用規約に目を通すこと
・かならずアクセスの間隔を空けること
が挙げられる。
これを意識していればほとんどトラブルに巻き込まれるようなことにはならないと私は考えている。


いいなと思ったら応援しよう!