
Python初心者 無料で学習を極める(10)
休日の時間を活用し、どんどんレベルアップをしていきますよ~。
season1 では、環境構築から機械学習まで実施することができましたね。
興味がある方は、下にリンクを貼りますので、見て下さいね。
それでは、 season2 のスタートです!
season2 では、より実践的なことを進めることが出来ればと思っています。
そして、次回の話も未定。笑。まずは、今回は・・・・
子供の好きなジブリの画像をクリアに保存★
を目標に進めてまいります!この記事を読み終わったときには、あなたのパソコンには子供が大好きな画像がたくさん高画像で手に入るでしょうね!
画像取得の技:スクレイピングとは?
pythonの世界では、web上での画像を取得する事をスクレイピングと言われるようです。とても便利であるみたいですが、重要なのが
「情報解析もしくは検索サービス提供のために用いられる場合のみ」
許されている点になります。その為、今回は
1)提供元が画像取得を了承してくれている
2)取得したデータをデータ分析のみに活用する
3)取得先のサイトに負荷を与えない用に人のアナログ操作で出来る範囲の画像取得にする
と、前提条件を設定致しました。法律違反をしたいわけではないですし、ましてやサイトをクラッシュさせたいわけでもないので、単純に機械学習に使う画像を集めたい との思いから、実行していきます!
提供サイト:ジブリ様~~~
前段で、前提条件を用いて行動を起こしていこうと思ったところ・・・なんと、スタジオジブリの鈴木敏夫さんが良心的なコメント!!!
お言葉に甘えて、活用をさせて頂きます。ありがとうございます。
(なお、これは右クリック 名前で画像を保存をした図です。笑)
環境の構築:requests
ライブラリとして、requests があります。このライブラリを用いる事で簡単にURLからの画像データの抽出・保存ができます。
pip install requests
これでインストールができたらOK!
初めての・・・画像保存!
早速ですが、画像保存を実施してみます。
色々な技術があると思いますが、ステップを踏んて行こうと思います。
1歩目)画面に映っている画像を右クリックしてURLを取得し、保存する
この1歩目を踏んでみます。
まずは、「何を」を選びましょうかね。先程のジブリサイトの下記の画像を取りたいと思います!
この黄色枠に設定した画像を取り出したいと思います。右クリックしてURLを取得しましょう。
https://www.ghibli.jp/gallery/mononoke030.jpg
今回の画像のURLはこのようになりました。それでは、実際のコードを記載します。
#requests ライブラリの使用宣言
import requests
#取りたい画像
url = "https://www.ghibli.jp/gallery/mononoke030.jpg"
file_name = "ashitaka-sama1.jpg"
#どこの場所から取りますか
response = requests.get(url)
#バイナリーデータとして保存
image = response.content
#処理の開始と終了を定義します。
#開始:ファイルを開いて、
#終了:書き出してね
#といった感じですね。
with open(file_name, "wb") as f:
f.write(image)
そして、その結果・・・。
きた~~~~~~~。テンション上がりますね。
思いのほか、情報量が増えてきたので、ここで本記事は終わります。
次は、 サイトの傾向を見て、画像保存を実施する ことを考えてみようと思います。
それではまた!
いいなと思ったら応援しよう!
