見出し画像

とりあえず進む。

今日は映画サイトのランキングなどを持ってくるという授業
タグのクラス名を使ってデータを持ってくる

import requests from bs4 import BeautifulSoup URL = "https://eiga.com/ranking/" headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} data = requests.get(URL, headers=headers) soup = BeautifulSoup(data.text, 'html.parser') movies = soup.select('#document_16l5w5x > main > div > div > section:nth-child(4) > table > tbody > tr') for movie in movies:
rank = movie.select_one('span').text
title = movie.select_one('h2 > a').text
date = movie.select_one('.time').text print(title,rank)

アナログ 1 劇場公開日:2023年10月6日
沈黙の艦隊 2 劇場公開日:2023年9月29日
BAD LANDS バッド・ランズ 3 劇場公開日:2023年9月29日
ミステリと言う勿れ 4 劇場公開日:2023年9月15日
キリエのうた 5 劇場公開日:2023年10月13日
イコライザー THE FINAL 6 劇場公開日:2023年10月6日
月 7 劇場公開日:2023年10月13日
アントニオ猪木をさがして 8 劇場公開日:2023年10月6日
ジョン・ウィック コンセクエンス 9 劇場公開日:2023年9月22日
ゆとりですがなにか インターナショナル 10 劇場公開日:2023年10月13日

プロセスは終了コード 0 で終了しました

上記の実行結果を得た。

①recestsと、Beautifulsoupというパッケージをインストールした
②URLという変数で、引用するURLの準備は終わっている。
③持ってきたデータはsoupという変数の中に入れている。
④もってきたい映画のタイトルのところに、マウスを合わせて右クリック。
 検証を押して、デベロッパーツールの中でもまた右クリック。コピー、copyselectorを選んで、コピーして貼り付けたタグを確認する。
aタグで終わっているが、映画の入っているタグを細かく指定してる。
⑤trのデータを指定したデータはすでにリスト型だったので、ランキング、タイトル、日にちといったデータを1個1個指定して取り出す、ということをした。

やばい何かまとまっていない。。疲れたからとりあえずおわり。

いいなと思ったら応援しよう!