115【有料で学んだこと】MENTAでshota.kokado@Python/AWSさんに教わったこと④ SUUMOさんスクレイピング発展編
こんにちは!TechCommitメンバーの友季子です。
今回の記事では、MENTAでshota.kokado@Python/AWSさんに教わった、SUUMOさんを例にスクレイピングするコツについて発展編をシェアします。
スクレイピングの学習をするお仲間のお役に立てれば幸いです。
ご相談内容
SUUMOさんのURL
ご教授いただいたこと
読みやすさを考慮し、一部修正して記載します。
レッスン
async def handle_response(self, response: HtmlResponse):
from property_store.models import SuumoProperty
for row in response.css("div.property"):
# 中略
# 物件の住所を抽出する
address = row.css("div.detailbox-property table td.detailbox-property-col")[4].css("::text").getall()
# HTMLコメントを含んでいるため、クレンジングする
address = "".join(address).strip()
print("###", address)
動画1つ目
動画2つ目
画像
以上です♪
何かあなたのお役にたてば幸いです。