The Complete Python Pro Bootcamp 2023: Day 53/100
PythonブートキャンプのDay 53では、過去10日間に学んだウェブスクレイピング技術を総合的にレビューするエキサイティングなキャップストーンプロジェクトが始まります。
このプロジェクトは、Zillowウェブサイトから特定の基準に合った住宅価格の情報を収集し、それをGoogleフォームに入力してスプレッドシートに変換するデータ入力作業を含みます。
技術的なスキルのテストであると同時に、Beautiful SoupとSeleniumを使ったPythonの実践的応用の機会を提供します。
キャップストーン・プロジェクト入門
100 Days of Code Python Bootcamp 53日目へようこそ!今日からウェブスクレイピングを中心としたエキサイティングなキャップストーンプロジェクトが始まります。このプロジェクトは、この10日間で学んだウェブスクレイピングのテクニックを包括的に復習するものです。
コンセプト データ入力の自動化
実世界のシナリオからのインスピレーション
このプロジェクトは、データ入力作業の自動化におけるPythonの実際の応用から着想を得ています。このような仕事では、ウェブサイトやPDFからスプレッドシートへといったように、あるフォーマットから別のフォーマットへデータを転送することがよくあります。
ケーススタディ
Indeed.comに掲載されたThe Data Entry Company (TDEC)のデータ入力事務員の求人情報。
RedditとThe Workplace Stack Exchangeにおける、Pythonを使った仕事の自動化に関する議論。
プロジェクトの概要
タスク 研究データ入力の仕事
このプロジェクトでは、Zillowのウェブサイトからクライアントの特定の条件に合う住宅価格に関する情報を収集し、このデータをGoogleフォームに転送して、Google Sheetsでスプレッドシートを作成する調査データ入力の仕事があります。
ツールとテクノロジー
Beautiful SoupとSelenium**: これらのツールはスクレイピングとデータ入力の自動化に使用されます。
Google フォームとシート**: Google フォームとシート**:収集したデータの整理と提示に使用します。
要件
Beautiful Soupを使用したZillowクローンサイトからの住宅リストのスクレイピング。
**2.Seleniumを使用した各リストのGoogleフォームへの入力。
目的
ゴールは、サンフランシスコにある家賃が月3,000ドルまでで、少なくともベッドルームが1つある賃貸物件のリストをまとめることです。この情報をクライアントのためにスプレッドシート形式できちんと整理すること。
課題とヒント
課題
このプロジェクトでは、これまでに学んだウェブスクレイピングのスキルをすべて応用する必要があります。
最低限のガイダンスしかないため、自主的に問題を解決する能力が試されます。
ヒント
住所や価格など、異なるデータタイプのスクレイピングのニュアンスに注意してください。
情報を確実に使えるようにするために、データクリーニングのテクニックに重点を置きましょう。
結論
ウェブスクレイピングに関するこのキャップストーンプロジェクトは、あなたの技術力を試すだけでなく、実社会におけるPythonの実践的な応用を垣間見ることができます。Webスクレイピング、Beautiful Soup、Seleniumについて学んだことをまとめ、Pythonで実現できることの限界を押し広げる絶好の機会です。ハッピーコーディング!
この記事が気に入ったらサポートをしてみませんか?