AmazonからASINを軸に製造メーカーとホームページのURLを調べるツールを作成するには
AmazonからASINを軸に製造メーカーとホームページのURLを調べるツールを作成するには、いくつかのステップが必要です。以下のように進めるとよいでしょう。
必要なもの
プログラミング言語: Python
パッケージ:
`requests`: ウェブリクエストを送信するため
`beautifulsoup4`: HTML解析のため
`pandas`: データフレームの操作のため
Amazon Product Advertising API: 商品情報を取得するため
メーカー情報取得API: メーカーのホームページURLを取得するため
システムコード
以下はPythonで実装したサンプルコードです。ASINをリストとして入力し、製造メーカーとホームページのURLを取得するプロセスを示します。
import requests
from bs4 import BeautifulSoup
import pandas as pd
# Amazon Product Advertising APIの認証情報を設定
ACCESS_KEY = 'YOUR_ACCESS_KEY'
SECRET_KEY = 'YOUR_SECRET_KEY'
ASSOCIATE_TAG = 'YOUR_ASSOCIATE_TAG'
API_URL = 'https://webservices.amazon.com/onca/xml'
# ASINリスト
asins = ['B08N5WRWNW', 'B08N5W3RQZ', 'B08N5WRNB5'] # サンプルASIN
def get_product_details(asin):
params = {
'Service': 'AWSECommerceService',
'Operation': 'ItemLookup',
'ItemId': asin,
'ResponseGroup': 'ItemAttributes',
'AWSAccessKeyId': ACCESS_KEY,
'AssociateTag': ASSOCIATE_TAG
}
response = requests.get(API_URL, params=params)
if response.status_code == 200:
soup = BeautifulSoup(response.content, 'xml')
manufacturer = soup.find('Manufacturer').text if soup.find('Manufacturer') else 'N/A'
return {
'asin': asin,
'manufacturer': manufacturer
}
else:
return {
'asin': asin,
'manufacturer': 'N/A'
}
def get_homepage_url(manufacturer):
search_url = f"https://www.google.com/search?q={manufacturer}"
response = requests.get(search_url)
if response.status_code == 200:
soup = BeautifulSoup(response.content, 'html.parser')
for link in soup.find_all('a'):
url = link.get('href')
if 'url?q=' in url:
return url.split('url?q=')[1].split('&')[0]
return 'N/A'
# 商品詳細を取得
product_details = [get_product_details(asin) for asin in asins]
# ホームページURLを取得
for product in product_details:
product['homepage_url'] = get_homepage_url(product['manufacturer'])
# データフレームに変換
df = pd.DataFrame(product_details)
# CSVに保存
df.to_csv('product_details.csv', index=False)
print("CSVファイルが作成されました: product_details.csv")
ここから先は
487字
¥ 1,000
この記事が気に入ったらサポートをしてみませんか?