AmazonからASINを軸に製造メーカーとホームページのURLを調べるツールを作成するには

AmazonからASINを軸に製造メーカーとホームページのURLを調べるツールを作成するには、いくつかのステップが必要です。以下のように進めるとよいでしょう。

必要なもの

  1. プログラミング言語: Python

  2. パッケージ:

    • `requests`: ウェブリクエストを送信するため

    • `beautifulsoup4`: HTML解析のため

    • `pandas`: データフレームの操作のため

  3. Amazon Product Advertising API: 商品情報を取得するため

  4. メーカー情報取得API: メーカーのホームページURLを取得するため

システムコード

以下はPythonで実装したサンプルコードです。ASINをリストとして入力し、製造メーカーとホームページのURLを取得するプロセスを示します。

import requests
from bs4 import BeautifulSoup
import pandas as pd

# Amazon Product Advertising APIの認証情報を設定
ACCESS_KEY = 'YOUR_ACCESS_KEY'
SECRET_KEY = 'YOUR_SECRET_KEY'
ASSOCIATE_TAG = 'YOUR_ASSOCIATE_TAG'
API_URL = 'https://webservices.amazon.com/onca/xml'

# ASINリスト
asins = ['B08N5WRWNW', 'B08N5W3RQZ', 'B08N5WRNB5']  # サンプルASIN

def get_product_details(asin):
    params = {
        'Service': 'AWSECommerceService',
        'Operation': 'ItemLookup',
        'ItemId': asin,
        'ResponseGroup': 'ItemAttributes',
        'AWSAccessKeyId': ACCESS_KEY,
        'AssociateTag': ASSOCIATE_TAG
    }
    
    response = requests.get(API_URL, params=params)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'xml')
        manufacturer = soup.find('Manufacturer').text if soup.find('Manufacturer') else 'N/A'
        return {
            'asin': asin,
            'manufacturer': manufacturer
        }
    else:
        return {
            'asin': asin,
            'manufacturer': 'N/A'
        }

def get_homepage_url(manufacturer):
    search_url = f"https://www.google.com/search?q={manufacturer}"
    response = requests.get(search_url)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, 'html.parser')
        for link in soup.find_all('a'):
            url = link.get('href')
            if 'url?q=' in url:
                return url.split('url?q=')[1].split('&')[0]
    return 'N/A'

# 商品詳細を取得
product_details = [get_product_details(asin) for asin in asins]

# ホームページURLを取得
for product in product_details:
    product['homepage_url'] = get_homepage_url(product['manufacturer'])

# データフレームに変換
df = pd.DataFrame(product_details)

# CSVに保存
df.to_csv('product_details.csv', index=False)

print("CSVファイルが作成されました: product_details.csv")

ここから先は

487字

¥ 1,000

この記事が気に入ったらチップで応援してみませんか?