Browser-useを試す(Windows WSL2)

Browser-useを試しました

インストールと実行

>python3.11が必要です

WSL2上で環境を準備します

$ mkdir browser-use
$ cd browser-use
$ pyenv local 3.12.0

$ python3 -m venv .venv
$ source .venv/bin/activate

公式の手順でインストールします

$ pip install browser-use
$ playwright install

環境ファイルにOpenAIのキーを登録しておきます

$ nano .env
OPENAI_API_KEY=

検索

使い方はシンプルです

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio

async def main():
    agent = Agent(
        task="Find a one-way flight from Bali to Oman on 12 January 2025 on Google Flights. Return me the cheapest option.",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    result = await agent.run()
    print(result)

asyncio.run(main())

ボタンの押下

ボタンの押下ができるか試してみます

noteの「スキ」を押すタスクです

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio


async def main():
    agent = Agent(
        task="note 上でブリーチーズに関する記載があるページを高評価順に10件検索し、それぞれの記事にハートマークの「スキ」を押す",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    result = await agent.run()
    print(result)


asyncio.run(main())

実行結果



夢が広がりますね


いいなと思ったら応援しよう!