Browser-useを試す(Windows WSL2)
Browser-useを試しました
インストールと実行
>python3.11が必要です
WSL2上で環境を準備します
$ mkdir browser-use
$ cd browser-use
$ pyenv local 3.12.0
$ python3 -m venv .venv
$ source .venv/bin/activate
公式の手順でインストールします
$ pip install browser-use
$ playwright install
環境ファイルにOpenAIのキーを登録しておきます
$ nano .env
OPENAI_API_KEY=
検索
使い方はシンプルです
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
async def main():
agent = Agent(
task="Find a one-way flight from Bali to Oman on 12 January 2025 on Google Flights. Return me the cheapest option.",
llm=ChatOpenAI(model="gpt-4o"),
)
result = await agent.run()
print(result)
asyncio.run(main())
ボタンの押下
ボタンの押下ができるか試してみます
noteの「スキ」を押すタスクです
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
async def main():
agent = Agent(
task="note 上でブリーチーズに関する記載があるページを高評価順に10件検索し、それぞれの記事にハートマークの「スキ」を押す",
llm=ChatOpenAI(model="gpt-4o"),
)
result = await agent.run()
print(result)
asyncio.run(main())
実行結果
夢が広がりますね