一、这个工具能做什么?

Browser Use就像给AI装上了人手和眼睛,让它能像真人一样操作浏览器。举个栗子🌰:

  • 你的AI助理可以帮你订到凌晨三点最便宜的机票
  • 自动刷招聘网站投简历,比应届生自己海投快10倍
  • 在Hugging Face上自动收集最新AI模型资料

二、三大核心亮点

1. 人类级操作体验

# 一句代码让AI开始工作
agent = Agent(task="找2025年1月巴厘岛飞阿曼的最便宜机票")
  • 支持多标签操作(像人类一样切换网页)
  • 智能等待页面加载(不会出现手快误点的情况)
  • 视觉识别能力(能看懂验证码和动态图表)

2. 企业级扩展功能

# 自定义保存职位信息
@controller.action('保存职位详情')
def save_job(title, salary):
    print(f"发现好工作:{title} 月薪{salary}")
  • 支持对接数据库(自动入库收集的数据)
  • 可集成企业OA系统(自动填报审批单)
  • 文件下载管理(自动归类到指定文件夹)

3. 多线程打工模式

# 10个AI同时工作
async with browser.new_context() as context:
    Agent(task="任务1", browser_context=context)
  • 每个Agent独立工作区(避免串号)
  • 支持任务断点续传(不怕网络波动)
  • 智能错误重试(比真人打工更可靠)

三、手把手教学(附避坑指南)

1. 安装只需两步

pip install browser-use
playwright install  # 重要!不装这个打不开浏览器

2. 配置文件有讲究

# .env文件要这么写(注意等号两边不能有空格!)
OPENAI_API_KEY=sk-你的密钥
ANTHROPIC_API_KEY=你的Claude密钥

3. 实战代码示例

from browser_use import Agent
from langchain_openai import ChatOpenAI

async def 找机票():
    agent = Agent(
        task="查2025年1月12日巴厘岛→阿曼单程最便宜航班",
        llm=ChatOpenAI(model="gpt-4o")
    )
    print(await agent.run())

# 90%新手会忘记这行!
import asyncio
asyncio.run(找机票())

四、开发者必看技巧

  1. 跨域处理黑科技
    设置disable_security=True可破解iframe限制(慎用!)

  2. 无头模式省资源
    headless=True适合服务器部署,本地调试建议关闭

  3. 智能等待策略
    python minimum_wait_page_load_time=2 # 最短等待2秒 maximum_wait_page_load_time=30 # 最长等30秒

五、项目直通车

👉 GitHub源码https://github.com/browser-use/browser-use

(悄悄说🤫:关注公众号【何三笔记】查看更多python实战案例)