一、这个工具能做什么?
Browser Use就像给AI装上了人手和眼睛,让它能像真人一样操作浏览器。举个栗子🌰:
- 你的AI助理可以帮你订到凌晨三点最便宜的机票
- 自动刷招聘网站投简历,比应届生自己海投快10倍
- 在Hugging Face上自动收集最新AI模型资料
二、三大核心亮点
1. 人类级操作体验
# 一句代码让AI开始工作
agent = Agent(task="找2025年1月巴厘岛飞阿曼的最便宜机票")
- 支持多标签操作(像人类一样切换网页)
- 智能等待页面加载(不会出现手快误点的情况)
- 视觉识别能力(能看懂验证码和动态图表)
2. 企业级扩展功能
# 自定义保存职位信息
@controller.action('保存职位详情')
def save_job(title, salary):
print(f"发现好工作:{title} 月薪{salary}")
- 支持对接数据库(自动入库收集的数据)
- 可集成企业OA系统(自动填报审批单)
- 文件下载管理(自动归类到指定文件夹)
3. 多线程打工模式
# 10个AI同时工作
async with browser.new_context() as context:
Agent(task="任务1", browser_context=context)
- 每个Agent独立工作区(避免串号)
- 支持任务断点续传(不怕网络波动)
- 智能错误重试(比真人打工更可靠)
三、手把手教学(附避坑指南)
1. 安装只需两步
pip install browser-use
playwright install # 重要!不装这个打不开浏览器
2. 配置文件有讲究
# .env文件要这么写(注意等号两边不能有空格!)
OPENAI_API_KEY=sk-你的密钥
ANTHROPIC_API_KEY=你的Claude密钥
3. 实战代码示例
from browser_use import Agent
from langchain_openai import ChatOpenAI
async def 找机票():
agent = Agent(
task="查2025年1月12日巴厘岛→阿曼单程最便宜航班",
llm=ChatOpenAI(model="gpt-4o")
)
print(await agent.run())
# 90%新手会忘记这行!
import asyncio
asyncio.run(找机票())
四、开发者必看技巧
-
跨域处理黑科技
设置disable_security=True
可破解iframe限制(慎用!) -
无头模式省资源
headless=True
适合服务器部署,本地调试建议关闭 -
智能等待策略
python minimum_wait_page_load_time=2 # 最短等待2秒 maximum_wait_page_load_time=30 # 最长等30秒
五、项目直通车
👉 GitHub源码:https://github.com/browser-use/browser-use
(悄悄说🤫:关注公众号【何三笔记】查看更多python实战案例)