项目介绍
BrowserWing 开源浏览器 Agent 官方文档
欢迎使用 BrowserWing 官方文档!BrowserWing 是一个真正可用的开源浏览器 Agent,通过 AI 录制浏览器操作并封装成可复用的 MCP 命令。
产品定位
BrowserWing 是一个开源的浏览器自动化 Agent 平台,旨在通过 AI 辅助录制和 MCP(Model Context Protocol)命令封装,实现高效、稳定的浏览器自动化。它为开发者、数据分析师和自动化工程师提供了一个强大的工具,能够将复杂的浏览器操作转化为可复用、可编排的自动化命令。
核心价值
- 高效稳定:避免大模型逐步交互的低效方式,直接执行封装好的命令
- Token 友好:大幅减少 LLM 交互的 token 消耗,降低成本
- 低代码/无代码:提供可视化录制功能,无需编写复杂的自动化脚本
- 高度可扩展:支持自定义脚本和 MCP 命令,可与各种 LLM 和工作流工具集成
- 持久化会话:支持 Cookie 和存储管理,保持会话稳定性
适用场景
- 数据提取与分析:自动从网站提取数据,生成报告或分析
- 社交媒体监控:跟踪特定账号或话题的动态,自动生成摘要
- 自动化测试:录制和回放网页测试脚本,确保网站功能正常
- RPA 流程自动化:实现跨系统的业务流程自动化
- AI 辅助浏览:结合 LLM 实现智能浏览和信息处理
- 内容聚合与分发:自动收集和整理来自多个网站的内容
差异化优势
| 特性 | BrowserWing | 传统 Selenium/Puppeteer | 其他 AI 浏览器 Agent |
|---|---|---|---|
| 录制方式 | AI 辅助可视化录制 | 代码编写 | 自然语言描述 |
| 执行效率 | 高(直接执行命令) | 中(脚本解释执行) | 低(LLM 逐步交互) |
| Token 消耗 | 低(仅命令调用) | 无 | 高(持续交互) |
| 会话管理 | 内置持久化支持 | 需要手动实现 | 有限支持 |
| MCP 集成 | 原生支持 | 无 | 部分支持 |
| 学习曲线 | 低(可视化操作) | 高(需要编程知识) | 中(依赖 LLM 能力) |
核心功能
浏览器管理
- 启动和管理多个浏览器实例
- 配置浏览器配置文件和扩展
- 持久化 Cookie 和本地存储
- 支持代理配置和无头模式
脚本录制与编辑
- 可视化录制浏览器操作(点击、输入、导航等)
- AI 辅助生成和优化脚本
- 直观的脚本编辑器,支持步骤调整和参数修改
- 支持脚本导出和导入
MCP 命令转换
- 将录制的脚本转换为 MCP 命令
- 自动生成命令描述和参数定义
- 支持自定义命令模板
- 命令版本管理
LLM 集成
- 支持多种 LLM 服务(OpenAI、Claude、DeepSeek 等)
- AI 辅助数据提取和分析
- 智能错误处理和恢复
- 自然语言命令生成
快速开始
社区与支持
- Discord:https://discord.gg/BkqcApRj - 加入社区讨论,获取实时支持
- GitHub:https://github.com/browserwing/browserwing - 提交 Issues 和 Pull Requests
- Twitter:https://x.com/chg80333 - 关注最新动态和更新
- 微信:添加作者微信 mongorz 备注 browserwing 进用户群
许可证
BrowserWing 采用 MIT 许可证,详见 LICENSE 文件。