浏览器自动化
云雀 Agent 可以控制浏览器来导航网站、提取内容、填写表单、截图,以及执行复杂的网页自动化任务。
架构
Agent (Planner)
↓ browser_exec 技能
BrowserHub (WebSocket 服务器)
↓ 命令 (导航、点击、输入、截图)
浏览器扩展 (Chrome/Edge/Firefox)
↓ CDP 协议
浏览器标签页通过配套浏览器扩展连接,支持任何 Chromium 内核浏览器。
安装
- 在
chrome://extensions加载browser-extension/目录 - 扩展自动连接
ws://localhost:9090/v1/browser/ws - 浏览器技能自动注册
支持的操作
| 操作 | 说明 |
|---|---|
navigate | 打开 URL |
click | 点击元素 |
type | 输入文本 |
screenshot | 截图 |
extract | 提取内容 |
scroll | 滚动 |
evaluate | 执行 JavaScript |
E2B 云端桌面
无需本地浏览器的云端自动化:
- 完整 Ubuntu 桌面环境
- noVNC 实时画面流
- 仪表盘 iframe 嵌入
配置变量: SANDBOX_CLOUD_ENABLED, SANDBOX_CLOUD_API_KEY, SANDBOX_CLOUD_TEMPLATE