Browser Use: AI浏览器自动化实战

笔记哥 / 04-16 / 9点赞 / 0评论 / 101阅读
![](https://cdn.res.knowhub.vip/c/2504/16/1d95f4c3.png?G1YAAMTP0x8n7t0vxDbqcG2iSGgGJLIIKiWs13vvPo3o%2b0Mgmp%2fZx4rz4S99rCBheIWRQByG5NmFrRqjlsSsWsyhec8A) 只需一句话,AI 即可自动操作浏览器: ![](https://cdn.res.knowhub.vip/c/2504/16/7f70cfdb.png?G1cAAER17rxgXWEqfice0wSBBJoBizSCSgnr9e491y3y%2fU4wxafXNnx9%2bE1tw4UKu5CFoCEjBDVqpuE4EZRWrBDGOLsD) **搜索商品:** ![](https://cdn.res.knowhub.vip/c/2504/16/cd4af939.png?G1cAAETn9LwUqODIvtMdbIlTE20GLNIIKiWs13vO2jfR9wcYJT%2bj9Rn7w29an0EQNmclMIwVKYiBVbSa1iQw%2bIXiktcI) **下单支付:** ![](https://cdn.res.knowhub.vip/c/2504/16/f3c91f33.png?G1cAAMTydJz4c4%2fSbdTh20SR0AxYpBFUSliv95y1b5HvN4Lqn9H6tP3hN61PEwakgigEEyJcCInQqnppdqFqLoisxa9h) 甚至还能进行深度研究(Deep Research),自动生成完整的攻略报告: ![](https://cdn.res.knowhub.vip/c/2504/16/1def56d9.png?G1cAAETn9LwUihDcvtMdbIlTE20GLNIIKiWs13vO2jfR94ewlPyM1mfsD79pfQYJ2CorCYuxIgWYQCtQ2BMuMQXca14jAA%3d%3d) **Browser use** 是一个开源项目,使 AI 大模型能够自动操作浏览器: ![](https://cdn.res.knowhub.vip/c/2504/16/dd1ee94b.png?G1YAAETn9LwUrEDYvtMdbIlTE20GJLIIKiWs13vO2jfR9wcYNT%2bj9Rn7w19an0EorM5CYCgLki%2bKIgZX8WRanS%2bD5TUC) 短短几个月内,Browser use 已在 GitHub 上获得超过 5 万颗 star: ![](https://cdn.res.knowhub.vip/c/2504/16/95690909.png?G1YAAMTydJz4%2b%2fNEu406fJsoEpoBiSyCSgnr9Z6z9i3y%2fU4wxWe0Pn1%2f%2bEvr04WKXGFCMMMQPC6FKbVqDVaKQlkY13A%3d) 近期大热的 AI 产品 **Manus** 也选择了 Browser use 作为核心组件。随后,**Manus** 联合创始人 `@peakji` 也公开证实,确实采用了 @browser\_use 的开源代码。 ![](https://cdn.res.knowhub.vip/c/2504/16/58a2effa.png?G1YAAMTsdJxIfESl26hD2jvFHc2ARBZBpYT1es9Z%2byb6fgdD4jNan74%2f%2fKX16YTEWjkTGMoZwbMlVoPUasGk4JJSENdw) 本文将带你亲自搭建并测试 Browser use 项目。文中所用 AI 模型为刚刚升级的免费版 DeepSeek V3 0324 OpenRouter。 ![](https://cdn.res.knowhub.vip/c/2504/16/3c89dce6.png?G1YAAMTW3DgpD0hR22gDdWfqnTYDElkElRLW6917rpvo%2b0Mgmp9e24j14S%2b1jSBhmKOQQAwFyeNiBhc19iR2upr6kWcP) 文中还会穿插源码相关知识,补充讲解项目的核心原理。 # 本地搭建 首先,访问 Browser use 的 GitHub 页面:Browser Use · GitHub ![](https://cdn.res.knowhub.vip/c/2504/16/937a74f8.png?G1YAAMTsdJzIJ0Kl26hD2jvFHc2ARBZBpYT1es9Z%2byb6fhdIis9offr%2b8JfWp5MwcoWSQDIUwcOYoayWUrDMVy1Qi2s4) 目前 Browser use 包含三个开源项目: 1. browser-use:命令行版本,无 UI 界面。 2. web-ui:带有网页版 UI 界面。 3. macOS-use:AI 代理(AI agents),可与 macOS 系统及其应用程序交互。允许 AI 通过编程接口模拟人类操作,几乎能操控所有 Mac 应用,如启动软件、点击界面元素、输入文本或执行多步骤任务。(本文不涉及此部分) 为方便操作,本文选择带 UI 的 web-ui 项目,点击进入 web-ui 项目页面: ![](https://cdn.res.knowhub.vip/c/2504/16/49d1fc5b.png?G1YAAMTsdJxIPkGl26hD2jvFHc2ARBZBpYT1es9Z%2byb6fhcWjc9offr%2b8JfWp5OAc%2bVEwpI5IXgIVBUKRQBKtauYxTUc) 进入后可见项目安装说明: ![](https://cdn.res.knowhub.vip/c/2504/16/0f28780b.png?G1cAAMTP0x8n7t0vwTbqcG2iSGgGLNIIKiWs13vvPo3o%2b0Mgmp%2fZx4rz4Td9rCBheIGRQByGFFCZUbQqaxK4G7t5zXsG) 接下来按照官方步骤进行安装。 首先,在 Windows 电脑的 `D:\IdeaPro` 目录下新建 `browser-use` 文件夹,用于统一管理 Browser use 相关内容。 ![](https://cdn.res.knowhub.vip/c/2504/16/f6da16b6.png?G1cAAETn9LyUAhLcvtMdbIlTE20GLNIIKiWs13vO2jfR94dAND%2bj9Rn7w29an0HCsIpCAjEUpMDCahc72BObFph75bxGAA%3d%3d) 然后在 browser-use 文件夹内打开命令提示符(可在地址栏输入 cmd 回车,或右键菜单打开,或通过 Windows 搜索栏搜索 cmd 后 cd 到该目录),执行以下命令: ```csharp git clone ``` ![](https://cdn.res.knowhub.vip/c/2504/16/defc0904.png?G1cAAETn9LyUAujIvtMdbIlTE4WJnLfIKbjyS1hf7zlr30TfHwLR%2fIzWZ%2bwP%2f9L6DBJGcRgJpMCY4FZVq1liRXE38yuvEQ%3d%3d) 项目下载到本地后: ![](https://cdn.res.knowhub.vip/c/2504/16/60f1e42d.png?G1cAAER17rxgXR0Cfice0wSBBJsBizSCSgnr9fz%2f2pfI%2bznBI96j9en7w29any5UpAITggmGEJRqUM31RFDQKg0lxzUc) ![](https://cdn.res.knowhub.vip/c/2504/16/45a9d3e4.png?G1cAAER17rxgXR0Cfice0wSBBJsBizSCSgnr9fz%2f2pfI%2bznBI96j9en7w29any5UpAITggmGEJRqUM31RFDQKg0lxzUc) 进入刚下载的项目文件夹: ```csharp cd web-ui ``` ![](https://cdn.res.knowhub.vip/c/2504/16/500c2d3e.png?G1YAAMT0bJxoe0XFNvqh%2f4lHQjMgkUVQKWG93nv3aUTf72BofGYfy8%2bHv%2fSxnCCcKycCI3NC8KIiEBbTFKqVYrCMuKcD) 下一步是配置 Python 运行环境。官方推荐使用 UV 工具: ![](https://cdn.res.knowhub.vip/c/2504/16/7ba817e5.png?G1YAAMR0rnGCXj8kbiMO1QSBBJoBiSyCSgnr9Z6z9k30%2fSEQzc9ofcb%2b8JfWZ5AwvMJIIA5D8izMgLlKTcbF1MtleY0A) UV 是一个用于管理 Python 环境和包的工具。点击官方链接进入 UV 官网: ![](https://cdn.res.knowhub.vip/c/2504/16/b5dafd1f.png?G1YAAMR0rnGCXj8kbiMO1QSBBJoBiSyCSgnr9Z6z9k30%2fSEQzc9ofcb%2b8JfWZ5AwvMJIIA5D8izMgLlKTcbF1MtleY0A) 在 UV 官网左侧菜单栏找到 Installation: ![](https://cdn.res.knowhub.vip/c/2504/16/62470681.png?G1cAAER17rxg7QaCfice0wSBBJsBizSCSgnr9fz%2f2pfI%2b7lCLd6j9en7w29any5K5IokCs1ICIFKwpJlMJBHLXbCSlzDAQ%3d%3d) 由于我用的是 Windows 系统,先切换到 Windows 选项卡: ![](https://cdn.res.knowhub.vip/c/2504/16/fe11140c.png?G1YAAMTydJz4%2b%2fOkuo06fJsoEpoBiSyCSgnr9Z6z9i3y%2fU4wxWe0Pn1%2f%2bEvr04WKfMGEYIYheKUqzDSDgaiVLMniGg4%3d) 将 UV 提供的安装脚本复制: ![](https://cdn.res.knowhub.vip/c/2504/16/82d97ae3.png?G1YAAMR0rnGCXj9RtxGHaoJAAs2ARBZBpYT1evee6yb6%2fhCI5qfXNmJ9%2bEttI0gYfsJIIA5D8qzMxsrFkFiPArmK59kD) ```csharp powershell -ExecutionPolicy ByPass -c "irm | iex" ``` 在 Windows 搜索栏搜索 PowerShell,打开窗口,把 UV 安装命令粘贴进去并回车: ![](https://cdn.res.knowhub.vip/c/2504/16/40457883.png?G1cAAMT0bJzotdrANvqh%2f4lHQjNgkUZQKWG93nv3aUTf7wJJ8Zl9LD8fftPHchKGFSgJxKAIgROzKopYDmyZgYpc454O) 安装完成后,继续操作。已进入 web-ui 文件夹目录,在命令窗口(如遇命令找不到需重开窗口),使用 UV 创建 Python 3.11 运行环境: ![](https://cdn.res.knowhub.vip/c/2504/16/3673a034.png?G1YAAMT0bJzotYXGNvqh%2f4lHQjMgkUVQKWG93nv3aUTf7wLR%2bMw%2blp8Pf%2bljOQkjGxIJJCMheFbmVGDMGtiyodSqcU8H) ```csharp uv venv --python 3.11 ``` ![](https://cdn.res.knowhub.vip/c/2504/16/90bcddd5.png?G1YAAER17rxg7QCZfice0wSBBJsBiSyCSgnr9fz%2f2pfI%2b7lCU7xH69P3h7%2b0Pl2UKIYsCi3ICJ6JzJWknsFKNQB2xDUc) 使用官方文档命令激活虚拟环境,Windows 示例: ![](https://cdn.res.knowhub.vip/c/2504/16/22eac048.png?G1cAAMTsdJzIJxK026hD2jvFHc2ARRpBpYT1es9Z%2byb6fhdIis9offr%2b8JvWp5MwrEJJIAZFCJyYtVourIEvWMmSMuIaDg%3d%3d) ```csharp .venv\Scripts\activate ``` 激活后,命令行窗口进入虚拟环境: ![](https://cdn.res.knowhub.vip/c/2504/16/20499f0a.png?G1cAAMR0rnGCXj8FtxGHaoJAgs2ARRpBpYT1ev5%2f7Yvo%2fUIgmu%2fR%2boz94TetzyBheIGRQByGFFiZHVwMmpgPsXq61rxGAA%3d%3d) 接下来安装所需 Python 包,官方命令如下: ![](https://cdn.res.knowhub.vip/c/2504/16/ffa82e8c.png?G1YAAETn9LyUAuLIvtMdbIlTE20GJLIIKiWs13vO2jfR94dAND%2bj9Rn7w19an0HCMEchgRgKkmdlNlYzQVI39VIvz2sE) ```csharp uv pip install -r requirements.txt ``` 依赖安装较慢,请耐心等待。安装后用 playwright install 命令安装浏览器自动化工具及对应浏览器: ![](https://cdn.res.knowhub.vip/c/2504/16/772a764c.png?G1cAAMR0rnGCXh8e3UYcqgkCCTQDFmkElRLW6z1n7Zvo%2b10gGp%2fR%2bvT94TetTydhpAojgSQYQmBlTmo1FwucCzir4IprOA%3d%3d) ```csharp playwright install ``` ![](https://cdn.res.knowhub.vip/c/2504/16/3b1370af.png?G1YAAMTP0x8n7ucp3UYdrk0UCc2ARBZBpYT1es9Z%2byb6fldWi89offr%2b8JfWp5MKo3AiZQUnBC8mgqSwUgIguGpFjms4) 接下来编写配置文件,将官方配置文件样例复制一份,命名为 .env: ![](https://cdn.res.knowhub.vip/c/2504/16/81479da8.png?G1YAAMTsdJzIJ0Gj26hD2jvFHc2ARBZBpYT1es9Z%2byb6fheIxme0Pn1%2f%2bEvr00kY2ZBIIBkJwXNiQ4ZZuYJYZdWqFtdw) 用 Pycharm 打开项目: ![](https://cdn.res.knowhub.vip/c/2504/16/21f04b71.png?G1cAAMS22TiVnmZI29gP%2fkNfQTUDFmkElRLW6713n0b0%2fSEsmp%2fZx4rz4Td9rCABm3MhYTEuSAEFrmbg6gkVcHUF5z0D) 复制 `.env.example` 并重命名为 `.env`: ![](https://cdn.res.knowhub.vip/c/2504/16/8866dbfe.png?G1cAAOTcVkxwPx62iOF0Q2CDZsAijaBSwnq956x9A3x%2fMLLkZ7Q%2bY3%2f4TeszgAnNUYGRDRUpkJLLhVWqJyJ1NytCeY0A) 该配置文件主要用于配置 AI 的 API、API Key 以及 API 提供商。本文仍选用 Open Router,进入 OpenRouter 官网,在左上角模型搜索框中搜索 DeepSeek,选择 DeepSeek V3 0324(free)版本: ![](https://cdn.res.knowhub.vip/c/2504/16/15a96ef5.png?G1cAAMTsdJxIPkKj26hD2jvFHc2ARRpBpYT1es9Z%2byb6fheWFJ%2fR%2bvT94TetTycBZ2MlYcmsCAEKS1WKVglQKIrh4riGAw%3d%3d) 进入模型详情页,切换到 API 选项卡: ![](https://cdn.res.knowhub.vip/c/2504/16/7a92848f.png?G1cAAETd9Ly0aVpF9p3u6AZOBdcMWKQRVEpYr%2bf%2f97lE3i8IWr5nHyvOh9%2f0sUKoKA0uBAscKahrcxhpmqhotFpN854B) 复制 OpenRouter 的 API 请求地址: ![](https://cdn.res.knowhub.vip/c/2504/16/b7c98016.png?G1cAAETn9LwUKEDcvtMdbolTE20GLNIIKiWs13vO2jfR9zcwND%2bj9tn2h9%2fUPhtB2AsbgeFsSEFcQgPmGkmMoS5XibxGAw%3d%3d) ```csharp ``` 由于 OpenRouter 格式与 OpenAI 完全兼容,可直接填写到 OpenAI 的 API 地址中: ![](https://cdn.res.knowhub.vip/c/2504/16/8aa48768.png?G1UAAMTsdJxI8oK026hD2jvFHc2ARBZBpYT1es9Z%2byb6fgcjxWe0Pn1%2f%2bEvr0wnC2VgJjMyKoEXFFDlZuYJUFLCVuIYD) 接着获取 API Key,在 Open Router 右上角点击 Keys: ![](https://cdn.res.knowhub.vip/c/2504/16/f500e9f9.png?G1cAAMTsdJzIJ6Ki26hD2jvFHc2ARRpBpYT1es9Z%2byb6fhdIis9offr%2b8JvWp5MwskFJIBmKEFjZVKVk1MBsVY0vK3ENBw%3d%3d) 点击 Create Key 创建新 API Key: ![](https://cdn.res.knowhub.vip/c/2504/16/238b8163.png?G1cAAOTcVkxwPx62iOF0Q2CDZsAijaBSwnq956x9A3x%2fMLLkZ7Q%2bY3%2f4TeszgAnNUYGRDRUpkFI1FXeSRM6oF9VieY0A) 名称可自定义,Credit limit 可选,不填也可以。点击 create: ![](https://cdn.res.knowhub.vip/c/2504/16/819a8ba3.png?G1YAAMTsdJxIvIS026hD2jvFHc2ARBZBpYT1es9Z%2byb6fgcjx2e0Pn1%2f%2bEvr0wmJ1VgIDGVB8EnSpZpVagmmJtlQENdw) 创建后会生成 API key,复制下来: ![](https://cdn.res.knowhub.vip/c/2504/16/20f1608e.png?G1cAAGQ9PS%2faVkv5Tju6JYaEZsAijaBSwnq99%2b7TAL7fGTnFZ%2fax%2fHz4TR%2fLgQnVUICRFQUhkFDVgmImgSxrrsVM4p4O) 填写到项目配置文件 OPENAI\_API\_KEY 一行: ![](https://cdn.res.knowhub.vip/c/2504/16/0694b9d4.png?G1YAAMTsdJxIEp%2bi26hD2jvFHc2ARBZBpYT1es9Z%2byb6flfWFJ%2fR%2bvT94S%2btTycVtsIgZTUGghdItWopowQgCXK9ENdw) 保存后即可启动项目。GitHub 说明如下: ![](https://cdn.res.knowhub.vip/c/2504/16/bfe29171.png?G1YAAER17rxgXdlQ%2fU480ASBBJoBiSyCSgnr9e491y3y%2fZVgik8vbdT14S%2bljSpU%2bAkTgg5D8GoEElQzw5Hdze3yOHsF) 执行 Python 命令启动: ```csharp python webui.py --ip 127.0.0.1 --port 7788 ``` ![](https://cdn.res.knowhub.vip/c/2504/16/0532312c.png?G1cAAMTctHHSXB75ttEOacGqoM2ARRpBpYT1eu%2fdpxF9vwtE4zP7WH4%2b%2fKaP5SSMVGAkkARDCGwCZphWDayaazG1HPd0) 程序会生成本地网站地址,点击 ![](https://cdn.res.knowhub.vip/c/2504/16/251c13f6.1:7788?CwqAaHR0cDovLzEyNy4wLjAuMTo3Nzg4Aw%3d%3d) 打开网页版项目 UI: ![](https://cdn.res.knowhub.vip/c/2504/16/03b3b9ce.png?G1YAAER17rxgXR0Cfice0wSBBJsBiSyCSgnr9fz%2f2pfI%2bznBI96j9en7w19any5UpAITggmG4NUIpdaqORgqceZc4hoO) 还需进行一步设置,进入 LLM Settings 选项卡,将模型名称修改为: ![](https://cdn.res.knowhub.vip/c/2504/16/f63eb83f.png?G1YAAMTW3Dgp8EJF22gDdWfqnTYDElkElRLW6917rpvo%2bwOMkp9e24j14S%2b1jSAI28VKYBgrkhcFi8JUjmRw93Kq5NkD) 本文使用 DeepSeek V3 免费版,在 OpenRouter DeepSeek V3 0324(free)模型详情页 OpenRouter ![](https://cdn.res.knowhub.vip/c/2504/16/81185943.png?G1cAAMTsdJzIJxK026hD2jvFHc2ARRpBpYT1es9Z%2byb6fhdIis9offr%2b8JvWp5MwrEJJIAZFCKwCNs1SNHBBUli%2bUlzDAQ%3d%3d) 粘贴到模型名称中: ![](https://cdn.res.knowhub.vip/c/2504/16/1e9775e2.png?G1cAAER17rxgXWGIfice0wSBBJsBizSCSgnr9fz%2f2pfI%2bznBFO%2fR%2bvT94TetTxcqrCILQUNGCJoJLYQVBD0PS6qsJa7h) 配置完成后,进行测试。点击 Run Agent 选项卡: ![](https://cdn.res.knowhub.vip/c/2504/16/c6bc6453.png?G1cAAMTsdJzIJ4K026hD2jvFHc2ARRpBpYT1es9Z%2byb6fhdIis9offr%2b8JvWp5MwskFJIBmKEFgFXFEqLPCVqmWVZHENBw%3d%3d) 官方预设任务(访问 google.com,输入 “OpenAI”,点击搜索,返回第一个网址),直接点击 Run Agent 测试。 AI 首先会打开新浏览器窗口,访问 google.com,并在搜索栏输入 “OpenAI”: ![](https://cdn.res.knowhub.vip/c/2504/16/1f429a4c.png?G1cAAETn9LyUgsDMvtMdbIlTE20GLNIIKiWs13vO2jfR94dASn5G6zP2h9%2b0PoOEYRVKAjEoUmAVmJvJhcTOCvdaJK8R) 项目会对每个可互动元素进行彩色标注,自动填入 OpenAI 并点击搜索按钮: ![](https://cdn.res.knowhub.vip/c/2504/16/4d91080e.png?G1YAAMR0rnGCXo9XtxGHaoJAAs2ARBZBpYT1es9Z%2bxb5fiMY%2fDNan7Y%2f%2fKX1aUJFqohCMCHCeY1UaMoAHQOvUktRv4YB) 一系列动作完成后,AI 自动关闭浏览器窗口,回到项目 UI 查看 Results,给出本次问题答案: ![](https://cdn.res.knowhub.vip/c/2504/16/e201055d.png?G1cAAMTsdJxI8qKi26hD2jvFHc2ARRpBpYT1es9Z%2byb6fgcjxWe0Pn1%2f%2bE3r0wnC2VgJjMyKEEQhrFBLV5BixWpVK3ENBw%3d%3d) Browser use 的创新点在于将网页上的按钮和元素拆解为更易理解、类似文本的格式交给 AI,帮助其识别网页选项并自主决策。 Browser use 也用到了模型的视觉识别能力作为辅助,但视觉识别并非必须,比如本文用的 DeepSeek V3 0324 就没有视觉识别,依然能完成任务。 来看下核心代码,找到 .venv 文件夹,进入 Lib\site-packages\browser\_use 目录: ![](https://cdn.res.knowhub.vip/c/2504/16/fa4bdd5e.png?G1cAAETn9LwU6CDovtMdbIlTE20GLNIIKiWs13vO2jfR9wcYV35G6zP2h9%2b0PoMgbIWVwDBWpCAK4QKX6klQrTq0aF4jAA%3d%3d) 再进入 browser\_use 目录下 dom 目录,找到 buildDomTree.js 文件: ![](https://cdn.res.knowhub.vip/c/2504/16/6e259fb1.png?G1cAAMR0rnGCXo%2ffbcShmiCQYDNgkUZQKWG9nv%2ff5xJ5PyMY%2fD37WHY%2b%2fKaPZUJFqohCMCHCBY1UtBRqg9OimQVk9nsa) 在该 JS 文件中,核心方法 buildDomTree 位于 761 行,可搜索定位: ![](https://cdn.res.knowhub.vip/c/2504/16/7f2ffbff.png?G1YAAMR0rnGCXj%2bCbiMO1QSBBJoBiSyCSgnr9Z6z9k30%2fSEQzc9ofcb%2b8JfWZ5AwvMJIIA5D8mzCbKrl0sQwFEeVvEYA) 源代码不再贴出,简要说明:buildDomTree 采用递归方式,对网页所有元素进行深度优先遍历,确保每个节点都能被访问和处理。 Browser use 页面炫酷的标注效果,核心方法是 highlightElement: ![](https://cdn.res.knowhub.vip/c/2504/16/8e3356e4.png?G1cAAMTydJz4v%2fNouo06fJsoEpoBizSCSgnr9Z6z9i3y%2fU5lis9offr%2b8JvWpwuh%2bVITKrMaQoARKFZqQqASCazQuIYD) 源码中通过 JS 创建 div,并用 document.body.appendChild(container) 添加到网页: ```csharp // 创建或获取高亮容器 let container = document.getElementById(HIGHLIGHT_CONTAINER_ID); if (!container) { container = document.createElement("div"); container.id = HIGHLIGHT_CONTAINER_ID; container.style.position = "fixed"; container.style.pointerEvents = "none"; container.style.top = "0"; container.style.left = "0"; container.style.width = "100%"; container.style.height = "100%"; container.style.zIndex = "2147483647"; document.body.appendChild(container); } ``` ![](https://cdn.res.knowhub.vip/c/2504/16/c644a70c.png?G1cAAMTW3Dgp8EFh22gDdWfqnTYDFmkElRLW6917rpvo%2bwOMIz%2b9thHrw29qG0EQNmclMIwVKYhCIFr8QhIzQ2HHmWcP) 高亮元素创建后,接着用 CSS 根据索引生成颜色: ```csharp // 根据索引生成颜色 const colors = [ "#FF0000", "#00FF00", "#0000FF", "#FFA500", "#800080", "#008080", "#FF69B4", "#4B0082", "#FF4500", "#2E8B57", "#DC143C", "#4682B4", ]; const colorIndex = index % colors.length; const baseColor = colors[colorIndex]; const backgroundColor = baseColor + "1A"; // 不透明度为 10% 的颜色 ``` 最后将 div 渲染到网页,实现彩色标注。 # 免登录 Browser use 启动的浏览器是全新环境,没有任何登录信息,所有账号都需重新登录。 ![](https://cdn.res.knowhub.vip/c/2504/16/f104f8f4.png?G1cAAMTW3Dgp8EFh22gDdWfqnTYDFmkElRLW6917rpvo%2bwOMIz%2b9thHrw29qG0EQNmclMIwVKYhCUBgFJYmc7iqXWp49AA%3d%3d) 其实可以通过修改配置文件,让 Browser use 调用本机浏览器,从而免除登录步骤,进一步扩展功能。 具体操作如下:在 Windows 搜索栏输入 `Chrome`: ![](https://cdn.res.knowhub.vip/c/2504/16/a02d9697.png?G1YAAETn9LwUijDMvtMdbIlTE20GJLIIKiWs13vO2jfR94ewlPyM1mfsD39pfQYJ2CorCYuxInmooACAedJqzur1ymsE) 右键,选择“打开文件所在位置”: ![](https://cdn.res.knowhub.vip/c/2504/16/2f0a6741.png?G1cAAMR0rnGCXr%2bAbiMO1QSBBJoBizSCSgnr9Z6z9k30%2fSEQzc9ofcb%2b8JvWZ5AwvMJIIA5DCmzCyl6uYokhWp0ZntcI) 此时只是快捷方式: ![](https://cdn.res.knowhub.vip/c/2504/16/a51d6c27.png?G1UAAETd9Ly0bUyZ7Dvd0Q2cCtoMSGQRVEpYr%2fectW%2bR7w8oSn5G6zP2h7%2b0PkNg6lUpULgSSRthBbwqLdEKje55jQA%3d) 需继续右键,进入 Chrome 安装目录: ![](https://cdn.res.knowhub.vip/c/2504/16/8b773010.png?G1YAAMTydJz4cx7VbdTh20SR0AxIZBFUSliv95y1b5HvN4LRP6P1afvDX1qfJgxIF1QIJiicD8oQo6JmOiW1lozk1zA%3d) 找到 Chrome 可执行文件,将路径复制,回到项目 .env 配置文件,找到 CHROME\_PATH 配置项,粘贴路径: ![](https://cdn.res.knowhub.vip/c/2504/16/2c61434f.png?G1cAAER17rxgXRmCfice0wSBBJsBizSCSgnr9fz%2f2pfI%2bznBFO%2fR%2bvT94TetTxcqcoUJwQxDCGokjAczgpZaeRZlims4) Windows 11 可直接复制,Windows 10 需在路径末尾加 `chrome.exe`。 配置好 CHROME\_PATH 后,重启项目。命令行 Ctrl + C 停止项目,再输入: ```csharp python webui.py --ip 127.0.0.1 --port 7788 ``` ![](https://cdn.res.knowhub.vip/c/2504/16/367419b2.png?G1cAAMTsdJxIfBK026hD2jvFHc2ARRpBpYT1es9Z%2byb6fgdD4jNan74%2f%2fKb16YTEVlkJDGNFCEkBzmJ6lZAyVNiklriGAw%3d%3d) 重启后(模型名会恢复默认),需重新配置模型: ![](https://cdn.res.knowhub.vip/c/2504/16/5d7604b9.png?G1YAAER17rxgXd0i%2bp14TBMEEmgGJLIIKiWs17v3XLfI9wfBIz%2b9thHrw19qGyFUeIEJQYcheTUSRYufnozqF800zx4%3d) 在 browser Settings 选项卡,勾选 Use Own Browser,即使用本机 Chrome: ![](https://cdn.res.knowhub.vip/c/2504/16/4c53923a.png?G1YAAMTsdJxI8hK026hD2jvFHc2ARBZBpYT1es9Z%2byb6fgcjxWe0Pn1%2f%2bEvr0wnCVlkJDGNF8KKAarKcJGg22IVS4xoO) 重点:启动任务前需关闭 Chrome 浏览器。切换到 Edge,关闭 Chrome: ![](https://cdn.res.knowhub.vip/c/2504/16/293883c8.png?G1cAAER17rxgXbcZ9DvxQBMEEmwGLNIIKiWs1%2fP%2fa18i79cIWr5H7bPtD7%2bpfTahIgpcCAYcKaiTcQKHeVIPwkxR8hoN) 确保软件列表中没有 Chrome,完全交由 Browser 控制。接下来开始测试。 我更换了一个提示词,前往淘宝电商网站购买一根逗猫棒。只购买逗猫棒,其他商品一律不选,也不多买,仅下单逗猫棒。随后点击“Run Agent”。 ![](https://cdn.res.knowhub.vip/c/2504/16/28f32e2f.png?G1YAAMTm2vOlHASM%2bj3tQW2mbtYMSGQRVEpYr%2bf%2f176I3i8FctR7tD5zf%2fhL6zNJGBZQEohBUTybgEOZ%2fSxh7uZqUddI) 自动打开了 Chrome 浏览器,这个浏览器是我自己电脑上的 Chrome,开始解析网页: ![](https://cdn.res.knowhub.vip/c/2504/16/7df70925.png?G1cAAMTW3Dgp8Elg22gDdWfqnTUDFmkElRLW6%2fn%2ftS%2bi9wswjnyP1mfsD79pfQZBWJ0LgaFckIIoWFxhZknUqrnU0%2fMaAQ%3d%3d) 网页解析完成后,输入 www.taobao.com 并点击搜索: ![](https://cdn.res.knowhub.vip/c/2504/16/44de018c.png?G1YAAER17rxgXWHG%2bZ14TBMEEmwGJLIIKiWs1%2fP%2fa18i7xcES75H6zP2h7%2b0PkOosBNVCBoqklcj1OGFnmig%2blFLXiMA) 成功进入淘宝网站,注意查看我截图中的网站是已经登录过的,我的登录状态仍然可以继续使用,接下来就可以继续执行下一步了,首先对网页元素进行解析: ![](https://cdn.res.knowhub.vip/c/2504/16/bf7ad314.png?G1cAAMTydJz4cx7abdTh20SR0AxYpBFUSliv95y1b5HvN4LRP6P1afvDb1qfJgxIFSoEExQuhEQolFWLCzXmmHll9WsY) 页面元素解析完毕后,自动输入“逗猫棒”,整个过程无需人工干预: ![](https://cdn.res.knowhub.vip/c/2504/16/e9a977d1.png?G1cAAETn9LwUqODIvtMdbIlTE20GLNIIKiWs13vO2jfR9wcYJT%2bj9Rn7w29an0EQNmclMIwVKYiBVbSa1iQw%2bIXiktcI) 随后自动进入逗猫棒的商品详情页,并解析该页面: ![](https://cdn.res.knowhub.vip/c/2504/16/a0250ffd.png?G1YAAMTydJz4c%2f6FbqMO3yaKRJsBiSyCSgnr9fz%2fPpfI%2bznBHO%2fZx%2fLz4S99LBcmWIUKQYMi%2bGSEkqVZCbU0rQbNcU8H) 紧接着,商品被自动加入购物车: ![](https://cdn.res.knowhub.vip/c/2504/16/9eba6a69.png?G1YAAMTctHHSXM4Xt9EOacGqoM2ARBZBpYT1eu%2fdp4l8vxEM%2fpl9LDsf%2ftLHMqEiVUQhmBDhvCYiBmRWuFA1F9Vc%2fJ4G) 进入购物车页面后,自动解析网页,并选择需要购买的商品: ![](https://cdn.res.knowhub.vip/c/2504/16/efcbbdf2.png?G1cAAER17rxgXdmi%2bp14TBMEEmgGLNIIKiWs17v3XLfI9wfBkp9e24j14Te1jRAq%2fIQJQYchBXXCDIepJy0oTvrlefYA) ![](https://cdn.res.knowhub.vip/c/2504/16/62eac192.png?G1cAAER17rxgXd2U%2bJ14TBMEEmgGLNIIKiWs17v3XLfI9wfBIz%2b9thHrw29qGyFUeIEJQYchBXXCzHiWKylJpxYwzx4%3d) 确认订单信息: ![](https://cdn.res.knowhub.vip/c/2504/16/ccbbbb00.png?G1YAAETn9LwUKLCQfac72BKnJtoMSGQRVEpYr%2fectW%2bi708wtD6j9Zn7w19an0kQ9mAjMJwNxYuDNTzCohgccqlIXSMB) 由于我已设置小额免密支付,AI 自动点击付款按钮后,便直接完成了支付操作: ![](https://cdn.res.knowhub.vip/c/2504/16/83ff768b.png?G1cAAMTydJz4c4%2fSbdTh20SR0AxYpBFUSliv95y1b5HvN4Lqn9H6tP3hN61PEwakgigEEyJcCInQqnppdqFqLoisxa9h) 进入到命令行窗口,查看本次操作的结果 Successfully,任务完成: ![](https://cdn.res.knowhub.vip/c/2504/16/1cd18351.png?G1cAAMTsdJxI8hKl26hD2jvFHc2ARRpBpYT1es9Z%2byb6fgcjxWe0Pn1%2f%2bE3r0wnCVlgJDGNFCGJgNS1iNUiqWRkXENdw) 除了使用自己的浏览器,还有一种免登录的方式,就是把 cookie 导入进 Playwright,这种方式我更推荐。 因为我测试下来这种方法更稳定,效果更好。操作如下:点击浏览器右上角的扩展,点击管理扩展: ![](https://cdn.res.knowhub.vip/c/2504/16/8626dc6e.png?G1cAAETn9LyUgjDMvtMdbIlTE20GLNIIKiWs13vO2jfR94dASn5G6zP2h9%2b0PoOEYRVKAjEoUmATqJtX08QMFOeLJa8R) 找到“在 Chrome 应用商店中发现更多扩展程序和主题”,点击进入: ![](https://cdn.res.knowhub.vip/c/2504/16/414e06a9.png?G1YAAMTsdJzIi0Sj26hD2jvFHc2ARBZBpYT1es9Z%2byb6fmdwjs9offr%2b8JfWpxMnqEGIwQpB8EkZYmJmNVSFIF2lxDUc) 搜索 Cookie Editor: ![](https://cdn.res.knowhub.vip/c/2504/16/ac56d07c.png?G1cAAETn9LwUqJDhvtMdbIlTE20GLNIIKiWs13vO2jfR9wcYJT%2bj9Rn7w29an0EQNmclMIwVKYiBtZoUL0mquesFQ14jAA%3d%3d) 将 Cookie Editor 安装到浏览器中: ![](https://cdn.res.knowhub.vip/c/2504/16/7bbd7be9.png?G1YAAMTydJz4%2b%2fPf0G3UQZsoEpoBiSyCSgnr9Z6z9i3y%2fY1gis%2bofbb94S%2b1zyZUeIYJQYcheHXCQV5aghrMckolrtEA) 然后来到我们想要的网站,比如淘宝,我已经登陆过了,然后在扩展栏目中找到我们刚刚安装的 Cookie Editor,点击打开: ![](https://cdn.res.knowhub.vip/c/2504/16/8742d67e.png?G1cAAETd9Ly0aWyZ7Dvd0Q2cCtoMWKQRVEpYr%2fectW%2bR7w%2bCJT%2bj9Rn7w29anyFUeIUJQYchBXXCaaTXpHTCUS7LawQ%3d) 在 Cookie Editor 中点击 Export,导出当前网站的 Cookie 信息,导出格式选择 JSON 格式: ![](https://cdn.res.knowhub.vip/c/2504/16/4143eada.png?G1cAAER17rxgXcei%2bp14TBMEEmgGLNIIKiWs17v3XLfI9wdBy0%2bvbcT68JvaRggVfqIIQUdBCupUhRE4kjpRLjN6nj0A) 此时我在电脑桌面上新建了一个 cookie.json 文件,然后用编辑软件打开,把刚才用 Cookie Editor 导出的 JSON 信息粘贴到这个文件中: ![](https://cdn.res.knowhub.vip/c/2504/16/da047808.png?G1cAAETd9Ly0TWrB7Tvd0Q2cCtoMWKQRVEpYr%2fectW%2bR7w8qLT%2bj9Rn7w29anyGEetUiVLoWpAAnUOF0SzBjNVxe8hoB) 接下来需要修改一点代码,找到 web-ui 项目的根目录打开 webui.py 文件,找到 BrowserContextConfig 469 行,添加一句 cookies\_file=我们的 cookie.json 文件路径: ```csharp cookies_file="E:\\Desktop\\cookie.json", ``` ![](https://cdn.res.knowhub.vip/c/2504/16/8bff4640.png?G1cAAETn9LwUKBDdvtMdbIlTE20GLNIIKiWs13vO2jfR9wcYmp%2fR%2boz94TetzyAIe2UjMJwNKYhDmFFVNclVvVgRaF4jAA%3d%3d) Windows 系统下路径需要用两个反斜束,或者直接用一个正斜束。 代码修改完成后,重启项目。注意此时需将 Browser Settings 中的 Use Own Browser 选项取消掉: ![](https://cdn.res.knowhub.vip/c/2504/16/8b30fff1.png?G1YAAMTsdJxI8gm026hD2jvFHc2ARBZBpYT1es9Z%2byb6fgdD4zNan74%2f%2fKX16QThVNkIjMSG4CVBGKKSEUq5quWsJa7h) 还是让它使用 Playwright 浏览器。切换到 Run Agent 选项卡,我们再来测试一下,我让他打开淘宝,点击 Run Agent: ![](https://cdn.res.knowhub.vip/c/2504/16/f40cf1ab.png?G1cAAETd9Ly0aWqH7Dvd0Q2cCtoMWKQRVEpYr%2fectW%2bR7w%2bClp%2fR%2boz94TetzxAqvKIIQUdBCupUKhRWk1Yz%2bAVHXiMA) 发现控制台命令行报错,查看错误日志发现提示 sameSite: expected one of (Strict|Lax|None),只允许 Strict|Lax|None。为修复这个问题,我打开 cookie.json 文件,发现 sameSite 的取值有 no\_restriction: ![](https://cdn.res.knowhub.vip/c/2504/16/756892fd.png?G1cAAER17rxgXWVm%2bJ14TBMEEmwGLNIIKiWs1%2fP%2fa18i7xcEj3yP1mfsD79pfYZQYY4iBA0FKahRaWonPClcCa%2fV8hoB) 还有 unspecified: ![](https://cdn.res.knowhub.vip/c/2504/16/c2d1cc49.png?G1YAAMTsdJxI8gm026hD2jvFHc2ARBZBpYT1es9Z%2byb6fgdD4zNan74%2f%2fKX16QThVNkIjMSG4CVBYJYra9BymamgxDUc) 我将这两个值都修改为 “None”,注意是字符串 “None”,保存文件后,重新启动项目: ![](https://cdn.res.knowhub.vip/c/2504/16/d3540a09.png?G1cAAER17rxgXWUKfice0wSBBJoBizSCSgnr9e491y3y%2fU7wiE%2bvbfj68JvahgsVlpGEoCEhBDUqTwMLg5YLSmRlnN0B) 另外一种情况同理,不再截图。 重启后,继续刚才的任务,注意修改 Model Name,打开淘宝(此时报错已消失,网站成功打开且保持登录状态): ![](https://cdn.res.knowhub.vip/c/2504/16/122e5de8.png?G1cAAER17rxgaxkqfice0wSBBJoBizSCSgnr9e491y3y%2fU5lik%2bvbfj68Jvahguh%2bVITKrMaQkAmkhqIM8COUgyExtkd) 通过导入 Cookie 的方式,实现了浏览器的自动登录,大大拓展了 Browser use 的能力边界,可以完成更多复杂的自动化操作。 文章内容较多,已拆分篇幅,下一篇将继续介绍 Browser use 如何进行深度研究(Deep Research),自动生成完整的攻略报告,敬请期待。