AI 浏览器与 AI Agent:入口之争与行业变革
笔记哥 /
04-29 /
39点赞 /
0评论 /
948阅读
> 提供**AI咨询**+**AI项目陪跑**服务,有需要回复1
大模型一直有个难以解决的问题:**系统的知识是过时的,他们难以跟进最新的信息**。
基于这个原因,ChatGPT以及DeepSeek都提出了**联网功能**,只不过效果嘛绝不可能太好(**绝不会有用会从CSDN搜寻程序员要的答案**):

AI应用团队的话,一般会使用爬虫到各个**目标网站**整理信息,提前存入到知识库,以保证AI应用的先进性,只不过这在特定领域是适用的,**如果是泛问题,知识库没有信息的话,模型依旧会胡说八道。**
在这个基础上,事实上各个AI应用团队对AI浏览器是有诉求的,于是就有很多公司在做相关功能:
1. 2023年:Opera推出Aria,内置AI助手,支持网页内容摘要和实时回答;
2. 2024年:微软Edge推出Copilot,嵌入生成式AI,提升生产力;
3. 2025年:Brave推出Leo,支持网页自动摘要和多功能助手;
其实,RAG的本质和搜索引擎是很类似的,也可以将AI浏览器理解为一个MCP应用,提供给AI产品调用即可。
>
>
> PS:抛开浏览器提供接口给我使用这个点,我其实已经想不到太多浏览器的生存空间了,
>
>
> 我只有在不想看AI回答的情况下,才会去用搜索,而且一定不是浏览器搜索...
>
以上是AI浏览器诞生的一些背景,以及我的一些认识,接下来我们来具体的了解其中一些表现不俗的AI浏览器。
## 从Arc到Dia
The Browser Company 成立于2019年,融资1个多亿,估值5.5亿美金。
其核心产品是Arc,一款被极客喜爱的浏览器,被认为远超Chrome的用户体验。
而在24年完成5000万美金融资后,其毅然决然的放弃了Arc的研发投入,开始转向为**全新的AI浏览器研发**。
同年,Dia浏览器发布,这也是现在被认为非常优秀的**AI浏览器**:

**AI不会以一个应用或者一个按钮的形式存在,它将是一个全新的环境——建立在网页浏览器之上的。**
这句话透露出一种坚定的信念:AI将不再是我们如今所见的简单工具,而是将彻底重塑我们与技术互动的方式,成为一个无处不在、深度融合的全新生态。
在使用之前,浏览器会搜集很多个人倾向性信息:

我猜测,他会根据用户的喜好,返回最合适的信息。
>
>
> **只不过使用下来,不知道是不是错觉,感觉跟Manus想要达到的体验很类似...**
>
这其实都还是在走OpenAI的L3路径:
**L1级别(聊天机器人)。**AI系统能够进行基本的对话和交流,显示出对自然语言的基本理解能力,并能对各种提示和问题作出响应。
**L2:推理者(Reasoners)。**AI系统能够以人类专家的熟练程度解决复杂问题,标志着其从单纯模仿人类行为升级到展现真实的智能水平。这些AI不仅擅长对话,更具备了解决问题的能力,其推理和决策能力已接近人类水平。
**L3:智能体(Agents)。**AI系统能够承担复杂的任务、作出决策和适应不断变化的环境,并在无须持续人类监督的情况下自主行动。这一阶段的AI不仅具备推理能力,更能自主执行各类复杂的操作任务。
**与其说他是浏览器,不如说他是智能体...**
## AI需要浏览器
事实上,AI需要的不是浏览器,AI需要的是**最新的知识库**,并且真人使用的浏览器与AI想要的浏览器非常不一样。
比如Manus团队之前就想打造一款适应于AI的浏览器,以便AI产品的体验更好,最终他们也确实这么做了,这里以我的理解来说的话,与其说做了一个AI浏览器,倒不如说做了一个适应于AI使用的知识库。
**综上,事实上我们是不需要AI浏览器的,我们只需要AI Agent,是AI Agent需要一个适应于他的浏览器(更确切的说是知识库),比如browser-use、Nova Act SDK。**
只不过,**浏览器是极其重要的关键词**,因为他是一个非常好的入口,入口代表着流量,流量意味着争夺,所以**很多公司都在开始布局AI浏览器,其本质其实在争夺下一个Agent入口**...
事实上,从The Browser Company宣布放弃旗舰产品Arc、转投Dia研发时就是一个非常重要的信号:**浏览器已不再是单纯的网页容器,而正在经历从"工具"到"智能体"的跃迁。**
当AI出现那一刻,就宣布了传统浏览器的死亡,因为三大核心交互正在变化:
1. **信息获取方式:**从"用户主动搜索"转向"Agent预判需求";
2. **交互界面:**从"URL+网页"转向"多模态对话空间";
3. **底层架构:**从"页面渲染引擎"转向"实时数据处理器";
微软Edge Copilot的代码自动补全功能已展示这种转变:当开发者输入注释时,AI直接调用GitHub最新代码库生成解决方案,整个过程无需打开任何技术文档网站...
## 入口之争
随着AI Agent的崛起,科技巨头纷纷布局,争夺下一代用户“入口”。现在有两类玩家:
### 传统玩家
对于已有入口占领者,会发挥好本来优势:
1. 微软:将Copilot深度植入Windows内核,实现系统级Agent调用;
2. 谷歌:通过Gemini重构Chrome,搜索结果直接呈现动态生成的3D模型演示;
3. 苹果:Siri升级为Proactive Agent,可跨设备预测用户行为轨迹;
### 新秀玩家
与此同时,各种新兴势力也在冲击这一领域:
1. Dia浏览器:通过实时屏幕语义分析,在用户点击前预加载所需信息;
2. Manus智能体:首创"认知沙盒"技术,可并行运行多个Agent处理复杂任务;
3. Nova Act SDK:提供跨平台Agent运行时,打破浏览器与本地应用的界限;
这些公司通过不断扩展AI Agent的能力,推动用户体验的提升,争夺用户的核心“入口”,**这个行为不再局限于操作界面,而是进入了工作流、决策支持和深度集成的层面。**
具体到行业应用,AI Agent在各领域中的应用正以惊人的速度改变传统的用户体验。
例如,在医疗行业,AI Agent能够分析患者的病史、症状,并根据最新的医学研究提出精准的治疗建议。
在教育领域,AI Agent通过个性化学习路径帮助学生提高成绩,在金融行业,AI Agent可以帮助金融顾问根据实时数据做出投资决策。
在这些应用中,AI Agent的存在不再是“工具”,而是用户的“合伙人”。用户不再只是被动接受信息,而是通过AI Agent主动获取、分析和执行任务,这使得用户体验变得更加智能化、动态化。
本文来自投稿,不代表本站立场,如若转载,请注明出处:http//www.knowhub.vip/share/2/3002
- 热门的技术博文分享
- 1 . ESP实现Web服务器
- 2 . 从零到一:打造高效的金仓社区 API 集成到 MCP 服务方案
- 3 . 使用C#构建一个同时问多个LLM并总结的小工具
- 4 . .NET 原生驾驭 AI 新基建实战系列Milvus ── 大规模 AI 应用的向量数据库首选
- 5 . 在Avalonia/C#中使用依赖注入过程记录
- 6 . [设计模式/Java] 设计模式之工厂方法模式
- 7 . 5. RabbitMQ 消息队列中 Exchanges(交换机) 的详细说明
- 8 . SQL 中的各种连接 JOIN 的区别总结!
- 9 . JavaScript 中防抖和节流的多种实现方式及应用场景
- 10 . SaltStack 远程命令执行中文乱码问题
- 11 . 推荐10个 DeepSeek 神级提示词,建议搜藏起来使用
- 12 . C#基础:枚举、数组、类型、函数等解析
- 13 . VMware平台的Ubuntu部署完全分布式Hadoop环境
- 14 . C# 多项目打包时如何将项目引用转为包依赖
- 15 . Chrome 135 版本开发者工具(DevTools)更新内容
- 16 . 从零创建npm依赖,只需执行一条命令
- 17 . 关于 Newtonsoft.Json 和 System.Text.Json 混用导致的的序列化不识别的问题
- 18 . 大模型微调实战之训练数据集准备的艺术与科学
- 19 . Windows快速安装MongoDB之Mongo实战
- 20 . 探索 C# 14 新功能:实用特性为编程带来便利