文 | 光锥智能,作者 | 魏琳华,编辑 | 王一粟
当Manus创始人肖弘直言“产品没有秘密”时,大厂们正陷入技术复刻与流量争夺的双重焦虑。据光锥智能了解,目前多家大厂均在内部开设对标Manus的产品团队。据悉,以擅长内部赛马的字节,内部至少有5个不同团队正在开发智能体产品。
在Manus发布的一个月后,大厂们先后交出了智能体的答卷:字节跳动“扣子空间”以裂变式邀请码席卷职场、阿里“心流”用超长耗时任务塑造研究深度、百度“心响”则带着医疗法律垂类场景突袭移动端。
但在这场看似繁荣的通用Agent发布潮背后,却暗藏着一个尴尬现实—— 所有产品仍未突破已有Agent的能力边界。
从去年开设Agent平台的无人问津,到今年交出60分答卷。可以确定的是,Agent已经通过规划和工具能力跨越了通用Agent的1.0阶段,进入自主Agent的2.0阶段。
当下,扎堆发布的Agent已经能够初步担任起“实习生”的任务,解决那些在人类日常生活中耗时且难度低的任务:比如,根据用户的需求完成一部分资料的收集,并通过大量的信息分析并给出一些可供用户筛选的观点。再比如帮助用户完成基础操作,筛选岗位发简历、给目标发邮件等等。
这场围绕Agent展开的流量入口争夺战,只是2025Agent爆发之年的一个注脚。除了大模型公司和应用公司,更多玩家正在参与其中:
就在今天,联想也发布了面向个人用户的“天禧”智能体和面向企业的“乐享”智能体。其中,个人智能体“天禧”将自主操作和记忆交互作为卖点,并在旗下4款产品中搭载。除了自主完成点单、攻略等操作,它还能根据用户的偏好和习惯,给出匹配的预算和喜好推荐。
在大厂倾尽资源的进攻下,智能体之战现在走到了什么阶段?
批量复刻Manus,谁能抢占流量入口?
4月,通用Agent成为了大厂们发布会和产品更新的关键角色。
先是字节在4月18日发布了通用Agent产品“扣子空间”,上线免费测试,以每人5个邀请码的裂变方式,先行抢占市场;4月22日,阿里旗下AI助手“心流”上线高级研究功能,主打类似OpenAI的智能体DeepResearch式的报告研究;再到百度4月25日正式在开发者大会上官宣智能体“心响”,侧重医疗、法律、绘本等多个适配生活场景的任务体验。
在前有DeepSeek的冲击过后,如何借助成熟产品引流,也成为了智能体接下来上线需要考虑的问题。
目前,大厂多处于内部团体自研的模式,比如字节和百度。但阿里早在Manus点燃市场热情的时候,就已经洽谈了和Manus的合作。目前,阿里除了有自研产品心流的发布以外,其旗下大模型团队通义千问也早在3月就敲定成为Manus中文版的专属模型支持方,先在模型合作上分到一杯羹。
但对于百度、字节和阿里这三家强调AI自研,并且从大模型研发到应用产品均亲力亲为的大厂来说,借自己的力量开发智能体也是非常必要。
扎堆发布的Agent们,各自的产品思路并不相同。
字节的“扣子空间”定位为“精通各项技能的实习生”,给出的各种案例更像是工作上的助手,比如生成行业报告、用户调研分析等。
光锥智能测试后,感觉扣子空间是一个更加面面俱到的及格产品,它不仅接入了高德等MCP,借助工具提升使用能力,在报告输出上也做到了图文并茂,多模态能力突出。但在输出报告的内容深度上,还有进一步优化的空间。
对比来看,阿里旗下的AI助手“心流”上线的高级研究功能,更加接近于深度研究的应用场景。在多次测试过程中,心流显著的特点就是消耗的Token资源更多,耗时长。比如,在“智能体研究”任务上,心流的处理时长超过1个小时,浏览网页的数量也显著超过其他两个产品。
大量资源和牺牲效率的方式,换来了更具深度的生成内容,而这也是心流只能通过审核制申请测试的原因,大规模的开放,对算力消耗和成本来说,都是当前难以平衡的问题。但在对象选取准度上,心流的表现一般,比如在智能体报告中,它选择的产品多为大模型AI助手类,且把Manus融资7500万的信息误放在了扣子空间的分析中。
相比于字节和阿里的通用Agent选择在PC端上线,百度的心响则把首发选在了手机App端,后续才会上线PC端。
不同的智能硬件端,决定了两者面对的受众差异:电脑端面对的多为有工作、学习需求的用户,集中在报告研究、内容分析的领域;而手机端用户则更希望体验AI在实际生活场景中落地的各项功能。
结合百度在医疗、法律等行业的优势,再加上百度过往在AI虚拟社交等方向的探索成果,心响最终的上线形式就变成了主推垂类场景的模样。
目前,心响App的主界面推荐了包括AI相亲、旅游规划、医疗/法律咨询等场景的体验推荐。实际测试下来,心响在医疗、法律等问题上的准确度较高。比如在回答酒驾撞人逃逸问题时,心响调用了多个Agent,最终给出量刑7年的结果,这也和现实中律师意见一致。
但在脱离垂类知识积累的其他业务上,心响的准确度还需要继续优化。比如在要求出一份旅游地点建议的任务执行中,心响明明已经判断出地点不属于朝阳区范围,但依然推荐了不满足用户设定条件的景点。
综合三个通用Agent的测评结果,大厂梯队的AI智能体,目前多数只能用来完成一些基础水平的工作,能力上还没有达到类似Manus般惊艳的效果。
但短期内,大厂们交出的答卷,已经让市场用户开始逐渐对智能体的概念感到兴奋和好奇。
无论是字节还是360的Agent,近期都在大批量开放测试的过程中出现过服务器崩溃的情况,可以说,即使是拥有充足算力的大厂,其消耗程度也远远超出了发布的预期。
而智能体这条赛道,参与的选手不只有互联网大厂和创业公司,凭借硬件优势,有智能手机和电脑的公司也盯上了智能体的前景。
今天,联想就在发布会上发布了面向个人的智能体“天禧”和“乐享”企业超级智能体,针对个人来说,其智能体已经能够完成提供旅游建议、制定行程和下单等各种自主操作。
面对“智能体”这块肥肉,各家虎视眈眈。
Manus还没被超越,但技术红利还能吃多久?
被称作“Agent之年”的2025,大厂和创业公司,都在自己的能力范围内交出答卷。
但三家大厂目前上线的产品,折射出一个残酷现实:大厂们即便坐拥生态与算力,复刻Manus并不是一个能够在短期内完成的事情。
在Manus发布之初,其创始人肖弘就已经给出了自己的观点:Manus没有秘密。
“从产品经理的角度出发,要用就要用最好的大模型,用最好的东西能产生多大的商业价值,产品经理关心的是这个。”肖弘说。
Manus的核心能力建立在模型能力溢出上,但在最早建立市场认知的时刻,Manus在模型能力调用和产品思路两个方面做到了极致:
首先,Agent需要同时处理多模态理解、复杂推理、代码生成等多样化任务,这对底层模型的综合调用能力提出了极高要求。现在市面上能够看到的多数通用Agent,都是采用不只一个大模型,而是多个模型按照不同需求调用,比如需要理解图片内容,就调用多模态能力更强的大模型。
以字节为例,据晚点LatePost报道,扣子团队开发扣子空间时,他们曾考虑优先使用 DeepSeek-R1,测试后发现其调用工具的能力不足。最后,基于能力表现和成本原因考虑。使用了豆包 1.5 Pro 为主的多款模型。
而在拥有更好的模型能力基础上,如何将技术转化为用户体验也是一个挑战。
不过,在各家公司交出的Agent上,均已经有不同的思路展现。比如,在搜索体验上,百度的Agent产品采用“多组关键词+搜索引擎”策略,用多组关键词尝试搜索,而智谱则让自家AutoGLM沉思在小红书、知乎等不同平台搜索,打破了不用应用数据固化的边界。
在短期时间内,当前的技术格局呈现出一个有趣现象:以Manus、GensPark为代表的创业公司,仍在关键指标上保持领先优势。比如,GensPark在GAIA基准测试中的表现已超过Manus。
相比之下,大厂现阶段推出的Agent产品更多是“60分解决方案”,但和Manus的目标相同,大厂们需要在通用Agent相对空白的阶段,率先抢夺一部分市场。
技术路线的差异直接影响了商业化策略的选择,两类玩家正走向截然不同的道路:
目前主流大厂仍以免费策略为主导目标,试图撬走一部分用户,字节、阿里和百度的产品都采取了免费供应的方式。
而成本压力迫使创业公司更早启动商业化。目前,GensPark已积累1万付费用户,其ARR(年度经常性收入)达到2200万美元。而Manus更是在海外市场开出单月39美元的基础版和单月199美元的高级版两种收费模式,定价比肩OpenAI的会员。
不过,从基础大模型到应用产品来看,目前技术优势的窗口期正在缩短,留给创业公司们的时间不多。
现在的大厂们用不到一个月的时间,交出了60分的答卷,当新的通用Agent提升到70分、80分,加上免费策略,势必会对创业公司们造成进一步的冲击。
这场竞赛的终局还处于起始阶段,而在通用Agent能力再跃升之前的一切交锋,只是2025Agent爆发之年的序章。