随着人工智能技术进入规模化应用新阶段,智能体(AI Agent)作为具备自主感知、决策与执行能力的核心载体,正通过终端设备创新与技术架构升级加速落地。近日,豆包手机(豆包手机助手技术预览版)的推出,推动具备自主操作能力的AI Agent从技术原型走向先导应用;智谱AI开源AutoGLM1,为开发者低成本复现个性化AI手机助手提供底层技术支撑,进一步激活产业创新生态。然而,行业发展仍面临基础模型自主决策精度不足、企业定制化开发成本高企、跨场景数据安全与隐私保护风险凸显等多重现实挑战。上期介绍了智能体的基本情况、技术架构以及行业发展现状,本期将聚焦智能体未来演进趋势,深度剖析核心瓶颈问题,提出针对性对策建议,为抢占智能体产业发展制高点、推动产业高质量发展提供决策参考。
一、智能体发展趋势
(一)大模型驱动智能体闭环能力构建与架构演进,迈向群体智能与具身执行
大模型作为智能体的核心思考引擎,其性能优劣直接决定了智能体在复杂任务中的表现水平,预计两方面能力突破将为智能体能力跃迁提供重要支撑。一是关键能力闭环构建,通过任务分解规划、工具调用及强化学习自主决策,提升“从头到尾”办理复杂事项的能力。二是技术架构向多智能体系统演进,通过角色分工协作实现“单体智能”到“群体智能”升级,从“单打独斗”变成“团队协作”;同时,端到端大模型与世界模型融合推动具身智能突破,使智能体具备物理世界任务执行能力,如操控设备、处理实物等。
(二)通信协议引领工具调用标准化,重塑决策执行链路
智能体要完成复杂任务,离不开调用各种软件、服务(即“工具”),而“标准化通信协议”就像智能体和工具之间的“通用语言”,让它们能高效配合。其中,Anthropic推出的MCP2因兼容性强、灵活性高形成先发优势,成为沿用度最高的协议,受到OpenAI、阿里云等相继支持以及Cursor、Winsurf等平台的接连接入。此外,谷歌推出的A2A协议3助力多智能体通信协作,一定程度上与MCP形成“互补”。
(三)行业专用智能体进化为“专业伙伴”,深度嵌入场景业务
智能体正加速摆脱通用化工具属性,以垂直领域需求为锚点深度嵌入行业场景,从功能辅助者进化为懂业务、能协同、善解决复杂问题的“专业伙伴”。如,智谱AutoGLM 2.0可跨接40余个高频APP,47秒完成餐饮预订,效率为人工的5倍;金融行业则依托智能体实现合同审查、投资分析等专业任务的自动化升级,某头部券商应用后将投研报告生成时间从3天压缩至4小时。
(四)大厂基于底座模型优势引领智能体生态,小厂依靠产品创新加速抢占“先发红利”
国外大型科技公司如Open AI、Anthropic和谷歌正通过构建开放平台抢占市场先机。国内阿里云等也提出Agent Store相关概念,打造类似APP应用商城的“智能体商城”,提供更高效的AI基础设施、降低开发门槛,加速智能体在各个领域的落地。相比之下,行业应用型中小型企业等则聚焦于专用智能体的开发,依托产品创新和场景优化,加速抢占细分市场的“先发红利”。如迪安诊断“微生物检验智能体”针对微生物检验领域实现了自主理解任务意图、调用多源数据等功能。
二、现存问题
(一)基础能力短板掣肘智能体应用突破
当前业界大模型幻觉率较高,领域知识储备有待提升,多模态融合能力不足,长期记忆机制存在缺陷,致使能力建于其上的智能体难以处理长期规划、多步骤推理的复杂任务,还需依赖预设提示词与固定工具路径(如Manus)。此外,在新知识掌握、内核编程及任务持续执行能力、开放性专业场景的泛化能力上处于薄弱地位。
(二)数据隐私安全与标准化问题凸显
智能体执行任务时频繁调用外部数据,存在采集隐私、数据泄露风险,且尚未形成成熟有效的信息安全保护机制。同时,国内智能体开发工具依赖国外且标准化滞后,数据格式与传输协议等技术标准体系缺失导致互通性不足。开发环境不成熟拖慢技术更新,主流APP为了保住自己的流量和地位,不愿开放API接口,限制了智能体的功能拓展(如豆包手机助手就面临超级App的“高墙”)。
(三)商业化落地闭环仍待探索
一方面,国内用户对智能体的付费意愿普遍较低,企业只能靠免费策略培育市场;B端用户主要依赖API调用付费,但相关协议不完善,无法形成“技术-应用-数据”的良性闭环,行业盈利难。另一方面,不同于关注通用能力的大语言模型,智能体则需要与场景深度适配,定制化需求强,导致开发成本居高不下。此外,很多智能体只是单点应用(比如只负责预订或查询),没能覆盖全业务流程,难以体现核心价值,进一步降低了客户付费动力。
(四)评估体系与测试机制滞后
当前智能体行业缺乏统一、科学的评估标准,形成了“效能黑箱”,即企业不知道该怎么选合适的智能体,使用之后也无法量化实际价值,后续优化方向也难提出,陷入“选型难、验收难、迭代难”的困境。同时,部分测试机制存在漏洞,其中“无行动得分”现象尤为突出(智能体仅执行与指令任务无关的行动,也能在测试中得分),一定程度上影响了智能体能力评测的公平性。
三、下一步工作建议
一是加大核心技术攻关,突破智能体发展瓶颈。夯实基础模型的支撑能力,突破感知算法、推理引擎等关键技术,为智能体开发提供精准感知、快速决策的轻量支撑。鼓励以场景智能化为导向开展联合攻关,支持企业与科研机构围绕高契合度场景开展以智能体为产出目标的联合攻关,并设置技术与业务考核指标。支持多模态、多智能体系统研发,探索构建涵盖视觉认知等能力的组件库,推动知识蒸馏与经验迁移,实现跨领域智能融合。
二是构建行业共性平台,降低开发适配成本。推广低代码开发平台,内置多领域通用模板,通过可视化拖拽组件实现快速配置。针对零售、制造、政务等垂直领域,推出轻量化行业解决方案,精准匹配中小微企业需求,简化定制环节,仅保留核心功能模块,降低企业决策风险与初始投入门槛。
三是统一定义与标准,推动行业规范化发展。推动建立智能体定义及技术架构指引,联合高校院所与领军企业从系统架构、最小功能集等方面提供技术指导和操作依据。主动布局抢占智能体协议话语权,鼓励头部企业联合智库、高校院所等成立智能体通信联盟,加强协议及配套安全规范的制定。推动智能体评测和认证体系建设,构建涵盖技术性能、场景适配的多维度评测体系,配套多模态评测数据集,打造全周期可信智能体生态。
四是培育产业生态,推动产业可持续发展。构建“价值量化+生态联动”付费体系,通过效果可视化、按效果付费模式,联动大平台与SaaS厂商,搭配政府补贴及标准化协议,探索多样付费路径。对接政企转型需求,以需求为牵引,依靠标杆案例、用户教育、开放试点等手段,加速市场渗透、培育付费习惯。
注释及参考文献
注释: 1 2024年10月,AutoGLM 发布了全球首个能自动操作手机的 Agent,被视为第一个具备Phone Use 能力的AI Agent 2 Model-Component Protocol,Anthropic推出的模型上下文协议 3 Agent-to-Agent Protocol
参考文献:
[1] 《智能体技术和应用研究报告》,中国信通院人工智能研究所、华为技术有限公司,2025
[2] 《AI Agent Bible: The ultimate guide to agent disruption》,CB Insights,2025
[3] 《国家人工智能产业综合标准化体系建设指南(征求意见稿)》,工信部,2024
[4] 《成果|大模型驱动的自主智能体与群体智能》,AIGC最前线,2024
[5] 《AI Agent发展现状、行业结构与趋势分析》,天翼智库,2024
[6] 作者介绍
彭照康
中级经济师、咨询工程师(投资)
长期专注研究人工智能领域,深度参与北京市人工智能产业研究和政策规划,参与完成《新一代信息技术领域发展态势跟踪》《智能算力中心组网成本研究》《人工智能对固定资产投资的影响》等多项咨询工作。
李俊莹
咨询师
长期专注研究人工智能领域,深度参与北京市人工智能产业研究和政策规划,参与完成《智算产业链发展研究》《大模型发展情况与形势研究》《关税政策对人工智能企业的影响》等多项咨询工作。
编辑:张 华
审核:兰国威