大模型演进至今,寻求杀手级应用成为业界共同面临的核心命题。2024年上半年,大模型价格战“打”的轰轰烈烈。而到了下半年,几乎人人都在谈“AI Agent”(人工智能代理,也可称为“智能体”)。在海外市场,微软、苹果、谷歌、OpenAI、Anthropic等科技巨头纷纷公布相关进展;在国内市场,百度、阿里、腾讯、智谱、荣耀、联想等一众厂商的智能体平台也纷至杳来,一场围绕“AI Agent”的争夺战正悄然开启。
图为联想百应智能体发布现场
AI Agent成为“新风口” 继LLM(大语言模型)之后,AI Agent俨然成为了AI产业发展的新风口。OpenAI CEO Sam Altman认为“Agent 将成为下一个重大突破”。中国工程院院士邬贺铨指出,AI Agent是大模型落地载体的关键作用。百度创始人、董事长兼首席执行官李彦宏更是直言:“Agent是我们最看好的AI应用发展方向。”此外,比尔盖茨、吴恩达、李飞飞等多位AI领域的知名专家均公开表示AI Agent是重要发展方向。
被这些科技大佬们共同看好的“AI Agent”究竟是什么?OpenAI将“AI Agent”定义为以LLM为大脑驱动,具有自主理解、感知、规划、记忆和使用工具的能力,能自动化执行复杂任务的系统。不同于传统人工智能,AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。
举个简单的例子,如果用户想要进行一次家庭聚餐,LLM可以为其提供就餐地点和店铺相关信息提示,而AI Agent不仅能够提供择店铺建议,还能基于用户预算搜索菜系和店铺,执行预订操作,并将行程添加到日历,还可以发送行程提醒。
有观点认为,AI Agent的出现是为了解决LLM在具体应用场景中的局限性。LLM虽然具备了一定的智能,能够生成文本、图片和视频等内容,但其功能相对有限,无法独立完成复杂的任务。AI Agent作为大模型的上层应用,能够通过感知环境、进行决策和执行动作,帮助大模型实现更多的功能,从而更好地为各行各业赋能。
换句话说,LLM就像一个“超级大脑”,知识丰富、能力强大,但它“只懂回答,不懂行动”。而AI Agent(智能体)不仅有聪明的“大脑”,能回答问题,还有灵活的“手脚”,能像人一样主动完成一系列关联性的任务,必要的时候还会使用“工具”。
“AI Agent是通往AGI(通用人工智能)的重要一步。”智谱AI CEO张鹏表示。他认为,AI Agent代表的是一种未来真正的人机交互方式,即让机器来适应人,它能够让大模型从“Chat(对话)”走向真正的“Act(操作)”。
谁将主导AGI入口之战? 市场研究机构Gartner将Agentic AI列为2025年十大技术趋势之一,并预测到2028年,至少有15%的日常工作决策将由Agentic AI(人工智能代理,同“AI Agent”)自主完成。Salesforce AI Research 执行副总裁兼首席科学家Silvio Savarese指出,Agentic AI阶段“正转向使用人工智能来自动化整个任务并代表我们采取行动”,与以前的人工智能相比是一场重大的能力飞跃。
尽管现阶段技术还比较初期,但AI Agent的未来应用已经展现出了强大的前景。理论上讲,随着AI Agent的能力继续提升,它们将能调用越来越多的应用,适配越来越多的操作系统,实现越来越复杂的连贯自主操作。业内专家预判,作为链接用户和服务的“桥梁”,AI Agent将持续进化,成为通往AGI(通用人工智能)的重要入口。
也正因如此,无论是大模型创业公司、互联网大厂、软件应用商,还是传统硬件厂商都在试图抓住这个机会,吃到新的入口红利。近日,微软宣布建立全球规模最大的企业级AI Agent生态系统——Copilot Studio平台,现已有超过十万家企业使用该平台创建或编辑AI Agent。微软智能体负责人Charles Lamanna透露:“这个增长速度远超我们的预期,也远超我们发布的其他任何前沿技术的表现”。谷歌紧随其后推出了商用AI Agent市场,提供从AI Agent的开发、部署到应用一站式商用生态。OpenAI也计划在明年1月发布名为“Operator”的AI Agent工具,能够在用户的指示下在计算机上自主完成任务,例如编写代码、预定行程。
国内厂商也在积极争夺“话语权”。百度文心智能体平台、腾讯元器、讯飞星火智能体创作中心、通义智能体、字节“扣子”等面向B端企业用户提供了智能体创建平台。支付宝旗下AI App支小宝、智谱的智能体AutoGLM以及荣耀的智能体YOYO通过自主点咖啡、发红包等操作点燃了C端用户激情。还有一些硬件厂商也通过智能体初体验尝到了“甜头”,比如比亚迪的官方智能体上线后,销售线索转化率提升了119%。联想AIPC智能体在今年9月份的互动率提升了89%,销售线索转化率提升了80%。
目前,关于智能体的探索仍处于初期阶段,要想打造出一款真正成熟的超级智能体,并实现大规模商业化应用还需要时间。不过,这对于所有参与竞争的厂商而言,也是机会所在。
将给产业带来哪些影响? “我们现在已经达到了大模型的上限,AI的未来在于自主工作的智能体。”Salesforce首席执行官Marc Benioff表示,过去几年,“我们都沉迷于ChatGPT的魔力”,导致普通消费者认为大模型是推动技术进步的关键。实际上,对于那些希望提高效率并改变工作模式的公司来说,AI智能体的实际应用将比大模型更重要。
德勤AI研究院发布的最新报告指出,AI智能体正在重塑工作的未来。未来AI智能体将改变基础业务模式和整个行业,实现新的工作、运营和价值交付方式。“AI智能体市场前景非常广阔,智能体衔接模型层与应用层,是现阶段AI大模型应用落地的重要补充,可以应用在多类场景。”中国电子商务专家服务中心副主任、资深人工智能专家郭涛表示。
这些应用场景包括但不仅限于以下几类:一是生活类场景,例如陪伴助教、个人法律顾问、医疗顾问等;二是办公类场景,例如AI办公、数据分析等;三是端侧应用场景,包括AI手机或电脑、自动驾驶、人形机器人等。
以智能手机为例,过去行业内“卷”的中心是各种参数配置和芯片影像的能力,现在则由AI Agent“接棒”了。从最新发布的产品来看,华为Pura70系列将智能助手升级为“小艺智能体”,小米15系列将“小爱同学”升级为全生态AI智能助手“超级小爱”,荣耀Magic 7将YOYO助理升级为YOYO智能体。
在传统智能手机端,用户获取服务往往依赖各种独立应用,而AIAgent的加持则将这些服务入口整合在了一起,赋予了智能手机完成更复杂任务的可能性,也意味着手机厂商能借此获取更多增值服务的机会。像荣耀Magic 7新上线的YOYO智能体便具备模糊理解、界面识别、自动执行、一语到位等能力,可以支持单指令系统级任务执行、第三方应用任务执行甚至多应用协调执行等多种模式。荣耀CEO赵明在发布会现场用Magic7自动下单2000杯瑞幸咖啡送给参会人员,实现了“AI一句话的事儿”,一度引发行业热议。
“未来的AI智能体可能比人类还多,人类将生活在一个有数亿、甚至数十亿AI智能体的世界中。”Meta CEO扎克伯格判断称。市场研究机构Research and Market最新发布的报告显示,AI智能体的市场规模将从2024年的51亿美元增长到2030年的471亿美元,年均复合增长率为44.8%。可以看到,AI Agent的爆火带来了大片市场蓝海,但同时也带来了更多新的挑战。这一次,究竟谁能在人机交互新时代拔得头筹,让我们拭目以待。