近日,中国信息化百人会执委安筱鹏接受了《中国电子报》记者的独家专访。他指出,中国大模型市场存在“加拉帕戈斯隐忧”,应明确区分基础模型与垂直模型,构建统一的大市场,优化资源匹配,加速产业生态培育。
“通用”是AI大模型的本质特征 “当前社会上对于AI大模型仍存在很多认知误区。AI大模型与之前的传统AI应用是两个不同的物种。”安筱鹏表示。
7年前,安筱鹏曾拜访全球最大的农业机械制造商、世界五百强企业--约翰迪尔,该公司把AI应用到了农业工程机械中。他们有一款喷洒除草机设备,哪些是草,哪些是庄稼,通过当年的AI技术就能精准识别。
“在美国,这种AI应用早已非常成熟,技术水平也是遥遥领先。但这种技术是弱人工智能(Artificial Narrow Intelligence)。”安筱鹏说道,“今天我们再谈的不应该是这种传统的弱人工智能应用,而应该是从AI基础大模型上生长出来的,能够自感知、自学习、自适配的强人工智能应用。”
比如电力行业,无人机在山区电力设备上采集信息后,传统垂直小模型给出的判断是“销子不规范”,而大模型能够基于多模态发展出图像认知能力,给出的结论是“高速公路附近上空,红色涂装的绝缘子左侧连接杆塔金件上,有10个螺栓,其中3个存在销子不规范,包括1个脱销、1个未插紧、1个损毁,已生成异常说明,建议尽快现场确认发起检修”。传统AI应用和AI大模型所带来的价值差异显而易见。
AI大模型的重要特征能实现跨模态、跨场景、跨行业,既能对话做诗,也能做事写代码。“未来,随着AI基础大模型的能力越来越强,它在成本、质量、效率等方面都可以碾压传统AI应用。”安筱鹏强调。
“把握人工智能等新科技革命浪潮”“通用人工智能”“产业智能化”,日前,中央提出新一轮产业革命的重要特征“通用人工智能”。
安筱鹏表示,我们今天讨论的碳基生命和硅基生命,讨论是“通用人工智能”的特征。例如,2024年2月19日Geoffrey Hinton(辛顿)在牛津大学提出“数字智能会取代生物智能吗?”很明显,在未来20年内,有50%的概率,数字计算会比我们更聪明。
中国没有“百模大战”,也没有“十模大战” 据不完全统计,国内大模型总数已经达到300个。其中,仅北京发布的大模型数量就达到了160个。然而,安筱鹏坦言:“‘百模大战’其实并不存在。”
他进一步解释说道:“打个比方,有100个人参加田径比赛,有的比跳高,有的比百米,有的比标枪。这100个人都在竞赛,但不是一个性质和维度的比赛。国内所谓的‘百模大战’亦是如此,首先要明确AI大模型究竟应该如何定义。”
如果讲人工智能(AI),有多年前就存在的弱人工智能( Artificial Narrow Intelligence),也有可能走向强人工智能(Artificial General Intelligence)的AI大模型。目前AI大模型包括基础模型(foundation model);以及基于基础模型做了一些针对性调试(fine-tuning)的模型,这种大模型在某一个领域、场景表现得更好。前者可以叫通用模型,后者可以称作是应用模型(垂直模型)。
OpenAI的 GPT-3、GPT-4等是AI基础大模型,基于之上开发了许多行业应用模型。AI基础模型训练需要数月、万卡千卡,而基于基础模型之上的行业模型只需要十卡百卡、数天数周。比较应该在同类型的技术或产品间展开,而不是“关公战秦琼”。中国所谓的“百模大战”并不代表真的有100家企业都在同一个赛道上竞争,这里面有真正的AI基础大模型,也有在基础模型上进行微调的垂直行业模型,有基于开源模型套壳的,也有套壳微调的行业应用模型,还有传统AI包装出来的伪大模型应用。
安筱鹏坦言:“从AI基础大模型领域来看,能够跟上国际大模型创新步伐的国内选手不超过10个。”
AI基础大模型是1,垂直行业大模型是其后的0 AI基础大模型是本轮全球科技竞争的制高点,是大国的游戏、巨人的战场、进化的力量,具有高技术门槛、高资本门槛、高人才门槛、高生态门槛的特征。
安筱鹏表示,AI基础大模型的能力是决定性的,是所有数字前面的“1”,而行业垂直应用的AI大模型是后面的“0”。垂直行业模型的能力取决于AI基础大模型的能力。没有AI基础(通用)大模型支撑的行业垂直应用AI模型,要么浑水摸鱼,要么混淆视听。
AI基础大模型决定了产业智能天花板、AI产业化步伐(算法、数据、业务、编程复合型人才)、商业价值与闭环、应用生态的繁荣与AI产业的竞争格局,并将最终决定新一轮数字科技领域的国家、企业的核心竞争力。
安筱鹏指出,只有AI大模型的训练和开发,才需要具备1万卡乃至10万卡高质量算力调度优化能力,需要百亿美元投入,需要TOP100科学家,也需要商业化的闭环。AI产业化的根本出路在于技术与商业的闭环,能否形成繁荣的AI产业生态是胜负手。
未来一切智能硬件被AI大模型驱动,一切软件系统被AI大模型重构无论哪一种大模型,最终都要落地到行业应用中。安筱鹏指出,在工业领域,大模型带来的颠覆式变革首先便是产品功能的智能化升级。
“未来,一切智能硬件都会被AI大模型驱动。”安筱鹏说道。以AI手机为例,首先手机里的芯片会发生变化,随着图像大模型、小模型进入手机,传统的CPU芯片无法满足庞大的计算需求,必然会需要更多的AI芯片;其次,手机与用户之间的交互方式也会发生变化,以前订机票需要打开系统、点开APP,再根据需求选票、订票,新一代的AI手机已经化身AI助理,只需要对手机说出订票需求,它就可以自行完成后面的一系列操作。
阿里云通义千问已经基于联发科处理器,把大模型“装进”并运行在手机芯片中,打造端侧AI的Model-on-Chip部署新模式。
“这无论对手机厂商、操作系统提供商,还是对软件公司而言,都是一场颠覆式的变革。”安筱鹏坦言,“这也是苹果放弃造车,押注AI的一个重要原因。”
与此同时,大模型会催生AI原生的智能终端,比如人形机器人。人形机器人作为通用机器人的代表和具身智能的载体,将成为AI与物理世界的接口。进入AI大模型时代,多模态大模型赋能人形机器人,将带来全新的变革。
扫地机器人亦是如此。在今年1月美国消费电子展上(CES)上,已经出现了不少以大模型为核心驱动力的扫地机器人。这些机器人在功能、服务以及形态上的进化备受期待。安筱鹏强调:“未来无论是何种形态的机器人,核心竞争力在于是被什么样智力水平的大模型所驱动。”
此外,汽车也会被大模型重塑。“汽车卖不卖得出去,自动驾驶能力很重要,而如今,自动驾驶技术又在被大模型重塑。”安筱鹏表示。在他看来,大模型改变了自动驾驶的训练方式,为产业发展找到了一条新的路径。过去的自动驾驶训练需要把各种场景拍成照片,由专人进行大量的图片标注,标注完成后再让模型去识别。现在有了AI大模型,只需要把视频、图片“喂”给它,它就能自主学习、自主训练了。
特斯拉的自动驾驶FSD V11版本有30万行代码,是基于海量标注+规则代码;而FSD V12版本只有2000+行代码,其技术路线是海量数据+BEV+Transformer。2023年9月2日,1200万人围观马斯克特斯拉自动驾驶,他试驾后讲的最重要的一句话是,“没有一行代码让特斯拉在停车标志处停车”。大模型带来了自动驾驶研发模式的跃升:从规则代码输出的驾驶决策,到基于AI大模型生成的驾驶决策。
“很多人对于大模型的认知就是写写小作文,生成个图片、视频,感觉和工业制造业的关系不大。其实并非如此,AI大模型给工业制造业带来的影响是非常深远的。”安筱鹏说道,“AI将重构软件开发范式、交互方式、使用流程和商业模式,无论是研发类、管理类、生产类还是后服务类工业软件,都将用大模型重新升级一遍。”
中国大模型市场存在“加拉帕戈斯隐忧”,要警惕统一大市场的“碎片化”
要在工业制造业领域把大模型用好,首先要做好模型训练资源的匹配。安筱鹏表示,制造业的大模型训练,有的需要行业知识、行业数据,有的只用通用的算法、数据就行。
其次要搭建完整的产业生态。今天市面上的大模型从“能用”到“好用”还有很长的路要走,而真正懂大模型,并且会操作、会训练的AI专业人才又很少,可以说大模型的生态尚未形成。
“大模型的产业化路径和以前完全不同,过去是卖产品,卖完就完了,现在是搭建一个生态。如果把大模型产业链比喻成足球赛,产业链上中下游可以对应后卫、中卫、前卫,我们要做的事就是让球踢起来更加丝滑,更加精准地传到对方的球门前。”安筱鹏解释道。
据他介绍,阿里魔搭社区已经服务了工业、医疗、金融等众多行业企业,包括做机器人的,做软件开发的,做AI应用的,自发形成了一个产业生态,包含多元利益主体。不过,这个生态还需要时间来持续成长繁荣。
“中国大模型市场存在‘加拉帕戈斯隐忧’。”安筱鹏感慨道。加拉帕戈斯是太平洋上的一个群岛。达尔文在一百多年前写的《物种起源》中提到,这个岛上有很多物种,每个物种都在自我进化、自我净化、自我迭代、自我演进。但它一旦离开了这座岛,就会因为无法适应环境而死掉。
安筱鹏认为,在数字化的企业市场领域,在AI大模型的2B市场侧,建立一个全国统一的大市场非常重要。中国SaaS产业过去十多年一直未能发展起来,与市场碎片化有很大关系。在2B数字化市场,没有形成全国统一的大市场,一方面,会导致市场丧失孵化培育大企业的能力;另一方面,也会让这个市场丧失优胜劣汰的能力,同时也不利于产业生态的建设。“加拉帕戈斯现象”提醒我们:要警惕在特殊背景和条件下形成的独特能力,并保持开放性,不断审视以往的成功,同时不断拓展边界。
定制化、私有化部署的大模型无法大规模商业化,成本很高、效率很低,会导致很多企业锁死在一个狭窄的赛道上,这是落后的产业模式,会导致大模型统一大市场的“碎片化”。安筱鹏认为,应该用公共云的方式来做大模型,发挥公共云集约化、规模化优势,提供平台化的服务,从而大大降低模型训练推理成本和创新门槛。只有公共云才是新质生产力的代表,私有云不是。