发烧友网报道(文/吴子鹏)此前,微软总裁布拉德?史密斯(Brad Smith)在接受采访时表示,中国的研究机构和公司将成为ChatGPT的主要竞争对手,“我们的ling先优势并不大,中国不会在人工智能发展的竞争中落后。”
而在布拉德?史密斯受访前不久,360创始人周鸿祎发表言论称,在ChatGPT领域中国具有很大优势,有希望在2-3年内达到世界ling先水平,应该对ChatGPT技术探索给予充分支持。
近一段时间以来,国内类GPT大模型密集型发布,那么真的能够在智能化水平上超越GPT吗?
布拉德?史密斯看重的研究院
布拉德?史密斯在受访中指出,处在AIGC技术前沿的一共有三个机构,OpenAI 和微软是一个,谷歌是第二个,北京人智源工智能研究院(以下简称:智源研究院)是第三个。
智源研究院成立于2018年,是在科技部和北京市支持下,联合北京人工智能领域优势单位共建,汇集国际ding尖人工智能学者,聚焦he心技术与原始创新,旨在推动人工智能领域发展政策、学术思想、理论基础、ding尖人才与产业生态的五大源头创新。
之所以布拉德?史密斯看重智源研究院,除了人才方面的优势以外,该机构发布的大模型也确实实力不俗。
2021年6月,智源研究院发布中国shou个%2B世界zui大超大规模预训练模型——悟道2.0。据介绍,悟道2.0参数规模达到1.75万亿,是GPT-3的10倍,打破了之前由Google Switch Transformer预训练模型创造的1.6万亿参数记录,是当时中国shou个、quan球zui大的万亿级模型。
在当时的测试中,悟道2.0在国际公认的9项的机器学习任务“跑分”项目上,都超越了包括GPT-3在内的同类产品。
更为重要的是,悟道2.0大模型延续了悟道1.0的侧重点,将中文训练作为研究重点之一,在中文、多模态、认知、蛋白质预测等方面得到了进一步增强。“悟道2.0”模型在中英双语共4.9T的高质量大规模清洗数据上进行的训练。训练数据包含WuDaoCorpora中的1.2TB中文文本数据、2.5TB中文图文数据,以及Pile数据集的1.2TB英文文本数据。
目前,智源研究院在AI大模型方面的创新研究包括三大智能模型%2B一个智算平台。其中三大智能模型分别指“悟道”信息模型、“天演”生命模型和“天道”物理模型;智算平台指的是“九鼎智算平台”,是一个拥有1000P 算力的科研大装置。
并且,在今年3月份,智源研究院推出了“飞智”大模型技术开源体系。FlagAI是大模型算法、模型,及各种优化工具的一站式、高质量开源项目,集成quan球各种主流大模型算法技术,以及多种大模型并行处理和训练加速技术,支持高效训练和微调,旨在降低大模型开发和应用的门槛,提高大模型的开发效率。
国内AI大模型进入井喷时代
近一段时间以来,AI大模型在国内可谓是遍地开花,华为、阿里、百度等科技巨头都发布了自己的AI大模型。
3月16日,百度创始人李彦宏宣布正式推出基于百度新一代大语言模型的生成式AI产品“文心一言”。具备五大能力,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。根据发布会的数据,已经有 650 家企业宣布接入文心一言生态,文心一言大模型将带来三大产业机会。zui新消息显示,百度已经推出了安卓版的文心一言App,用户可以通过键盘打字输入问题,也可以通过语音方式输入问题,并且文心一言也可以通过语言进行回答。4月13日,知乎联合面壁智能发布中文大模型“知海图AI”。面壁智能联合创始人、CTO 曾国洋在大会演讲中表示,“经过测试,在知乎热榜的应用场景下,知乎与面壁合作自研的大模型与GPT-4相比达到了持平的效果”。
4月17日,昆仑万维发布千亿级大语言模型“天工”,也是昆仑万维继AI绘画产品“天工巧绘”后的一款生成式AI产品,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。
4月18日,金山办公发布具备大语言模型能力的生成式人工智能应用WPS AI,并首先应用于金山办公轻文档(airPage),后续将陆续嵌入金山办公全线产品中。
虽然OpenAI联合创始人兼CEO Sam Altman在公开演讲中表示,“我们已经处在大模型时代的尾声,OpenAI已经接近了LLM规模的极限,未来成长将会放缓。”
不过国内业者很显然并不这样看,他们大都认为,大型AI模型将推动AI技术在各个产业的应用,以满足市场的多样化需求。只追求参数规模的AI大模型或许会遇到瓶颈,不过针对医疗、教育、金融等细分行业打造的垂直AI大模型将带来巨大的产业机遇,有望带来更高效、更准确的服务,提高整体产业的效率。
中国在AI大模型方面的优势
此前,全国政协委员、360集团创始人周鸿祎同样将AI大模型技术写入他的提案中。他对国内AI大模型的发展非常有信心,认为“在ChatGPT领域中国具有很大优势,有希望在2-3年内达到世界ling先水平。”
写在zui后
对于前沿技术的发展,中国市场有zui好的包容性,因此很多创新技术进入中国市场之后都会开枝散叶,变得非常多元化。在OpenAI的角度上,GPT等AI大模型可能就是基于千亿、万亿级参数塑造的智能化产品,未来应用方向还很模糊。不过从国内的发展势头能够看出,不仅在内容生成和创作等方面对标GPT,同时也在积极探索AI大模型对传统行业和传统工具的颠覆。市场需求带动创新发展,这可能就是国内AI大模型井喷的原因所在。