根据韩媒报道,三星电子已经开始全面开发人工智能聊天机器人背后的关键技术——大语言模型(LLM),以供内部使用。
三星电子多名工作人员透露,公司已于本月初开始开发自己的大语言模型,由三星研究院主导,已经着手调动所有相关人力和资源,目标是在7月底前完成初始版本的开发。
防止技术泄露,三星开发自己的大语言模型
三星起初曾使用过ChatGPT等生成式AI。该公司认为,人工智能可以大大缩短软件开发和半导体设计的周期,因此先期对引入人工智能的各种方式充满兴趣。
然而,今年3月30日,据韩媒报道,三星内部发生三起涉及ChatGPT误用与滥用an例,包括两起“设备信息泄露”和一起“会议内容泄露”。
三起泄密事件均发生在三星电子半导体暨装置解决方案(Device Solutions,简称“DS”)部门。三星DS部门的A职员,在执行半导体设备测量资料库(DB)xia载程序的源代码时出现了错误,便复制出有问题的原始代码到ChatGPT,并询问了解决方法。
三星DS部门的B职员把为了把握产量、不良设备而编写的源代码输入到ChatGPT,并要求其优化。三星DS部门的C职员则将手机录制的会议内容转换为文件后输入到ChatGPT,要求其制作会议纪录。
三星电子认为,在ChatGPT输入内容后,相关资料都将传送到外部服务器,如果让ChatGPT学习三星内部资料,可能会让敏感内容外泄。因此在4月内部信息泄露后,三星电子暂时禁止在内部PC上使用生成式AI。
三星集团董事长李在镕认为,为防止he心技术数据泄露,以及日益依赖于海外科技公司技术等原因,公司应该尽快开发自己的人工智能。
三星开发大模型的好处与挑战
据韩媒报道,该项目从本月开始开发,三星为该项目投入了大量资源和人力,以确保其快速发展,该公司甚至限制其他业务部门在 6 月至 7 月期间使用 GPU 资源。
三星电子联席shou席执行官 Kyung Kye-hyun表示,该大模型用以支持芯片业务部门员工的知识搜索和翻译等任务,并计划在12月推出基本服务,在明年2月推出更集成的服务。
根据该计划,基于人工智能的系统有望支持九个关键领域,包括产品采购和成本管理的自动响应;芯片生产的知识搜索和数据分析;以及其他行政工作,例如内部会议记录的翻译和抄录等。Kyung还透露,三星正在探索如何利用公司出色的技术为人工智能生态系统做出贡献。
对于三星来说,开发自己的大语言模型有它的好处,其一人工智能可以帮助三星缩短软件开发和半导体设计周期,减少人力成本和时间成本,提高竞争力;其二拥有自己的大语言模型,意味着公司不需要再依赖OpenAI、微软和谷歌等的大模型产品,而造成信息可能泄露。
当然对于一家芯片厂商入局研究大语言模型,挑战也是有的。大语言模型的开发,技术难度大、成本高,需要投入大量的计算资源和zhuan业的人才进行开发和维护。可以看到,三星已经为此动员所有相关的人力和资源,并限制其他内部软件开发组织使用GPU。
大语言模型的开发对计算资源的需求极大,数据显示,如果以英伟达A100显卡的处理能力计算,GPT-3.5大模型需要2万块GPU来处理训练数据。业内公认,做好AI大模型的算力门槛需要1万枚A100芯片,单从计算芯片的投入来看就已经要上百万。
小结
如今大语言模型的强大能力已经众所周知,然而作为企业来说,在使用第三方大语言模型产品的时候,难免会担心自己的技术信息会被第三方机构搜集使用,造成机密泄露。而开发自己的大语言模型确实可以解决这个问题,不过对于企业来说,zui好是具备足够的资金和人才、技术积累才去涉足。