在2024中关村论坛年会——互联网3.0:未来互联网产业发展论坛上,清华大学长聘教授、清华大学人工智能研究院视觉智能研究中心主任邓志东表示,生成式人工智能给Web3.0产业发展带来三项挑战。
一是可能会产生幻觉、偏见与歧视。以大型语言模型作为基础的生成式人工智能,不同于Web3.0的去中心化,普遍存在着所谓的幻觉问题。
邓志东表示,生成式大语言模型及通用世界模型出现模拟偏差是不可避免的。大模型生成或模拟的多模态内容通常准确性不高,甚至出现事实性错误与偏见,训练数据可能存在种族与性别歧视等,这些或会给Web3.0产业的安全性带来挑战。例如,Sora生成的持续时间较长的视频中,偶尔会发生不连贯,或跳出一些不相干的物体,有时也存在空间左右不分的情况。
二是可能会带来知识产权、隐私与合规性问题。邓志东表示,生成式人工智能的超大规模自监督预训练,主要依靠人类存储在互联网上的各种真实多模态数据,包括全世界各个语种的文本语料、程序代码、音频、图片和视频等,也涉及人类交互与反馈的价值观数据、下游的垂域微调数据等。
此外,大模型从网页爬取的数据可能涉及数据源的知识产权与隐私问题。由于生成的多模态内容是综合表达的结果,无法指明具体出处,因此也会存在合规性问题。
三是可能会形成新型网络欺诈与威胁。AIGC的文本到语音和图像生成功能,以及由Sora生成的视频,可能会传播虚假信息或社会谣言,生成式人工智能的滥用可能带来有违法律、伦理、价值导向等的有害信息。
邓志东表示,巨量的生成文本、图片与视频,或会严重污染互联网空间,而利用AI复活获得的“永生”,也涉及伦理问题,因此也会带来新型网络欺诈、威胁与犯罪等各种挑战。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。