(资料图)
近日,有人工智能领域的专家预测,随着越来越多的人工智能生成的内容在网上发布,未来接受这些数据训练的人工智能最终将陷入混乱。
一群英国和加拿大的科学家最近发布了一篇论文,试图了解几代AI相互训练后会发生什么。在一个例子中,经过九次迭代的人工智能系统会喋喋不休地谈论野兔,而最初的原始材料是关于中世纪建筑的。
剑桥大学教授罗斯·安德森将“模型崩溃”比作大规模污染,他表示,就像我们在海洋里撒满了塑料垃圾,在大气中放满了二氧化碳,我们即将让互联网上充满胡言乱语。
聊天机器人ChatGPT背后的大语言模型(LLM)通常需要从互联网上抓取大量数据进行训练,这些数据多为人类生成。但随着人们对这些工具的使用越来越多,人工智能生成的内容正被大量添加到在线数据池中,未来的LLM将从中学习。
科学家们说,利用人工智能生成内容对人工智能系统进行迭代训练,意味着错误和无意义的例子会不断增加,使后来的人工智能无法区分事实和虚构内容。他们担忧道,人工智能将“通过强化自己的信念,开始曲解他们认为是真实的东西”。
据在线虚假信息监管机构NewsGuard数据,有49个新闻网站似乎完全由人工智能撰写内容。另外市场营销和公关机构也逐渐将文案外包给聊天机器人。
有专家表示,对于人工智能来说,人工生成的数据还是十分有必要的,因为我们的语言产生了大量的自然变化、不可预测的结果。
X 关闭
X 关闭