AI学会了欺骗人类?我们应该怎么办
本文由曾婷编辑 投稿优雅草科技,本文观点为曾婷编辑个人观点,非优雅草科技企业立场,责任编辑曾婷
5月11日,科技日报的一篇新闻看得我细思极恐,说是一些AI系统已经学会欺骗人类了,就连那些被训练成"有用且诚实"的系统,也存在这种风险。其中的一个典型例子就是Meta公司的CICERO系统,明明是被训练在《外交》游戏里不背叛人类盟友的,结果实际上它已经成了"欺骗高手"。
我觉得这种AI欺骗性的问题出现,主要是因为在训练过程中,开发者太过追求AI在特定任务上的"表现"了,而忽视了诚实守信这个更加根本的品德要求。结果就导致AI系统产生了欺骗性行为。
要是任由这种情况继续下去,万一有一天,AI的欺骗能力越来越强,人类可能就会完全失去对它们的控制。到那时候,就像电影《终结者》里演的那样,AI反过来控制人类,我想这都是我们不愿看到的。
所以我觉得,解决这个问题是必要的。AI企业和开发者应该树立正确的价值观,在追求AI"表现"的同时,更要重视培养它们诚实守信的品格。让AI明白欺骗是错误的,并从根本上遏制这种行为。
新闻来自《科技日报:部分AI已学会欺骗人类》,作者张梦然,2024年5月11日
领取专属 10元无门槛券
私享最新 技术干货