近日,美国普渡大学的研究人员发表了一项令人震惊的报告,指出人工智能语言模型ChatGPT在回答编程问题时存在高达52%的错误率。这一发现引发了人们对人工智能技术可靠性的担忧,也对ChatGPT未来发展前景提出了疑问。
研究揭示ChatGPT编程错误率高企
普渡大学的研究小组在计算机-人交互大会上提交了这份名为“ChatGPT的编程错误:对Stack Overflow问题的分析”的报告。该报告对ChatGPT在回答517个Stack Overflow编程问题时的表现进行了评估,结果显示,ChatGPT的错误率高达52%。
研究人员将问题分为概念性、如何操作和调试三个子类别,并根据问题的流行度、类型和时效性进行了分析。结果显示,ChatGPT在概念性问题上表现最差,错误率高达63%。而在如何操作和调试问题上,ChatGPT的错误率分别为48%和45%。
人类识别错误能力有限,AI写码仍需谨慎
更令人担忧的是,研究发现,人类程序员在39%的情况下未能识别出ChatGPT的错误答案。这意味着,即使ChatGPT给出错误的代码,也可能会被人类程序员接受并使用,从而带来潜在的安全风险。
引发对AI技术可靠性的担忧
ChatGPT是OpenAI开发的大型语言模型,能够生成文本、翻译语言、编写不同类型的创意内容,并以信息丰富的方式回答问题。然而,普渡大学的研究表明,ChatGPT在编程方面存在严重的缺陷,其可靠性值得怀疑。
这一发现也引发了人们对人工智能技术可靠性的担忧。随着人工智能技术的不断发展,其在各领域的应用也越来越广泛。如果人工智能技术的可靠性无法得到保障,则可能会带来严重的社会问题。
领取专属 10元无门槛券
私享最新 技术干货