首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

巨头AI演示接连翻车 微软必应聊天演示存多出错误

腾讯科技讯 2月15日消息,在谷歌上周举行的聊天机器人演示活动中,因为现场翻车导致其股价当天暴跌逾7%。无独有偶,微软上周公开演示了人工智能驱动的必应改进版,其中似乎包括几个事实错误,突显出该公司及竞争对手在将人工智能融入搜索引擎时面临的风险。

在微软总部举行演示中,该公司展示了如何整合ChatGPT背后公司的人工智能功能,使搜索引擎能够提供更多对话和复杂的搜索结果。演示包括像吸尘器等产品的利弊清单;去墨西哥城旅行的日程安排;以及快速比较公司盈利结果的能力。

但根据独立人工智能研究人员德米特里·布里尔顿本周对演示的分析,必应的搜索结果显然没有区分真空的类型,甚至编造了某些产品的信息。根据布里尔顿的说法,它还遗漏了提到的墨西哥城酒吧的相关细节(或捏造了某些信息)。此外,布里尔顿发现它错误地陈述了零售商Gap的营业利润,并将其与一组事实上不正确的Lululemon财务数据进行了比较。

微软对此在声明中表示:“我们已经了解到这份报告的情况,并在努力分析搜索结果,向用户提供更好的体验。我们认识到仍有工作要做,并预计系统可能会在预览期间出错,这就是为什么反馈至关重要,以便我们可以学习并帮助模型变得更好。”微软还表示,自上周推出预览版以来,成千上万的用户与全新的必应进行了互动,并分享了他们的反馈,使该模型“学习并做出了许多改进。”

随着人工智能聊天机器人ChatGPT走红,越来越多的科技公司竞相在其产品中部署类似的技术。ChatGPT可以生成令人震惊的文章和对用户提示的回应。但这也伴随着风险,对需要显示准确结果的搜索引擎尤为如此。

专家表示,生成式人工智能系统是根据大量在线数据训练的算法,以创造新内容,这是出了名的不靠谱。纽约大学的计算机科学家兼错误信息研究员劳拉·埃德尔森此前曾向媒体表示,“人工智能听起来很权威,和人工智能实际上产生了准确的结果,这两者之间有很大的区别。”

微软的聊天机器人采用了与ChatGPT相同的技术。在演示中,该公司要求ChatGPT驱动的必应提供Gap第三季度财报的关键要点。程序继续这样做,除了摘要的一部分完全关闭。

以下是这份总结中存在的错误:

--人工智能必应表示,Gap报告的运营利润率为5.9%。然而,该公司的财报明确指出营业利润率为4.6%,5.9%这个数据在Gap当季财报中根本不存在。

--人工智能必应还表示,Gap预计净销售额将增长两位数百分比。但实际报告称,“2022财年第四财季,净销售额可能同比下降中个位数百分比。”

--Gap报告的毛利率为37.4%。但在去除与Yeezy有关的费用后,调整后毛利率为38.7%。

--调整后摊薄每股收益为0.71美元,而非0.42美元,后者同样在财报中无法找到。

在微软开始演示时,该公司还使用全新的必应来查询“销售宠物吸尘器前3名的利弊是什么?”搜索引擎很快产生一个结果,列出了三种宠物吸尘器的优缺点。

不过布里尔顿指出,必应在描述必胜宠物毛发擦除器手持式真空吸尘器时犯了一个错误。它把具有“16英尺短电线长度”的产品列为一个缺点。事实上,这款真空吸尘器是一款设计为便携式的无绳型号。最重要的是,必应似乎提供的是最值得推荐的宠物吸尘器搜索结果,而不是最畅销的搜索结果。

在演示中,必应在列出墨西哥城夜生活推荐时犯错。该搜索引擎称,一家名为Cecconi's Bar的酒吧“有一个网站,你可以在那里预订并查看他们的菜单。”但搜索Cecconi's Bar却找不到它的网站。你必须打电话来预订。

此外,微软还吹嘘必应创建关于90年代音乐的问答游戏的能力。搜索引擎确实做到了这一点,准确地列出了每个问题的正确音乐家。但尴尬的是,在总共10个问题的测验中,所有答案都是“A”,没有任何变化。

因为将为公众所用,必应和其他人工智能聊天机器人的准确性无疑将受到更严格的审查。也许最终它们会越来越少,或者完全消失。然而,这也提出了一个问题,如果一开始用户必须检查聊天机器人提供的信息,这项技术是否能够真正存活下来。(无忌)

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230215A04IG100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券