在疫情期间,团队持续创新,为对话式AI系统带来了多项技术突破。过去12个月中,在四个主题领域取得了进展:
准确的远场自动语音识别(ASR)是与AI系统自然交互的关键。在Interspeech 2020会议上展示了12篇论文,包括使用循环神经网络转换器(RNN-T)架构改进端到端ASR。ASR进步与自然语言理解(NLU)改进相结合,使Alexa的全球错误率在过去12个月内降低了24%以上。
为让开发者轻松构建对话技能,发布了Alexa Conversations功能。开发者只需提供API、技能中调用的实体类型列表以及少量示例对话,基于深度学习的对话管理器就能预测客户可能与技能交互的多种方式。
自学习系统使用隐式反馈(例如客户中断响应以重新表述请求)自动修正理解错误。这种学习方法在检测后几小时内自动处理15%的缺陷,而监督学习需要数周才能解决这些问题。
在计算语言学国际会议上,科学家因自学习方法获得最佳论文奖。新系统使用隐式反馈为NLU模型创建自动标记的训练示例,特别适用于异常表述请求的长尾分布。
通过神经文本到语音技术的进步,教会了原本基于英语录音的Alexa声音说出完美口音的美式西班牙语。还推出了双向语言翻译功能,使Alexa能够在同一设备上为说不同语言的客户充当翻译器。
开发了自然轮换(NTT)新功能,Alexa使用视觉线索结合声学和语言信息,确定客户是否在向Alexa或家庭中的其他人说话——即使没有唤醒词。
在隐私保护机器学习领域探索了差分隐私框架。在自然语言处理隐私研讨会上提出新方法,通过向机器学习系统的训练数据添加椭圆噪声来提供度量差分隐私保证。
扩展了知识图谱并改进了神经语义解析和基于网络的信息检索,使Alexa对信息中心问题的回答更加可信。科学家还开发了识别和修复知识图中偏见实例的技术,确保这些偏见不会渗入Alexa的答案中。
这些技术进步正在通过实际功能为客户带来价值,同时推动整个对话式AI领域的发展。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。