首页
学习
活动
专区
圈层
工具
发布

豆包APP实时语音通话升级全双工模型 抗干扰与低时延能力提升

近日,豆包APP实时语音通话功能升级,上线全双工语音大模型Seeduplex 。据介绍,作为原生全双工端到端语音大模型,Seeduplex 能够在复杂声学场景下实现精准抗干扰与动态判停,提供更顺畅、更自然的语音交互体验。

此次更新后,豆包实时语音通话功能在对话自然度、响应速度和抗干扰能力等方面均有提升。

记者实测发现,升级后的豆包语音通话在复杂环境下表现出较强的抗干扰能力,即便周围存在人声和噪音干扰,也能较准确地识别用户语音,不易被无关声音带偏。以餐厅、展览等易出现多人交谈的场景为例,过往 AI 产品容易因背景噪音或旁人说话声出现误打断、误回复等情况;此次升级后,豆包对无关声音的过滤能力有所增强,对话过程也更不容易被人声意外打断。

除抗干扰能力外,升级后的语音对话节奏也更接近自然交流。人与人对话中,停顿并不总意味着发言结束。此次升级后,豆包可结合语音与语义信息判断用户是否仍在继续表达,从而减少对话中的“抢话”现象。与此同时,对话响应时延也进一步降低,在接龙、飞花令等高频互动场景中表现更为明显。

目前,这一能力已在豆包 APP上线。用户可点击“打电话”按钮,开启实时语音通话功能体验。

雷峰网

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OqAvV-So1-kziK3zURDFkPDw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券