首页
学习
活动
专区
圈层
工具
发布

3D虚拟人关键突破:动态倾听与实时对话能力实现

国内多所高校与研究机构在3D虚拟人交互技术上实现重要突破,使虚拟人能在对话中自然地兼顾“说话”与“倾听”,交互表现更加拟人流畅。

长期以来,虚拟人在对话中往往难以协调语言与动作,行为切换生硬。本次研究提出的回合级交错掩码自回归(TIMAR)框架,创新引入“回合级因果注意力”机制,让虚拟人像真人一样仅依据当前及历史对话信息生成反应,避免提前依赖后续内容,从而保证交互的即时与连贯。配合高效的生成模型,该技术还能合成丰富的非语言动作,如点头与表情变化。

实验显示,新方法在真实对话数据集上全面优于现有系统,动作真实度误差降低15%至30%,并能有效利用对话历史提升回应质量。该成果有望推动虚拟人在客服、教育、心理陪伴等领域的落地,使其成为更具情感感知能力的交互伙伴。

研究团队计划开源相关代码与模型,助力技术推广与后续创新。这一进展标志着虚拟人交互向更自然、更具情感理解的方向迈出关键一步。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OmGSuEjnXHq7uWTE4x5SZYqw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券