“
2021 年 9 月 24 日,中关村论坛正式开幕。
在第一天的主论坛上,一位忠实的“工作人员”吸引了与会观众的目光:在大屏幕上,一位虚拟的数字人根据主持人的语音,用手语将中关村论坛介绍在大屏幕上进行播报。
冬奥手语播报数字人
这一“冬奥手语播报数字人系统”是由北京市科委、北京市残联发起,科技冬奥专项支持,智谱AI、凌云光和北京广播电视台联合打造。
项目还得到了市残联聋人协会的大力支持。
“冬奥手语播报数字人系统”是“悟道 2.0”超大规模预训练模型的首次实际场景应用,依托智谱AI 打造的“数据”与“知识”双轮驱动智能平台,旨在实现冬奥期间赛事新闻的实时手语翻译播报。
”
“
未来,研发团队还希望通过电视传媒方式将无障碍理念传递到数亿人群,大幅提升无障碍通道影响力,为听障人士平等参与社会生活创造无障碍环境。
根据国内统计数据显示,中国有超过 2700 万听障人群,如果算上他们的亲人、朋友和同事,更是会涉及到上亿人。听障人士也对教育、社交、娱乐、信息获取有巨大的需求,然而,传统人工手语翻译工作量大,而且节目主持人和手语主持人配合难度极高。所以,通过 AI 技术将播报内容翻译合成为手语,并利用数字人虚拟主播来播报成为解决这一难题的重要途径。
为了实现精确的人物形象和手语动作,智谱AI 和合作单位的研究团队研制了高速易用的数据采集装置,涵盖手语动作、表情等多种原始素材,采集数据规模超过 10 万条,同时使用在“悟道”大模型基础上实现了手语翻译,结合团队研发的跨模态拟人生成算法驱动 3D 超高精度数字人模型,实现对体育赛事播报的实时手语播报。
数字手语主播不仅需要真实的数字人形象,也需要能够理解、翻译语音和手语的数字大脑。基于智谱AI 的大规模知识图谱和结合了数据与知识的双轮驱动虚拟数字脑,研发团队还专门构建了冬奥手语语料库,包括多模态肢体动作、表情、手指等语料,专门训练数字脑掌握手语表达方法。最终,手语数字脑可以通过计算机模仿听障人士的大脑,将看到的中文文本信息实时转换成手语词汇序列。
在未来,本系统将支持各个电视台、网络平台和大屏幕等渠道进行各类信息的手语播报,在大幅降低转播成本的前提下,还能极大地扩展听障人士的信息获取范围,提高他们的社会参与度和幸福感。
智谱AI 成立于 2019 年,由清华大学计算机系知识工程实验室的技术成果转化而来。
智谱AI 的科研团队结合了已有的人工智能技术和人类的认知模式,有机融合了大规模预训练模型和知识图谱,形成了双轮驱动的智能平台,可以像人类一样独立地学习和思考。除了手语数字人外,智谱AI 还开发了科普数字人小科、首个入学清华的虚拟数字学生华智冰和社交机器人等多个数字人应用。
”
你“在看”我吗?
领取专属 10元无门槛券
私享最新 技术干货