前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【深度解析】2024中国虚拟数字人行业:技术革新与应用探索

【深度解析】2024中国虚拟数字人行业:技术革新与应用探索

作者头像
AIGC新知
发布于 2024-10-08 10:49:56
发布于 2024-10-08 10:49:56
4020
举报
文章被收录于专栏:AIGC新知AIGC新知

随着人工智能技术的不断进步,虚拟数字人行业在2024年迎来了前所未有的发展机遇。中国传媒大学媒体融合与传播国家重点实验室发布的《2024中国虚拟数字人影响力指数报告》为我们揭示了这一领域的最新趋势和挑战。

本文将对该报告进行详细解读,带您一窥虚拟数字人的未来之路。

虚拟数字人的技术演进

报告指出,2023年是虚拟数字人技术快速迭代的一年,尤其是AIGC(Artificial Intelligence Generated Content)技术的发展,为虚拟数字人的内容创作和个性化表达提供了强大动力。

AIGC技术不仅能够自动生成文本、图像、音频和视频等多种媒介形式的内容,而且与数字人概念深度融合,预示着一个全新的虚拟数字互动时代的到来。

以交互、服务为目的,具备形、声、行、神四类模因中的一类或多类数字模因的对象,都属于虚拟数字人。

形模因

虚拟数字人的外观和形象层次,涵盖了其外观、造型、配饰等形象设计。

根据维度,分为 2D 和 3D 两大类,2D 为平面驱动式,3D 需要建模;从外形上可分为二次元、高仿真、超写实等;按照设计难度,有 2D 真人型、二次元型、3D 卡通型、3D 真人型、3D 超写实等类型。

声模因

虚拟数字人的语言和对话层次,包含了其音色、语调、语速、用词、语种等声音设计和语言表达。

虚拟数字人声模因的表现主要通过声音克隆、语音合成

声模因分为通用 TTS 和个性化 TTS 两大类,其复制方式目前主要有“拼接法”和“参数法”两种:

  • 拼接法,从预先录制的大量语音中,选择所需的音节、音素等基本单位拼接而成,这种声模因质量高,但所需语料数据大,成本也高;通用 TTS 主要用拼接法。
  • 参数法,根据统计模型来产生每时每刻的语音参数(包括基频、共振峰频率等),然后把这些参数转化为波形;个性化 TTS 则多使用参数法。

在虚拟数字人聚集平台,声模因是“通用模型”,如萝莉音、大叔音、游戏音,甚至是“广西老表语音包”等都成为流行的声模因。

在虚拟数字人应用中,个性化 TTS 的制作、真人语音的“高保真、超写实”的克隆需求开始增加。

行模因

虚拟数字人的动作和行为层次,包括其表情、动作、互动方式等。

虚拟数字人的行模因通过表情、微表情、肢体动作、标志性行为等进行表达,同时也包含了技能定义,如舞蹈技能、音乐技能、金融知识技能、模特表现技能等。

如:初音未来爱给粉丝进行“眨眼”的互动,美妆捉妖达人柳夜熙的招牌动作是盲打键盘,敦煌天妤的飞天、弹琵琶是其标志性动作。

神模因

“神”模因,即虚拟数字人的文化模因,一方面包含了文化和社会层次,主要涉及虚拟数字人的世界观设计;另一方面包含了虚拟数字人的情感表达和个性特质,如何让虚拟数字人拥有“灵魂”,自我学习、自我展示、高效交互,甚至自我进化。

神模因是虚拟数字人将模因人格化的关键因素,通过模仿真人来实现:模仿理性→模仿感性→模仿非逻辑非理性,通过模仿实现对“人”的主体性的回归。

以陪聊型虚拟数字人为例,人物设定为“男朋友、幽默、有耐心、金融男”等关键词的聊天交互可以实现各自的角色贴合,但并不能完成自主的聊天主题、目标设定等。

“最关注的数字人 IP 模因”调查—用户投票

数据节选自 P**《数字人消费者认知及使用情况网络调查》

从数字模因“创意策划 - 设计 - 运营 - 演化”的形成和演进阶段来看:

  • 创意阶段通过外观、世界观、能力等形、声、行、神模因的设定去定义虚拟数字人;
  • 设计阶段呈现虚拟数字人的形、声模因;
  • 运营阶段在数字化、智能化媒介中去呈现、传播四类模因;
  • 演化阶段,不断互动和反馈,去迭代、升级、规训四类模因。

虚拟偶像用洛天依、虚拟主播央视网小 C、数字员工用:幸福的科达琳

从形、声、行、神四类模因的发展来看,目前的虚拟数字人“声”的发展最成熟,智能化水平和程度最高;其次是“形”,超写实数字人的制作与生产也集结了很多美术与技术人才;“行”和“神”模因的发展仍处于初级阶段,特别是神模因面临很大的挑战。

应用场景的多元化

2023 年是虚拟数字人行业的 AIGC 发展年。在 AIGC 的带动下,数字人的生产、运营都在降本增效,商业应用开始普及,从广电到文旅,从金融到教育,从电商到餐饮,数字人相关的制作、技术、运营招标屡见不鲜。

在应用场景上,虚拟数字人已经从单一的娱乐领域扩展到教育、文旅、金融等多个行业。例如,文旅领域的虚拟导游、金融行业的虚拟客服、教育领域的虚拟教师等,都开始展现出其独特的价值。

天妤是国内首个文化出海的虚拟数字人,其对外传播的发展策略,是虚拟数字人与中华文化出口相结合的积极尝试,对中国优秀传统文化走向世界有着战略意义。此外,天妤积极参加公益,成为水滴公益“小善行公益大使”,在守护儿童成长等公益上发挥了积极作用,在行业引领指标上获得高分。

作为超写实虚拟主持人,央视网小 C 于 2023 年频频亮相于总台举办的各类晚会。

在 2024 年的《总台网络春晚》中,小 C 化身月宫仙子穿越星河,与吴碧霞共同致敬航天梦想。小 C 积极拓展合作领域,与其他平台或机构携手合作,如参与《首届中国数字音乐会》和专访《中国奇谭》的主创团队。

希加加是由百度推出的 AI 数字人,也是首个数字虚拟偶像。

在 2023 年中国虚拟人产业大会暨 AIGC 创新发展论坛上,希加加作为百度 AI 数字人、AIGC 首席架构师受邀出席大会,并发表了《神奇大模型之 AIGC:人人皆是天才创造者》主题演讲。

10 月,希加加担任安踏羽龙服形象大使,共同呈现了时尚元宇宙的虚拟舞台,将科技与时尚、运动相结合,为观众带来了全新的视觉体验。

数字人智作手册

内容呈现 & 驱动方式

内容呈现维度:离线内容呈现、实时内容呈现。

驱动方式维度:关键帧动画驱动、真人驱动、智能驱动。

典型案例

智能制作

智能交互

3D 数字虚拟人智能交互流程

3D 数字虚拟人智能交互流程优化

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AIGC新知 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档