腾讯云智能数智人形象和声音复刻常见问题

一、形象定制相关
问题表述
回答
优化建议
示例图片
视频素材中，什么样的衣服会变色？
衣服含有黄色元素和绿色元素时，会变色
不要穿黄色，绿色，或是含有黄色和绿色元素的
﻿
﻿
﻿
视频素材中间存在剪辑，跳帧会有什么影响？
生成的形象在同样位置会跳帧，训练导出demo时可手动选择，但需保证至少1min以上连续片段
视频只可进行掐头去尾式编辑，提供的素材需是连续无间断的拍摄片段
﻿
﻿
﻿
视频素材有美颜美体造成抖动（脸部，腰部等）会有什么影响？
生成的形象同样位置会抖动，训练导出demo时可手动选择，但需保证至少1min以上连续片段
视频如需美颜美体，建议检查处理过后的画面有无抖动
﻿
视频素材中人物转头角度过大，大侧脸，仰头低头等会有什么影响？
1. 导致训练人脸检测失败，实际被训练的视频时长可能小于3min，影响最终口型效果；
2. 大角度偏转前后口型效果明显差
建议人物头部不要有大幅转动，拍摄斜坐角度需要保证口型完整露出；
﻿
﻿
﻿
视频素材中手部或者其他物体遮挡了面部或下巴会有什么影响？
1. 遮挡面部的，会导致训练提前结束，实际被训练的视频时长可能小于3min，影响最终口型效果；
2. 遮挡下巴的，训练后的形象，遮挡下巴的物体会有缺失（手部被口型覆盖）
手部在做动作时不要进入头部区域；保证脸部全程无间断露出
﻿
﻿
﻿
视频时长过短，不足3mins；
视频时长不足，重复拼凑时长；
视频重复读一段文字会有什么影响？
口型丰富度不够，会明显影响口型的效果
建议视频录制满足时长3 - 5分钟
﻿
镜头抖动会有什么影响？
生成的形象同样可能发生抖动；需人工选取画面稳定的连续片段进行训练，若无连续一分钟以上镜头稳定片段则需重新录制；
保证镜头固定足够稳定，拍摄全程无任何机位的变化
﻿
﻿
﻿
衣服，椅子，桌面等附属物与绿幕同色系会有什么影响？
1. 易造成分割效果不佳；
2. 去绿时，同色系附属物会受到影响产生颜色变化
避免穿偏绿色系衣物及使用偏绿色系道具
﻿
﻿
﻿
人物、桌椅道具大面积反绿光怎么办？
训练时需要进行较高等级的去绿可能使反绿的位置颜色失真；若不进行高等级的去绿可能造成产出的形象同样反绿光
优化拍摄环节
﻿
﻿
﻿
眼镜片反光，透绿怎么办？
眼镜片绿色的部分会被分割当成背景
拍摄时适当调整，尽量避免眼镜片透绿
﻿
﻿
﻿
如何减少绿光的反射到人身上？
1. 绿幕选择牛津布材质，背光安装，保证绿幕后方没有光线渗入；
2. 模特距离绿幕至少1.5米距离；
3. 对模特进行四面环绕打光，打掉轮廓上的绿光；
4. 绿幕和模特分开打光；
5. 可以把周围绿幕用黑布遮挡掉，只露出需要扣像的一块来减少漫射的光线 
﻿
﻿
视频有多人声说话会有什么影响？
对口型识别造成干扰，影响口型合成的效果
尽量保证环境安静；若无法满足，可调试麦克收音范围减小其他人声录入或进行音频后期处理
﻿
使用蓝幕录制会有什么影响？
身上反蓝光无法去除；需自行抠图去蓝光之后给到处理后素材和通道文件，可正常制作
提前准备绿幕避免使用蓝幕录制；
﻿
眼神不正视镜头，飘忽不定会有什么影响？
生产的形象眼神同样会飘忽不定
建议录制全程眼神正视镜头
﻿
开头未静默3s会有什么影响？
1. 可能造成生产的形象静默时嘴巴不闭合；
2. 训练时可以通过手动选取说话间的闭嘴帧作为静默帧，但可能有不自然的情况
建议开头静默1-3秒，口型保持闭合状态
﻿
发缝和碎发明显会有什么影响？
1. 头发主体区域之外的碎发在分割过程中会直接消失；
2. 发缝可能会造成外侧头发消失或闪动，也可能发缝分割不佳；
录制前整理头发，确保头发不会有发缝透出绿幕，尽量减少碎发
﻿
﻿
﻿
佩戴耳饰会有什么影响？
1. 画面中耳饰周围是绿幕时，分割后耳饰可能消失或闪动；
2. 耳饰周围是头发时，无影响，可正常分割
尽量不带耳饰，如佩戴耳饰，画面中耳饰需在头发范围内
﻿
佩戴金属饰品，纽扣，手表，项链等会有什么影响？
1. 易造成反绿，去绿后可能造成颜色变化或闪动；
2. 项链过粗或位于头部范围可能导致人脸识别失败
尽量不佩戴金属饰品，如佩戴需减少饰品的反绿程度
﻿
胳膊下方封闭处细小缝隙，腿部封闭缝隙会有什么影响？
在缝隙过暗的情况或极细小的粘连缝隙的情况下可能分割不佳；
拍摄时适当调整，增大或不漏出缝隙；
﻿
﻿
﻿
动作超出画面外会有什么影响？
生成的形象做相同动作时画面外的部位消失；训练时需人工选取动作不出框连续片段
在画面内动作，尽量不超出画面
﻿
﻿
﻿
人物复用性差的特定动作比较多（如，比数字123等）会有什么影响？
产出的形象随机动作播放时，这类动作和文本内容不匹配造成不自然
做动作时尽量做通用类型的动作
﻿
视频底噪大会有什么影响？
可能影响口型合成效果
建议采用麦克风进行录制；可以降低录制音量，相应的提高说话声音
﻿
使用桌子录制坐姿时需要注意什么？
需注意桌子无反绿情况出现；桌子稳定无晃动
﻿
﻿
是否可以录制侧身？
需要面部五官和口型全程完整露出，侧身幅度不要过大；
﻿
﻿
是否录制形象的时候一定要收音？
一定需要，且保证音画同步。算法训练口型需要画面和声音构成一组pair一起进入模型，因此需要画面对应的音频
﻿
﻿
补光灯，或者其他物体出镜怎么办？
1. 确保人物完整在绿幕中；
2. 其他不需要出现的物体跟人体在画面中无重叠交叉（有明显间距）
﻿
﻿
读错文本怎么办？
1. 视频素材录制过程中的读错字可以忽略
2. 声音录制过程中的读错字可以停顿两秒后将该句话再读一遍
﻿
﻿
是否可以使用客户自己准备的文本？
可以，且推荐客户读和所生产内容相符合类型的文本
﻿
﻿
二、声音复刻相关
问题表述
回答
优化建议
有混响和噪声会有什么影响？
易造成声音训练后效果不好
1. 录制时选择回音小、隔音好的房间（如卧室）；
2. 采用麦克风录音，通过麦克风设置减少噪音收入；
3. 通过后期修音处理降低混响和噪声来提升demo效果
普通话不标准会有什么影响？
声音训练后，发音可能会奇怪
建议使用发音标准、吐字清晰的普通话
ASR 分句不足50句会有什么影响？
整体录音时长短，导致句子少的，会严重影响声音效果，需要补充录制；
按照声音录制指引进行录制，满足100分句，10分钟以上
音频振幅过大（爆音）会有什么影响？
声音训练后的发音也有同样问题
可以调试录制设备来改善录音效果，或提供后期修音后的素材
音频口水音，换气声明显会有什么影响？
声音训练后的发音也有同样问题
录制过程中需注意避免，或提供后期修音后素材
音频录制的场地如何选择？
建议在较多软质材料的安静场所录制，如卧室，车内等
﻿
﻿

问题表述	回答	优化建议	示例图片
视频素材中，什么样的衣服会变色？	衣服含有黄色元素和绿色元素时，会变色	不要穿黄色，绿色，或是含有黄色和绿色元素的
视频素材中间存在剪辑，跳帧会有什么影响？	生成的形象在同样位置会跳帧，训练导出demo时可手动选择，但需保证至少1min以上连续片段	视频只可进行掐头去尾式编辑，提供的素材需是连续无间断的拍摄片段
视频素材有美颜美体造成抖动（脸部，腰部等）会有什么影响？	生成的形象同样位置会抖动，训练导出demo时可手动选择，但需保证至少1min以上连续片段	视频如需美颜美体，建议检查处理过后的画面有无抖动
视频素材中人物转头角度过大，大侧脸，仰头低头等会有什么影响？	1. 导致训练人脸检测失败，实际被训练的视频时长可能小于3min，影响最终口型效果； 2. 大角度偏转前后口型效果明显差	建议人物头部不要有大幅转动，拍摄斜坐角度需要保证口型完整露出；
视频素材中手部或者其他物体遮挡了面部或下巴会有什么影响？	1. 遮挡面部的，会导致训练提前结束，实际被训练的视频时长可能小于3min，影响最终口型效果； 2. 遮挡下巴的，训练后的形象，遮挡下巴的物体会有缺失（手部被口型覆盖）	手部在做动作时不要进入头部区域；保证脸部全程无间断露出
视频时长过短，不足3mins；视频时长不足，重复拼凑时长；视频重复读一段文字会有什么影响？	口型丰富度不够，会明显影响口型的效果	建议视频录制满足时长3 - 5分钟
镜头抖动会有什么影响？	生成的形象同样可能发生抖动；需人工选取画面稳定的连续片段进行训练，若无连续一分钟以上镜头稳定片段则需重新录制；	保证镜头固定足够稳定，拍摄全程无任何机位的变化
衣服，椅子，桌面等附属物与绿幕同色系会有什么影响？	1. 易造成分割效果不佳； 2. 去绿时，同色系附属物会受到影响产生颜色变化	避免穿偏绿色系衣物及使用偏绿色系道具
人物、桌椅道具大面积反绿光怎么办？	训练时需要进行较高等级的去绿可能使反绿的位置颜色失真；若不进行高等级的去绿可能造成产出的形象同样反绿光	优化拍摄环节
眼镜片反光，透绿怎么办？	眼镜片绿色的部分会被分割当成背景	拍摄时适当调整，尽量避免眼镜片透绿
如何减少绿光的反射到人身上？	1. 绿幕选择牛津布材质，背光安装，保证绿幕后方没有光线渗入； 2. 模特距离绿幕至少1.5米距离； 3. 对模特进行四面环绕打光，打掉轮廓上的绿光； 4. 绿幕和模特分开打光； 5. 可以把周围绿幕用黑布遮挡掉，只露出需要扣像的一块来减少漫射的光线
视频有多人声说话会有什么影响？	对口型识别造成干扰，影响口型合成的效果	尽量保证环境安静；若无法满足，可调试麦克收音范围减小其他人声录入或进行音频后期处理
使用蓝幕录制会有什么影响？	身上反蓝光无法去除；需自行抠图去蓝光之后给到处理后素材和通道文件，可正常制作	提前准备绿幕避免使用蓝幕录制；
眼神不正视镜头，飘忽不定会有什么影响？	生产的形象眼神同样会飘忽不定	建议录制全程眼神正视镜头
开头未静默3s会有什么影响？	1. 可能造成生产的形象静默时嘴巴不闭合； 2. 训练时可以通过手动选取说话间的闭嘴帧作为静默帧，但可能有不自然的情况	建议开头静默1-3秒，口型保持闭合状态
发缝和碎发明显会有什么影响？	1. 头发主体区域之外的碎发在分割过程中会直接消失； 2. 发缝可能会造成外侧头发消失或闪动，也可能发缝分割不佳；	录制前整理头发，确保头发不会有发缝透出绿幕，尽量减少碎发
佩戴耳饰会有什么影响？	1. 画面中耳饰周围是绿幕时，分割后耳饰可能消失或闪动； 2. 耳饰周围是头发时，无影响，可正常分割	尽量不带耳饰，如佩戴耳饰，画面中耳饰需在头发范围内
佩戴金属饰品，纽扣，手表，项链等会有什么影响？	1. 易造成反绿，去绿后可能造成颜色变化或闪动； 2. 项链过粗或位于头部范围可能导致人脸识别失败	尽量不佩戴金属饰品，如佩戴需减少饰品的反绿程度
胳膊下方封闭处细小缝隙，腿部封闭缝隙会有什么影响？	在缝隙过暗的情况或极细小的粘连缝隙的情况下可能分割不佳；	拍摄时适当调整，增大或不漏出缝隙；
动作超出画面外会有什么影响？	生成的形象做相同动作时画面外的部位消失；训练时需人工选取动作不出框连续片段	在画面内动作，尽量不超出画面
人物复用性差的特定动作比较多（如，比数字123等）会有什么影响？	产出的形象随机动作播放时，这类动作和文本内容不匹配造成不自然	做动作时尽量做通用类型的动作
视频底噪大会有什么影响？	可能影响口型合成效果	建议采用麦克风进行录制；可以降低录制音量，相应的提高说话声音
使用桌子录制坐姿时需要注意什么？	需注意桌子无反绿情况出现；桌子稳定无晃动
是否可以录制侧身？	需要面部五官和口型全程完整露出，侧身幅度不要过大；
是否录制形象的时候一定要收音？	一定需要，且保证音画同步。算法训练口型需要画面和声音构成一组pair一起进入模型，因此需要画面对应的音频
补光灯，或者其他物体出镜怎么办？	1. 确保人物完整在绿幕中； 2. 其他不需要出现的物体跟人体在画面中无重叠交叉（有明显间距）
读错文本怎么办？	1. 视频素材录制过程中的读错字可以忽略 2. 声音录制过程中的读错字可以停顿两秒后将该句话再读一遍
是否可以使用客户自己准备的文本？	可以，且推荐客户读和所生产内容相符合类型的文本

形象和声音复刻常见问题

本页目录：

一、形象定制相关

二、声音复刻相关