一、形象定制相关
问题表述 | 回答 | 优化建议 | 示例图片 |
视频素材中间存在剪辑,跳帧会有什么影响? | 生成的形象在同样位置会跳帧,训练导出demo时可手动选择,但需保证至少1min以上连续片段 | 视频只可进行掐头去尾式编辑,提供的素材需是连续无间断的拍摄片段 | |
视频素材有美颜美体造成抖动(脸部,腰部等)会有什么影响? | 生成的形象同样位置会抖动,训练导出demo时可手动选择,但需保证至少1min以上连续片段 | 视频如需美颜美体,建议检查处理过后的画面有无抖动 | |
视频素材中人物转头角度过大,大侧脸,仰头低头等会有什么影响? | 1. 导致训练人脸检测失败,实际被训练的视频时长可能小于3min,影响最终口型效果; 2. 大角度偏转前后口型效果明显差 | 建议人物头部不要有大幅转动,拍摄斜坐角度需要保证口型完整露出; | |
视频素材中手部或者其他物体遮挡了面部或下巴会有什么影响? | 1. 遮挡面部的,会导致训练提前结束,实际被训练的视频时长可能小于3min,影响最终口型效果; 2. 遮挡下巴的,训练后的形象,遮挡下巴的物体会有缺失(手部被口型覆盖) | 手部在做动作时不要进入头部区域;保证脸部全程无间断露出 | |
视频时长过短,不足3mins; 视频时长不足,重复拼凑时长; 视频重复读一段文字会有什么影响? | 口型丰富度不够,会明显影响口型的效果 | 建议视频录制满足时长3 - 5分钟 | |
镜头抖动会有什么影响? | 生成的形象同样可能发生抖动;需人工选取画面稳定的连续片段进行训练,若无连续一分钟以上镜头稳定片段则需重新录制; | 保证镜头固定足够稳定,拍摄全程无任何机位的变化 | |
衣服,椅子,桌面等附属物与绿幕同色系会有什么影响? | 1. 易造成分割效果不佳; 2. 去绿时,同色系附属物会受到影响产生颜色变化 | 避免穿偏绿色系衣物及使用偏绿色系道具 | |
人物、桌椅道具大面积反绿光怎么办? | 训练时需要进行较高等级的去绿可能使反绿的位置颜色失真;若不进行高等级的去绿可能造成产出的形象同样反绿光 | 优化拍摄环节 | |
眼镜片反光,透绿怎么办? | 眼镜片绿色的部分会被分割当成背景 | 拍摄时适当调整,尽量避免眼镜片透绿 | |
如何减少绿光的反射到人身上? | 1. 绿幕选择牛津布材质,背光安装,保证绿幕后方没有光线渗入; 2. 模特距离绿幕至少1.5米距离; 3. 对模特进行四面环绕打光,打掉轮廓上的绿光; 4. 绿幕和模特分开打光; 5. 可以把周围绿幕用黑布遮挡掉,只露出需要扣像的一块来减少漫射的光线 | | |
视频有多人声说话会有什么影响? | 对口型识别造成干扰,影响口型合成的效果 | 尽量保证环境安静;若无法满足,可调试麦克收音范围减小其他人声录入或进行音频后期处理 | |
使用蓝幕录制会有什么影响? | 身上反蓝光无法去除;需自行抠图去蓝光之后给到处理后素材和通道文件,可正常制作 | 提前准备绿幕避免使用蓝幕录制; | |
眼神不正视镜头,飘忽不定会有什么影响? | 生产的形象眼神同样会飘忽不定 | 建议录制全程眼神正视镜头 | |
开头未静默3s会有什么影响? | 1. 可能造成生产的形象静默时嘴巴不闭合; 2. 训练时可以通过手动选取说话间的闭嘴帧作为静默帧,但可能有不自然的情况 | 建议开头静默1-3秒,口型保持闭合状态 | |
发缝和碎发明显会有什么影响? | 1. 头发主体区域之外的碎发在分割过程中会直接消失; 2. 发缝可能会造成外侧头发消失或闪动,也可能发缝分割不佳; | 录制前整理头发,确保头发不会有发缝透出绿幕,尽量减少碎发 | |
佩戴耳饰会有什么影响? | 1. 画面中耳饰周围是绿幕时,分割后耳饰可能消失或闪动; 2. 耳饰周围是头发时,无影响,可正常分割 | 尽量不带耳饰,如佩戴耳饰,画面中耳饰需在头发范围内 | |
佩戴金属饰品,纽扣,手表,项链等会有什么影响? | 1. 易造成反绿,去绿后可能造成颜色变化或闪动; 2. 项链过粗或位于头部范围可能导致人脸识别失败 | 尽量不佩戴金属饰品,如佩戴需减少饰品的反绿程度 | |
胳膊下方封闭处细小缝隙,腿部封闭缝隙会有什么影响? | 在缝隙过暗的情况或极细小的粘连缝隙的情况下可能分割不佳; | 拍摄时适当调整,增大或不漏出缝隙; | |
动作超出画面外会有什么影响? | 生成的形象做相同动作时画面外的部位消失;训练时需人工选取动作不出框连续片段 | 在画面内动作,尽量不超出画面 | |
人物复用性差的特定动作比较多(如,比数字123等)会有什么影响? | 产出的形象随机动作播放时,这类动作和文本内容不匹配造成不自然 | 做动作时尽量做通用类型的动作 | |
视频底噪大会有什么影响? | 可能影响口型合成效果 | 建议采用麦克风进行录制;可以降低录制音量,相应的提高说话声音 | |
使用桌子录制坐姿时需要注意什么? | 需注意桌子无反绿情况出现;桌子稳定无晃动 | | |
是否可以录制侧身? | 需要面部五官和口型全程完整露出,侧身幅度不要过大; | | |
是否录制形象的时候一定要收音? | 一定需要,且保证音画同步。算法训练口型需要画面和声音构成一组pair一起进入模型,因此需要画面对应的音频 | | |
补光灯,或者其他物体出镜怎么办? | 1. 确保人物完整在绿幕中; 2. 其他不需要出现的物体跟人体在画面中无重叠交叉(有明显间距) | | |
读错文本怎么办? | 1. 视频素材录制过程中的读错字可以忽略 2. 声音录制过程中的读错字可以停顿两秒后将该句话再读一遍 | | |
是否可以使用客户自己准备的文本? | 可以,且推荐客户读和所生产内容相符合类型的文本 | | |
二、声音复刻相关
问题表述 | 回答 | 优化建议 |
有混响和噪声会有什么影响? | 易造成声音训练后效果不好 | 1. 录制时选择回音小、隔音好的房间(如卧室); 2. 采用麦克风录音,通过麦克风设置减少噪音收入; 3. 通过后期修音处理降低混响和噪声来提升demo效果 |
普通话不标准会有什么影响? | 声音训练后,发音可能会奇怪 | 建议使用发音标准、吐字清晰的普通话 |
ASR 分句不足50句会有什么影响? | 整体录音时长短,导致句子少的,会严重影响声音效果,需要补充录制; | 按照声音录制指引进行录制,满足100分句,10分钟以上 |
音频振幅过大(爆音)会有什么影响? | 声音训练后的发音也有同样问题 | 可以调试录制设备来改善录音效果,或提供后期修音后的素材 |
音频口水音,换气声明显会有什么影响? | 声音训练后的发音也有同样问题 | 录制过程中需注意避免,或提供后期修音后素材 |
音频录制的场地如何选择? | 建议在较多软质材料的安静场所录制,如卧室,车内等 | |