腾讯云智能数智人
文档中心>腾讯云智能数智人>形象和声音复刻常见问题

形象和声音复刻常见问题

最近更新时间:2024-10-30 14:53:41

我的收藏

一、形象定制相关

问题表述
回答
优化建议
示例图片
视频素材中间存在剪辑,跳帧会有什么影响?
生成的形象在同样位置会跳帧,训练导出demo时可手动选择,但需保证至少1min以上连续片段
视频只可进行掐头去尾式编辑,提供的素材需是连续无间断的拍摄片段



视频素材有美颜美体造成抖动(脸部,腰部等)会有什么影响?
生成的形象同样位置会抖动,训练导出demo时可手动选择,但需保证至少1min以上连续片段
视频如需美颜美体,建议检查处理过后的画面有无抖动

视频素材中人物转头角度过大,大侧脸,仰头低头等会有什么影响?
1. 导致训练人脸检测失败,实际被训练的视频时长可能小于3min,影响最终口型效果;
2. 大角度偏转前后口型效果明显差
建议人物头部不要有大幅转动,拍摄斜坐角度需要保证口型完整露出;



视频素材中手部或者其他物体遮挡了面部或下巴会有什么影响?
1. 遮挡面部的,会导致训练提前结束,实际被训练的视频时长可能小于3min,影响最终口型效果;
2. 遮挡下巴的,训练后的形象,遮挡下巴的物体会有缺失(手部被口型覆盖)
手部在做动作时不要进入头部区域;保证脸部全程无间断露出



视频时长过短,不足3mins;
视频时长不足,重复拼凑时长;
视频重复读一段文字会有什么影响?
口型丰富度不够,会明显影响口型的效果
建议视频录制满足时长3 - 5分钟

镜头抖动会有什么影响?
生成的形象同样可能发生抖动;需人工选取画面稳定的连续片段进行训练,若无连续一分钟以上镜头稳定片段则需重新录制;
保证镜头固定足够稳定,拍摄全程无任何机位的变化



衣服,椅子,桌面等附属物与绿幕同色系会有什么影响?
1. 易造成分割效果不佳;
2. 去绿时,同色系附属物会受到影响产生颜色变化
避免穿偏绿色系衣物及使用偏绿色系道具



人物、桌椅道具大面积反绿光怎么办?
训练时需要进行较高等级的去绿可能使反绿的位置颜色失真;若不进行高等级的去绿可能造成产出的形象同样反绿光
优化拍摄环节



眼镜片反光,透绿怎么办?
眼镜片绿色的部分会被分割当成背景
拍摄时适当调整,尽量避免眼镜片透绿



如何减少绿光的反射到人身上?
1. 绿幕选择牛津布材质,背光安装,保证绿幕后方没有光线渗入;
2. 模特距离绿幕至少1.5米距离;
3. 对模特进行四面环绕打光,打掉轮廓上的绿光;
4. 绿幕和模特分开打光;
5. 可以把周围绿幕用黑布遮挡掉,只露出需要扣像的一块来减少漫射的光线


视频有多人声说话会有什么影响?
对口型识别造成干扰,影响口型合成的效果
尽量保证环境安静;若无法满足,可调试麦克收音范围减小其他人声录入或进行音频后期处理

使用蓝幕录制会有什么影响?
身上反蓝光无法去除;需自行抠图去蓝光之后给到处理后素材和通道文件,可正常制作
提前准备绿幕避免使用蓝幕录制;

眼神不正视镜头,飘忽不定会有什么影响?
生产的形象眼神同样会飘忽不定
建议录制全程眼神正视镜头

开头未静默3s会有什么影响?
1. 可能造成生产的形象静默时嘴巴不闭合;
2. 训练时可以通过手动选取说话间的闭嘴帧作为静默帧,但可能有不自然的情况
建议开头静默1-3秒,口型保持闭合状态

发缝和碎发明显会有什么影响?
1. 头发主体区域之外的碎发在分割过程中会直接消失;
2. 发缝可能会造成外侧头发消失或闪动,也可能发缝分割不佳;
录制前整理头发,确保头发不会有发缝透出绿幕,尽量减少碎发



佩戴耳饰会有什么影响?
1. 画面中耳饰周围是绿幕时,分割后耳饰可能消失或闪动;
2. 耳饰周围是头发时,无影响,可正常分割
尽量不带耳饰,如佩戴耳饰,画面中耳饰需在头发范围内

佩戴金属饰品,纽扣,手表,项链等会有什么影响?
1. 易造成反绿,去绿后可能造成颜色变化或闪动;
2. 项链过粗或位于头部范围可能导致人脸识别失败
尽量不佩戴金属饰品,如佩戴需减少饰品的反绿程度

胳膊下方封闭处细小缝隙,腿部封闭缝隙会有什么影响?
在缝隙过暗的情况或极细小的粘连缝隙的情况下可能分割不佳;
拍摄时适当调整,增大或不漏出缝隙;



动作超出画面外会有什么影响?
生成的形象做相同动作时画面外的部位消失;训练时需人工选取动作不出框连续片段
在画面内动作,尽量不超出画面



人物复用性差的特定动作比较多(如,比数字123等)会有什么影响?
产出的形象随机动作播放时,这类动作和文本内容不匹配造成不自然
做动作时尽量做通用类型的动作

视频底噪大会有什么影响?
可能影响口型合成效果
建议采用麦克风进行录制;可以降低录制音量,相应的提高说话声音

使用桌子录制坐姿时需要注意什么?
需注意桌子无反绿情况出现;桌子稳定无晃动


是否可以录制侧身?
需要面部五官和口型全程完整露出,侧身幅度不要过大;


是否录制形象的时候一定要收音?
一定需要,且保证音画同步。算法训练口型需要画面和声音构成一组pair一起进入模型,因此需要画面对应的音频


补光灯,或者其他物体出镜怎么办?
1. 确保人物完整在绿幕中;
2. 其他不需要出现的物体跟人体在画面中无重叠交叉(有明显间距)


读错文本怎么办?
1. 视频素材录制过程中的读错字可以忽略
2. 声音录制过程中的读错字可以停顿两秒后将该句话再读一遍


是否可以使用客户自己准备的文本?
可以,且推荐客户读和所生产内容相符合类型的文本



二、声音复刻相关

问题表述
回答
优化建议
有混响和噪声会有什么影响?
易造成声音训练后效果不好
1. 录制时选择回音小、隔音好的房间(如卧室);
2. 采用麦克风录音,通过麦克风设置减少噪音收入;
3. 通过后期修音处理降低混响和噪声来提升demo效果
普通话不标准会有什么影响?
声音训练后,发音可能会奇怪
建议使用发音标准、吐字清晰的普通话
ASR 分句不足50句会有什么影响?
整体录音时长短,导致句子少的,会严重影响声音效果,需要补充录制;
按照声音录制指引进行录制,满足100分句,10分钟以上
音频振幅过大(爆音)会有什么影响?
声音训练后的发音也有同样问题
可以调试录制设备来改善录音效果,或提供后期修音后的素材
音频口水音,换气声明显会有什么影响?
声音训练后的发音也有同样问题
录制过程中需注意避免,或提供后期修音后素材
音频录制的场地如何选择?
建议在较多软质材料的安静场所录制,如卧室,车内等