今天和大家讨论下什么是生成合成类(深度合成)类算法?
“生成合成类(深度合成)算法”是指自动或辅助生成、编辑文本、图像、语音、视频等网络信息内容的算法。深度合成技术,是指利用以深度学习、虚拟现实为代表的生成合成类算法制作文本、图像、音频、视频、虚拟场景等信息的技术。(《互联网信息服务深度合成管理规定》)
案例1:钉钉语音识别算法,应用于即时通讯场景的语音转文字功能,实现对语音消息的文字识别。
案例2:快手短视频生成合成算法,应用于短视频制作场景,利用生成模型对用户上传图片、视频进行编辑和重新生成,实现属性编辑、风格转换等。
算法基本原理:通过对用户上传的图片或者视频进行识别,将用户上传 的图片或视频按照 APP 已有模板进行编辑和重新生成,输出 相关的图片或短视频内容,包括人脸属性编辑、人脸动作迁 移、人体动作迁移等。
算法运行机制:该算法落地在快手 APP 的拍摄、图片和视频编辑等功能上,使用用户上传的图片、视频等信息,利用生成对抗网络 等生成式技术,将用户上传的图片或视频加以编辑和重新生 成,然后以魔表特效和快闪 MV 模板的形式为用户提供特效 生成服务,用于提升以人为中心的特效拍摄体验。
算法应用场景:快手 APP 短视频制作
算法目的意图:该算法主要用于提升以人为中心的特效拍摄体验,实现 功能包含常见人脸属性编辑、动作属性编辑和风格化转换 等,为用户提供更高效优质的内容生产体验。
欢迎大家给我留言
领取专属 10元无门槛券
私享最新 技术干货