前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >极速高清:让视频更小更清晰,迈向高品质视频

极速高清:让视频更小更清晰,迈向高品质视频

作者头像
腾讯大讲堂
发布于 2020-11-06 01:40:10
发布于 2020-11-06 01:40:10
1.8K0
举报

| 导语  视频是当前网络媒体主要形式和网络带宽资源的主要消耗者。通过降低分辨率和增加压缩比率,人们可以将视频以较小的网络带宽消耗进行传输,但降质传输的视频画质效果很影响用户观看体验。因此如何让视频以更小的带宽传输,再通过修复增强算法恢复出高清画质,实现“美”的共享,给视频技术提出了新的挑战。在此背景下,极速高清团队以低带宽占用下为用户提供更好的视频体验为目标,提出了包括画质修复与增强、内容自适应参数选择、高质量编码器等一整套视频处理解决方案。其中,在画质增强修复中提出的“AR-SR”方案,在AIIA 2020人工智能开发者大会专项赛事旷视超分辨率大赛中取得冠军,下面带来关于“AR-SR”方案的技术分享。

(左:受损画质 右:AR-SR提升结果)

“AR-SR”网络设计结合汇聚层及空间注意力机制,充分挖掘压缩失真和纹理的模式信息,并依据对压缩失真和纹理的分析,在SOTA的RIR(residual in residual)结构上进一步改进,在合理的层数设计上添加了内外两层跳跃连接,提高了网络模型的稳定性。并提出解耦信噪特征损失函数(disentangled loss),通过端到端地引导网络对伪影和纹理加以区分,增加网络可控与可解释性的同时,让网络拥有良好的伪影去除及边缘保持特性,保证客观指标得分的前提下,能够进一步提升画质主观效果。

01

AR-SR结构设计

在结构设计上,“AR-SR"具有以下几个特点。

  • 多级汇聚层:网络主干使用了残差内残差的baseline结构,创新地在内外层的两级残差均添加了汇聚层模块,用于充分挖掘浅层、中层信息,即压缩失真和纹理的模式。这是很多现有算法忽略到的部分。
  • 轻量像素注意力:使用了轻量级模块提取像素注意力。该模块与汇聚层结合能更好地挖掘特征中的信息,减少参数冗余。研究发现汇聚层和注意力机制的作用有1+1>2的效应。
  • 多帧融合:时移模块(Temporal shift),该模块是一种轻量的时域信息迁移模块。相关成果比较新,目前还很少有在底层视觉运用,唯一接近的工作是图像修补。
  • 子像素提取模块:像素重新排列,相较转置卷积速度更快,且没有棋盘效应。
  • 压缩失真和纹理分析:分析了退化数据的压缩伪影和真实纹理的分布和模式,通过可视化(如下图右侧)像素误差信息,添加必要的连接(下图左侧),让网络更好辨别二者。
  • 模型选择:通过分析模型效果的方差,挑选出泛化能力更强的模型。该方法简单有效,在实际应用中经常采取该策略。

每个技术点的实际收益如下图所示,可以看到多级汇聚技术带来的收益最为明显。

“AR-SR”网络模块设计灵活,以此为基础,后续很方便改造为高效的、适用多种降质任务的轻量网络。

02

AR-SR损失函数设计

一直以来,AI技术的可控性和可解释性都是比较差的,因此深度学习也常常给与人们一种捉摸不透的“黑盒子“印象。现有超分辨率算法在遇到严重的噪声/伪影干扰时,表现性能会大幅下降。具体表现为会放大噪声/伪影等错误的高频信息,产生严重影响观感的bad case。同时现有数据驱动的去压缩失真、去噪算法也伴随着像素平均化的影响,出现over-smooth的现象。

团队设计了“对症下药“的解耦信噪特征损失函数(disentangled loss),根据编解码知识的先验,使得网络可以智能感知编码量化带来的块效应、振铃效应以及各种复杂的伪影现象,如下图所示,黑色标记为失真伪影。

解耦信噪特征损失函数(disentangled loss),通过端到端地引导网络去区分像素属于伪影还是纹理,增加网络的可控与可解释性。其他算法(包括编解码的环路滤波、传统图像算法、现有state-of-the-art的深度学习网络)没有足够可靠的机制与统一的公式去判断压缩块的边界是量化产生还是真实就有的。借助这项自研的像素区域分类损失,和像素级重建损失结合,这项技术不仅能够在测试数据上展现明显领先的客观指标分数,同时能大大缓解over-smooth的现象,取得了“黑科技“般的主观效果。

(左:受损画质 右:AR-SR提升结果)

(左:受损画质 右:AR-SR提升结果)

同时,“AR-SR”是深度学习技术和编解码先验知识结合的一次实践。团队下一步的计划是在传统图像处理、视频编解码的先验知识中挖掘更多可供利用的信息,指导网络结构的设计,使其更高效可控。这是目前网络结构搜索(NAS)等方式所不具备的能力。

03

算法意义

往往视频上行路线中,受限于用户拍摄条件有限或上行网络带宽限制,需要对拍摄源视频降低分辨率、使用较低码率压缩,或经历多次的压缩过程,从而给视频带来了很大的采样损失和量化损失,很大程度影响用户观感体验。对于这种场景,可以在转码端对源视频使用团队改造后“AR-SR”方案进行画质提升,修复压缩带来的损耗和恢复原分辨率信号,给下行用户提供高画质的视频流。

04

画质技术

极速高清包括画质修复与增强、内容自适应参数选择、高质量编码器等一整套视频处理解决方案,挑战编码极限,在最低的码率情况下提升视频的主观画质体验,让视频更小更清晰。

画质提升技术:结合编码、传统算法、AI算法的多种自适应视频画质提升技术,一方面去除多余噪声,节省码率,另一方面提升视频画质,加大码率压缩空间,为编码器提供一个更好的输入源,辅助编码器输出低码率高画质的压缩效果。

▼近期热文▼

用户访谈(一):如何做好访谈前的准备工作

用户访谈(二):如何进行一场有效的访谈?

渠道质量评估模型

喜欢本文?快点“在看”支持一下

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-11-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯大讲堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
如何利用深度学习提升视频转码效率与视觉质量?
视频处理平台的核心功能是视频转码,而转码压缩的过程势必会造成视频质量的损失。腾讯音视频实验室技术专家高孟平在LiveVideoStackCon 线上交流分享中根据腾讯丽影平台的开发实践经验,详细介绍了如何利用深度学习在提升视频转码压缩效率的同时提供更高的人眼视觉质量。在LiveVideoStackCon 2019上海 音视频技术大会中,高孟平博士还将介绍无参考质量评估在视频增强的进展与应用。 文 / 高孟平 整理 / LiveVideoStack 直播回放 https://www2.tutormeetpl
LiveVideoStack
2019/07/01
1.7K0
如何利用深度学习提升视频转码效率与视觉质量?
攻城狮手记 | 既高清又低码?腾讯明眸帮你两者兼得
随着近几年视频行业的井喷,短视频、社交媒体、电商带货、视频会议等泛媒体类应用大规模增长,人们对高画质、低延时的需求愈发强烈。 而腾讯明眸正是聚焦于“极速高清”和“画质重生”两大功能,利用腾讯云领先的编解码和媒体处理技术与AI技术融合打造的音视频技术品牌。在各类媒体业务中,腾讯明眸都能够为用户提供画质更好,码率更低的媒体处理服务。 下面我们就一同来了解一下这个让你能够“鱼与熊掌兼得”的黑科技以及它背后的工程师团队吧! “17年,音视频应用平台开始将关注点转向带宽成本、观看体验。我们也在这个时候开
腾讯云音视频
2021/09/28
1.2K0
极速高清——给你带来全新的高清视野
很生气!!!我才刚落地,就因游戏界面糊了一下,阻止了我捡枪的步伐,就被不知道从哪蹿出来的家伙给打死了!!!瞬间落地成盒!!!
腾讯云音视频
2018/09/12
3.3K1
极速高清——给你带来全新的高清视野
快手智能处理与编码算法产品化之路
视频转码过程中涉及方方面面的视频图像算法,如何将算法有机地结合起来,打造成为行业领先的视频转码算法产品?通过多年的业务场景打磨和积累,快手音视频走出了一条自己的产品化之路。LiveVideoStackCon 2022北京站邀请到了快手视频图像算法引擎负责人陈宇聪,为我们介绍视频图像引擎Atlas和智能转码算法框架CAPE的发展历程,以及「质臻影音」「质臻轻流」等转码产品的推出和应用。 文/陈宇聪 编辑/LiveVideoStack 大家好,2018年我加⼊快⼿,主导了快⼿⾃研编解码算法KVC 1.0的预研、
LiveVideoStack
2023/04/26
9290
快手智能处理与编码算法产品化之路
视频压缩世界中的挑战
本次演讲来自PCS2021,演讲者是来自Netflix视频编码算法团队的的Kyle Swanson和Mariana Afonso,主要将谈论Netflix是如何处理视频压缩以及存在的一些挑战。
用户1324186
2021/07/29
9050
快手质臻影音:视频智能修复及增强技术
  //   编者按:快手平台上视频类型繁多,且视频源的画面质量存在较大差异。“面对种类多且质量差异较大的视频,如何让用户获得更清晰的观看体验?”对于这一问题,快手音视频技术团队深入研究智能音视频修复及增强处理等相关技术,打造“快手质臻影音”,为用户提供极致视频体验。本次LiveVideoStackCon 2022上海站大会,我们邀请到了快手音视频高级算法工程师何刚老师,为我们分享了快手平台视频多样性和处理挑战;针对这些挑战提出的智能修复和增强算法;以及质臻影音的落地方案。 文/何刚 整理/LiveVide
LiveVideoStack
2022/10/11
1.5K0
快手质臻影音:视频智能修复及增强技术
淘宝直播窄带高清技术
本次分享内容主要分为五个部分,首先是全民直播大时代的背景介绍,第二是直播痛点分析,第三是淘宝直播窄带高清技术,第四是音视频技术趋势探讨,最后是在线互动。
LiveVideoStack
2020/08/19
1.7K0
新知 | 腾讯明眸·极速高清 —— 更高清更低码率的媒体处理技术方案
今天的新知系列课,我们邀请到了来自腾讯明眸·极速高清团队的技术导师 —— 刘兆瑞,为大家介绍腾讯云音视频在视频编码优化以及工程落地上的一些新的方向。本次分享分为4个部分,包括当前媒体处理的行业趋势 ,腾讯明眸产品介绍,腾讯明眸·极速高清技术方案及其优化演进之路以及极速高清方案的未来发展之路。 本周五晚上7:30,我们将会在腾讯云音视频视频号、开源中国、InfoQ、51CTO、云+社区等多个平台进行第六期课程的直播,大家千万不要错过哦~ - 当前媒体处理的行业趋势 - 腾讯视频云作为头部云厂商,服
腾讯云音视频
2021/12/24
1.9K0
新知 | 腾讯明眸画质增强 —— 数据驱动下的AI媒体处理
腾讯云音视频画质增强研究团队专注于多媒体技术领域的前沿前沿技术探索、研发、应用和落地。今天的新知系列课,我们邀请到了来自该研究团队的技术导师 —— 陈铭良,为大家介绍他们团队在媒体画质增强工作上的一些方法积累和能力优势。目前他们在画质增强的工作上积极跟进前沿的深度学习算法,并针对性的提出了一些适合于落地的解决方案。通过数据驱动的自动建模和基于AI的媒体处理,部分方法的效果已经超过了当前学术上的state-of-the-art,领先于竞品。 接下来的几周,每周四晚上7:30,我们都会在腾讯云音视频视频号
腾讯云音视频
2021/12/11
1.3K0
纵贯南北横跨古今,腾讯云音视频老片修复技术唤醒老北京中轴记忆
当地时间2024年7月27日,在印度新德里召开的联合国教科文组织第46届世界遗产大会上,“北京中轴线——中国理想都城秩序的杰作”通过决议,被列入《世界遗产名录》,成为中国第59项世界遗产!北京中轴线纵贯北京老城南北,北起钟鼓楼,南至永定门,全长7.8公里,15处遗产构成要素如颗颗明珠汇聚,历史文脉,绵延不绝。
小腾资讯君
2024/08/12
1640
工程实践,淘宝直播高画质低延时技术探索
目前5G新基建正在迈入起航阶段,5G相比目前广泛使用的4G,它具有更高的速率,更大的容量,同时延迟更低,可靠性更高。在5G时代,视频得益于网络带宽的提升,未来将成为主流的传播媒介。越来越多的业务和应用将视频化,直播化。大量互动的内容将通过5G以低延时的方式以视频的形式传输。
CV君
2020/11/09
1.3K0
工程实践,淘宝直播高画质低延时技术探索
纵贯南北横跨古今,腾讯云音视频老片修复技术唤醒老北京中轴记忆
北京中轴线历经逾7个世纪的历代承续,跨越千百时光。其秩序井然、气势恢宏的城市建筑群不仅是中国古代建筑艺术的杰出代表,更是彰显中华文明文化传承的灵魂纽带。中轴线申遗成功之际,学习强国围绕“北京中轴线”上线“老照片里的北京记忆”互动玩法,穿越百年时光,腾讯云音视频以AI老片修复技术,复原了100多年前拍摄留存的北京中轴线老照片。
腾讯云音视频
2024/08/11
2070
纵贯南北横跨古今,腾讯云音视频老片修复技术唤醒老北京中轴记忆
技术解码 | 视频云全链路媒体处理解决方案
随着近几年视频行业的爆发增长,各个业务场景对视频处理的需求越来越高。本周的技术解码就由段争志老师带大家一起探秘腾讯云视频云全链路媒体处理解决方案中的关键技术。 近几年视频行业喷井式爆发,短视频APP、社交媒体、电商带货、直播会议、线上教育等等各种泛媒体类应用大规模增长的同时,人们对高清/超高清、低延时、高画质的需求也越来越强烈。腾讯云视频云依托自身多年的视频技术的积累以及众多业务应用的落地优化实践,不断完善自身产品体系,优化性能,结合用户业务场景不断创新,提供一整套集视频质检、画质修复增强、编码、
腾讯云音视频
2020/08/17
2.6K0
腾讯云画质增强技术的前沿应用
全真互联时代,音视频技术内核不断更新迭代,越来越多的前沿探索开始落地应用。在LiveVideoStackCon 2022 北京站·腾讯云音视频专场上,腾讯多媒体实验室视频技术研发负责人夏珍为广大开发者们分享了腾讯云在画质增强技术方面的一些前沿探索和应用。 文/夏珍 编辑/LiveVideoStack 本次分享的主题是《画质增强的前沿应用》,内容包括三部分:一是画质增强技术现状,二是画质增强技术的前沿应用,三是画质增强技术的趋势。 画质增强 - 现状 4K/8K超高清、VR、3D等一直是人们热议的话题,
腾讯云音视频
2023/05/04
8.7K0
腾讯云画质增强技术的前沿应用
胡渣都能看得清!看了张国荣《热·情》演唱会超清修复版,我们和技术修复师聊了聊
迫不及待地点开,扑面而来的清晰度和真实感让人眼前一亮。要知道,从前观看的视频都是损伤画质,堪称时代的眼泪,荣迷们虽甘之如饴,但如果有高清画质,当真是求之不得。
AI掘金志
2022/04/11
5610
胡渣都能看得清!看了张国荣《热·情》演唱会超清修复版,我们和技术修复师聊了聊
视频技术入门指南
你真的理解视频技术吗?什么是帧率、分辨率、码率?它们之间有什么关系?你知道“1080p”和“4K”中的“p”和“K”代表什么吗?如何描述视频质量?蓝光光盘(Blu-ray Disc)究竟是什么?H.264/AVC、H.265/HEVC、AV1 等编解码器有什么区别?苹果的 Apple ProRes 又有什么特殊用途?HDR 和杜比视界(Dolby Vision)是什么?为什么视频文件有.mp4、.mkv、.flv 等多种后缀?
timerring
2025/02/11
1250
视频编解码优化以及与AI的实践结合
大家好,我是RealNetworks的况超,本次演讲的主题是视频编解码优化以及与AI的实践结合,虽然我不是AI技术的专家,但在做视频编解码的后期也会用到一些AI的技术,所以也会与大家一起分享这部分的内容。
LiveVideoStack
2019/10/21
1.7K0
视频编解码优化以及与AI的实践结合
AI视觉,视频云新挑战的解决之道
正文字数:4204  阅读时长:6分钟 AI就像一个加速器,正在渗透在多媒体应用的方方面面,改进甚至颠覆传统的图像视频处理方法。本文整理自腾讯云高级研发工程师刘兆瑞在LiveVideoStackCon 2020北京站上的演讲,将从超低码率压缩场景下AI技术在前置处理中的优化、AI技术的画质修复探索以及智能编辑场景的落地实践三个方面展开。 文 / 刘兆瑞 整理 / LiveVideoStack 大家好,首先非常荣幸有机会收到LiveVideoStack邀请来和大家分享腾讯视频云在AI视觉上的落地实践与
腾讯云音视频
2020/11/27
1K0
你在直播间看到的高清1080P,可能还没720P画质好
为了提供更好的直播体验,弥补不同硬件和开播环境的缺陷,声网最新发布的“实时高清·超级画质”就解决了这一难题。
量子位
2023/08/05
2970
你在直播间看到的高清1080P,可能还没720P画质好
AI视觉,视频云新挑战的解决之道
大家好,首先非常荣幸有机会收到LiveVideoStack邀请来和大家分享腾讯视频云在AI视觉上的落地实践与应用,以及AI视觉泛化应用过程遇到的机遇和挑战。
LiveVideoStack
2020/11/26
2.8K0
AI视觉,视频云新挑战的解决之道
推荐阅读
相关推荐
如何利用深度学习提升视频转码效率与视觉质量?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档