前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >视频编码性能提升新途径——面向编码的动态预/后处理技术

视频编码性能提升新途径——面向编码的动态预/后处理技术

作者头像
用户1324186
发布于 2018-03-05 09:25:29
发布于 2018-03-05 09:25:29
1.6K0
举报
文章被收录于专栏:媒矿工厂媒矿工厂

2017年9月17日至20日,IEEE国际图像处理会议(ICIP 2017)在北京国家会议中心举办,国内外许多学术界以及工业界的专家学者们都与会进行交流与讨论。9月20日早,旨在使用图像恢复方法来提升编码效率的Grand Challenge环节中,我们作为唯一的参赛者进行了技术分享。主办方希望可以征集一种类似于HEVC标准中后处理的方法来提升编码效率,与传统不同的是,可以使用伴随码流传输的辅助信息在解码器上帮助图像复原,其中辅助信息可以在编码端进行提取与压缩。为了将图像复原技术更好结合到视频压缩之中,这里也推荐采用独立于编解码器的环外滤波结构。

基于上述要求,我们提出一种基于卷积神经网络(CNN)的后处理滤波器,并且采用环外结构将其应用在HEVC编解码器中。我们提出的编码结构如图1:

图1 编码框架

这个结构中,主要包含三个模块:镜头检测,视频分类,以及后处理滤波。在这个编码框架中,主要思想是将视频根据复杂度以及压缩质量进行分类,然后对每一类别分别进行滤波,而该分类信息也将作为一个辅助信息在码流中进行传输。

镜头检测:

镜头检测的任务是将输入的视频序列划分为多个连续的镜头,而这里镜头是指在一段不间断的时间中,由单个相机采集的子序列。而在一个镜头中,每一帧内容较为相近,以镜头为基本单位进行复杂度分类的方法也较为合理。所以在该结构中,视频首先输入镜头检测模块,从而划分为很多子序列,也是一个自适应划分GOP 的过程。

视频分类:

接下来,每个子序列一方面进入到编码器进行压缩,另一路进入到与编码器并行的分类模块。我们在复杂度和压缩质量两个方面进行分类。这里复杂度分为空间复杂度(SI)以及时间复杂度(TI)。其计算方法如下:

先对测试序列进行分析,得到若干组(SI,TI),并且使用K-means的算法将其分成三类,分部代表高,中,低三种复杂度,每一复杂度取中值作为分类指标。当然,因为这里任务是图像复原,实际上主要使用空间复杂度。而在压缩质量这一块,采用量化参数(QP)执行更进一步的分类。根据观察,在一般情况下,QP主要分配在20到40之间。所以选择6个常用的QP:10,24,28,32,36,40 和3个辅助的QP:15,44,48。一个子序列输入该分类模块后,对于整体计算复杂度,并且找到其复杂度类别。然后根据每一帧分配的QP,选择最近的QP类作为其质量类别。因此对每一帧都有一个长度不超过1字节的分类信息,在码流中传输。

CNN滤波器:

在后处理模块中,我们采用了基于CNN的滤波器。近几年很多工作已经证明,神经网络在一些低层次的计算机视觉任务中取得了较为出色的效果。为了验证我们编码结构的有效性,采用了超分辨率任务中一个很强大的网络VDSR[1],如图2。

图2 VDSR网络结构图

但因为图像复原工作中分辨率是不改变的,所以不进行滤波之前的插值,直接输入神经网络。该模型是20层的全卷积神经网络,主要采用残差学习和修正线性单元(ReLU)两项基本技术。这个后处理模块位于解码器之后,所以解码器提取出边界信息后,传给该模块,依此选取相应类别的CNN模型进行处理。而对于每一个类别,均有一个线下训练好的CNN模型。

实验:

训练方法:

该编码框架支持神经网络的线下训练,针对每一个预先分好的类别,对训练数据进行训练,具体的训练细节在表1中呈现。

对训练集进行分类之后,使用x265以表1中的模式进行压缩,固定QP值。再将其分割成许多尺寸为35×35的子块,用来扩展训练数据。最后使用CAFFE进行训练,具体的参数配置可见论文[2]。

表1 离线训练细节

测试结果:

针对Grand Challenge提供的八个视频序列:三个分辨率为,四个分辨率为,以及一个分辨率为的视频。对其进行主观与客观方面的性能分析,在这里,需要强调一点,在参考论文中,测试结果以及测试细节与本文中所呈现的有所区别。在之前的训练过程中,我们仅仅使用视频序列作为训练集,之后加入了自然图片,极大增加了训练数据的有效性。同时在训练数据的预处理过程中,原先采用 –keyint 256的模式在x265上进行压缩,之后改为 –keyint 1 ,使得训练数据更加收敛于设定的QP点 。表2为八个视频亮度分量上的测试结果:

表2 亮度分量的BD-rate

总体来说,对于这八组视频,在亮度分量上平均实现了2.92%的增益,在Flower_cif这一序列上实现最大增益,BD-rate降低4.91%。同时在视觉性能上也具有明显的改善,如下图3是Flower_cif这一序列的第44帧,采用600kb/s比特率进行压缩:

图3 视觉性能(细节增强)

其中包含数字的部分被放大并且置于右下角,可以看出在图像的边界以及一些细节上,经过后处理显得更加清晰。

图4是red_kayak序列中的第9帧,在比特率1600kb/s的情况下压缩:

图4 视觉性能(效应缓解)

可以看出(a)图中含有块效应,而经过后处理模块,这里的块效应被有效缓解了。

结论:

本文中所介绍的环外后处理方法在一定程度上提升了编码性能,最高实现4.91% BD-rate增益。并且也显著提升了视觉质量,另一些细节更加清晰,失真得到了缓解。不过对于一些镜头缩放以及平移的场景,性能提升还不太明显。

人工智能的热度与日俱增,深度学习也应用在各个行业学科。而近几年,深度学习也逐渐与视频编码结合起来,并且得到了较为出色的效果。而我们后面也将推出系列文章来介绍基于学习的视频编码技术,包括变分辨率,变滤波器参数等其他这种框架下的处理办法,敬请持续关注。

参考自:

[1] Kim J, Lee J K, Lee K M. Accurate Image Super-Resolution Using Very Deep Convolutional Networks[J]. 2015:1646-1654.

[2] C. Li, Li Song, R. Xie, W. Zhang, “CNN Based Post-Processing to Improve HEVC,” IEEE International Conference on Image Processing(ICIP), Beijing, China, Sep.17-20, 2017. (论文下载地址:http://medialab.sjtu.edu.cn/publications/publications.html)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-09-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 媒矿工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
干货!一文教你如何使用console线调试真实网络设备
作为一名网工,我们经常需要使用console线登录网络设备,那么如何使用console线登录网络设备呢?我们先来看下如何在eNSP模拟器上模拟使用console线登录网络设备。
网络工程师笔记
2021/09/09
7.1K0
干货!一文教你如何使用console线调试真实网络设备
计算机网络设计——企业网络规划与搭建
目录 摘要 一、任务概述 1.1 设计目的 1.2 项目任务和要求 1.3 参考资料 二、开发环境 三、项目需求分析 四、项目设计和实现 4.1 总体设计 4.2 功能设计 4.3 系统实现 五、程序的运行和测试结果 六、设计中的问题及心得 七、附录
全栈程序员站长
2022/11/08
1.4K0
计算机网络设计——企业网络规划与搭建
图解网络:36张图详解网络基础知识
我们用手机连接上网的时候,会用到许多网络协议。从手机连接 WiFi 开始,使用的是 802.11 (即 WLAN )协议,通过 WLAN 接入网络;手机自动获取网络配置,使用的是 DHCP 协议,获取配置后手机才能正常通信。这时手机已经连入局域网,可以访问局域网内的设备和资源,但还不能使用互联网应用,例如:微信、抖音等。想要访问互联网,还需要在手机的上联网络设备上实现相关协议,即在无线路由器上配置 NAT、 PPPOE 等功能,再通过运营商提供的互联网线路把局域网接入到互联网中,手机就可以上网玩微信、刷抖音了。
ICT系统集成阿祥
2024/12/03
2100
图解网络:36张图详解网络基础知识
网工Python之路之paramiko 模块实验(五)异常处理
@朱嘉盛大佬考虑到当前在国内华为较为主流,也用 Windows 系统,尝试用华为的真机或者 eNSP 模拟器,把书中提及的实验做一做,方便大家学习记录,方便交流。
释然IT杂谈
2022/10/27
8800
网工Python之路之paramiko 模块实验(五)异常处理
网工Python之路之paramiko 模块实验(二)循环遍历
@弈心大佬的实验主要是基于 linux 系统、思科设备或 GNS3 模拟器完成。这里小编采用eve-ng+linux来模拟。
释然IT杂谈
2022/10/27
1.1K0
网工Python之路之paramiko 模块实验(二)循环遍历
网工Python之路之paramiko 模块实验(三)读取文件
@朱嘉盛大佬考虑到当前在国内华为较为主流,也用 Windows 系统,尝试用华为的真机或者 eNSP 模拟器,把书中提及的实验做一做,方便大家学习记录,方便交流。
释然IT杂谈
2022/10/27
1.1K1
网工Python之路之paramiko 模块实验(三)读取文件
小白想要利用python脚本批量登录网络设备修改配置,看这篇就够了!
1、按照下图,在ensp模拟器上搭建环境,为了演示批量修改设备,龙哥这里实验4台路由器,当然了,如果你电脑性能足够牛逼,你也可以多用几台路由器咯!然后标注好IP地址。
网络工程师笔记
2022/10/31
2.5K0
HCIE|HCIA 那些年你不知道如何连接配置网络设备
现网中网络设备首次配置及日常配置,通常分为Console线缆连接配置、Web控制台配置、Telnet或SSH配置,而今天给大家主要介绍的是Console线缆配置,很多小伙伴都会说学了这么久,连基础连接都不会连接。哈哈,那咱们就开始吧。
Ponnie
2021/02/24
4000
全网好评!18个网络工程师必备软件大汇总
设备调试离不开它,全网被高频提及的一个软件。Secure CRT是一款用于连接运行包括Windows、UNIX和VMS的远程系统的理想工具,也是远程登陆交换机的必备软件的一种。
网络工程师笔记
2022/02/17
4.9K0
全网好评!18个网络工程师必备软件大汇总
网工必须了解的华为华三设备基础命令行与WEB界面
上一篇学会了真机怎么登录了,这一篇来正式进入基础命令行的了解,了解下命令行的结构以及WEB界面。为了大家方便跟着学习,演示就使用模拟器,后续有不能实现的功能,则用真机。
网络之路一天
2024/01/08
8300
网工必须了解的华为华三设备基础命令行与WEB界面
如何使用SecureCRT连接华为eNSP模拟器
5、单击“Telnet”选项,勾选“强制每次一个字符模式(R)”,否则无法使用tab键进行补全操作,接着单击“确定”。
宝耶需努力
2022/12/13
4.3K1
如何使用SecureCRT连接华为eNSP模拟器
华为eNSP模拟器设备启动失败解决方案(全)
1.1 VirtualBox主机网卡是否存在、主机网卡的ip段是否为192.168.56.0/255.255.255.0
网络工程师笔记
2022/04/08
15.9K0
华为eNSP模拟器设备启动失败解决方案(全)
在现网中,大佬们为啥总是用这种Console线调试设备
一般来说,网工的背包里必备的几样东西:ThinkPad笔记本电脑、网线、Console线,可能有的还会带上水晶头、网线钳和测线仪。
网络工程师笔记
2022/04/08
2.3K0
在现网中,大佬们为啥总是用这种Console线调试设备
华三最新模拟器版本5.10.3,全新防火墙Web管理界面附带eNSP共存方法(新版HCL如何关联CRT)
安装建议: 1.建议使用Win10操作系统,使用自带virtual box 6.0.14; 2.须在BIOS中开启VT-x以启用虚拟化技术 3.Windows安全中心-设备安全性-内核隔离,内存完整性设置需保持关闭状态(一般默认关闭) 4.需要关闭Windows Hyper-v相关功能
ICT系统集成阿祥
2024/12/03
3290
华三最新模拟器版本5.10.3,全新防火墙Web管理界面附带eNSP共存方法(新版HCL如何关联CRT)
华为思科登录设备和控制台、Console认证(CLI)
由ISO(国际标准化组织)设计的OSI(开放系统互联)模型是一个参考模型。在讨论协议分层时,需基于协议,而非物理设备。各层信息如下:
知孤云出岫
2025/04/01
1440
华为思科登录设备和控制台、Console认证(CLI)
75张图带你了解网络设备、网络地址规划、静态路由、实战演练
大刘的电脑 A 和小美的电脑 B 可以通过网线连接起来,组成一个网络。A 发出来数据,B 都能接收到。反之 A 可以接收 B 发出来的所有数据。
ICT售前新说
2021/04/30
1.6K0
75张图带你了解网络设备、网络地址规划、静态路由、实战演练
华三最新模拟器版本5.10.3,全新防火墙Web管理界面附带eNSP共存方法(新版HCL如何关联CRT)
安装建议: 1.建议使用Win10操作系统,使用自带virtual box 6.0.14; 2.须在BIOS中开启VT-x以启用虚拟化技术 3.Windows安全中心-设备安全性-内核隔离,内存完整性设置需保持关闭状态(一般默认关闭) 4.需要关闭Windows Hyper-v相关功能
网络之路一天
2024/04/30
1.1K0
华三最新模拟器版本5.10.3,全新防火墙Web管理界面附带eNSP共存方法(新版HCL如何关联CRT)
AI时代,网络工程师的出路在哪里?尽快掌握这12款常用工具,提高工作效率!
这段时间,随着ChatGPT的火爆,各行各业都感受到了人工智能AI的强大,ChatGPT和以往聊天机器人最大的区别就在于,它具备了一定的创作能力,也有一些基础的分析能力。
网络技术联盟站
2023/03/01
2.5K0
AI时代,网络工程师的出路在哪里?尽快掌握这12款常用工具,提高工作效率!
【收藏】网络设备安全加固规范
本建议用于Cisco路由器和基于Cisco IOS的交换机及其三层处理模块,其软件版本为CISCO IOS 12.0及以上版本。加固前应该先备份系统配置文件。
释然IT杂谈
2022/10/27
1.1K0
【收藏】网络设备安全加固规范
CCNA系列课程(3)CDP及设备基本操
       今天主要介绍一些Cisco设备的自动发现协议:CDP,然后再介绍一下设备的基本操作如接口类型,常见命令等。
py3study
2020/01/06
1.6K0
推荐阅读
相关推荐
干货!一文教你如何使用console线调试真实网络设备
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档