Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >探究一下iSize的编码预处理魔法!

探究一下iSize的编码预处理魔法!

作者头像
用户1324186
发布于 2020-04-02 08:21:54
发布于 2020-04-02 08:21:54
1.2K0
举报
文章被收录于专栏:媒矿工厂媒矿工厂

本文为媒矿工厂编译的技术文章

原标题:Review: iSize BitSave Video Preprocessing

原作者:Jan Ozer

原文链接:https://www.streamingmedia.com/Articles/Editorial/Featured-Articles/Review-iSize-BitSave-Video-Preprocessing-139985.aspx

翻译整理:武国庆

介绍

iSize BitSave是一种视频预处理技术,旨在提高制作的视频的质量。本文将从摘要开始,然后进行深入的探讨。

TL / DR

iSize的网站声称它可以降低40%到60%的比特率,因此Jan以其他测试方法的60%的数据速率进行了测试。由于“hack” VMAF的结果可能与主观不相关,因此Jan创建了自己的基于FFmpeg的算法来与BitSave进行比较。

Jan使用17个20秒的测试文件制作了三组文件,包括电影,动画,体育和游戏。一组文件是未经处理编码的源文件(Baseline)。第二个是使用FFmpeg方法处理的文件(FFmpeg Filters),第三个是通过BitSave处理的(BitSave)。Jan使用相同的FFmpeg参数编码所有文件,并测量了VMAF,SSIM和PSNR。Jan没有针对PSNR或SSIM进行调整,因为Jan使用相同的编解码器和编码器执行了所有测试。

图1显示了所得的指标得分,PSNR平均值乘以2.5,SSIM平均值乘以100,以在与VMAF相同的图中显示它们。需要明确的是,Baseline和FFmpeg Filters的目标数据率为100%,而BitSave的目标数据率为60%。

图1 BitSave与Baseline和FFmpeg Filters指标分数

如图所示,FFmpeg Filters(以100%的数据速率)提供了最好的VMAF改进,但PSNR和SSIM得分却最差。未经处理的Baseline文件在PSNR和SSIM方面得分最高,其次是BitSave和FFmpeg Filters。BitSave(实际上是所有视频预处理公司)将SSIM和PSNR得分的下降归因于“我们正在改变编码器的输入,从而使我们的视频信号朝着人类的感知调整”。换句话说,我们已经声明了多年,PSNR和SSIM分数与主观分数不相关,因此不应该期望能够改善感知质量的预处理算法来改善这些分数。

图2显示了使用11个5秒测试序列进行的相同分析,其中BitSave以相同的数据速率编码。在这里,BitSave的 VMAF评分最高,并获得了比FFmpeg滤波方法更高的SSIM和PSNR分数。

图2 BitSave(100%的数据速率)与Baseline和FFmpeg Filters指标分数

Jan得到如下结论:

  • VMAF确实很容易被hack,在比较预处理方法时,应该对VMAF分数有所了解;
  • 尽管BitSave显然受益于VMAF的“hack”,因为它可以改善大多数视频的对比度,但它是一种合法的处理技术,而不是hack;
  • 合理比较预处理算法的唯一方法是主观测试;
  • 应用Jan制定的FFmpeg滤波器可以提高VMAF得分并改善大多数视频的对比度,但是不应该考虑将其普遍部署,尤其是高级内容,因为它会使某些视频变暗。不过,如果要处理低质量的输入视频,那么值得一试。

该公司网站上宣称的关键性能指标是:当iSize Technology与MPEG H.264 / AVC结合使用时,它可以在一系列编码器(AVC / H.264,HEVC,VP9 ,AV1,VVC)比使用相同的基准编码器和编码配置时减少40-60%的比特率。

完成测试后,Jan与iSize分享了他的结果,iSize回答说:“为澄清起见,我们声明在一系列编码标准(AVC / H.264,HEVC,AV1,VVC和更高版本)上,在编解码器中使用“相同的编码方式而无任何其他感知预处理”时,可节省40%-60%比特率。” 一周后,iSize仍然没有在他们的网站上澄清这一点,所以Jan假设其他人在他们的网站上读到这个声明会得出同样的结论。

BitSave工作方式

从工作流的角度来看,Jan通过将测试文件上传到公司的网站,然后下载高比特率的HEVC文件来代替原始源来使用该技术。当然,这对于大批量使用来说很麻烦,因此iSize提供了许多许可和集成选项。

Jan通过将原始源文件和BitSave预处理文件都编码为相同的编码参数来开始测试。这证实了VMAF分数的显着提高,尽管PSNR分数通常较低,而SSIM分数大致相同。当Jan直接研究这些视频时,注意到一些用BitSave源编码的视频比用原始源编码的视频显示出更好的对比度,就好像它们是由调色师在一轮单独的调色中处理过的。

这就提出了几个问题,例如是否可以通过改善编码视频文件的对比度来提高VMAF分数,或者是否可以对VMAF进行hack。对“ Hacking VMAF”进行搜索找到了名为“用视频色彩和对比度失真对VMAF进行hack”的白皮书,该白皮书是由与莫斯科国立大学,视频质量测量工具和视频质量开发人员合作的几位研究人员共同撰写的。

论文指出:“在本文中,我们描述了视频颜色和对比度转换,这些转换可以增加VMAF分数,同时保持SSIM分数相同或更好。在对失真图像添加任何转换后,可以提高全参考指标分数,这意味着该指标在某些情况下会被欺骗。” 在白皮书中,研究人员测试了非锐化蒙板和直方图均衡化的不同值如何影响VMAF和SSIM得分。正如文章标题所暗示的那样,他们得出结论认为VMAF可能被“hack”。

Jan的测试

Jan以此为挑战,开始尝试使用几个FFmpeg命令来了解是否可以提高VMAF分数,甚至可以提高视频的实际质量。具体来说,Jan应用了对比度和非锐化蒙板滤镜,并添加了以下命令字符串:-vf eq=brightness=0.0:contrast=1.075,unsharp=5:5:1.05:5:5:0.0。Jan调整的唯一两个数字是对比度和第三个非锐化蒙版配置,它们的默认值为1.0。

然后,Jan将对比度调整为下表中的值,从而得出所示的指标得分。从表1中可以看到,对比度使VMAF分数提高了14点,尽管SSIM遭受了损失。显然,VMAF可以被hack。

Basketball

Football

Metric

VMAF

SSIM

VMAF

SSIM

Contrast 1.25

85.93

0.672

86.87

0.858

Contrast 1.1

80.95

0.853

78.79

0.892

Contrast 1.075

79.36

0.880

77.77

0.897

Contrast 1.05

78.03

0.894

76.23

0.901

Baseline (no adjustment)

74.27

0.907

72.65

0.906

表1 调整对比度来Hacking VMAF。

在这些值的极端值下,VMAF得分很高,但是对视频的暗化效果远大于实际会使用的效果,并且远远超出了在BitSave视频中看到的效果。由于Jan的目标是找到任何人可以随时使用的一组值,因此Jan放弃了对比度,最终选择了这些设置:-vf eq=brightness=0.0:contrast=1.015,unsharp=5:5:1.025:5:5:0.0。

正如任何FFmpeg爱好者所知,这些类型的优化实验非常耗时,不能断言这些设置是最佳方法。但是,正如将在下面的结果部分中看到的那样,它们确实提高了VMAF分数,并且在大多数情况下,它们似乎也提高了实际的视频质量。

Bitsave测试

因此,为了测试BitSave技术,Jan使用了17个序列,每个序列长约20秒,其中包含四个动画,四个游戏,四个体育序列以及六个其他序列,包括一些电影和其他内容。Jan通过BitSave网站进行了处理,并使用简单的两遍FFmpeg命令字符串进行了编码。

ffmpeg -y -i input.mp4 -c:v libx264 -b:v 6000k -maxrate 12000k -bufsize 12000k -g 50 -keyint_min 50 -sc_threshold 0 -pass 1 -an -f mp4 NUL &&

ffmpeg -y -i input.mp4 -c:v libx264 -b:v 6000k -maxrate 12000k -bufsize 12000k -g 50 -keyint_min 50 -sc_threshold 0 -an -pass 2 input_x264_baseline.mp4

Jan为每个测试生成了三个文件:

  • 使用原始源文件上的脚本的_baseline文件;
  • 使用BitSave处理的中间文件上的脚本的_BS文件;
  • 使用上述脚本的_both文件以及原始源文件上显示的两个视频filter。该文件对应于FFmpeg Filters输出。

Jan更改了关键帧间隔以匹配每个文件的帧速率,范围从24到60 fps。Jan通过在每个源文件上运行CRF 27编码来定制每个测试的数据速率,以识别将产生约93-95的VMAF值的数据速率。Jan以该速率对_baseline和_both文件进行了编码。以低40%的比特率对BitSave文件进行了编码,这是一个非常苛刻的测试,尽管可以合理地测试iSize。

由于Jan在所有编码中都使用相同的编解码器,没有对编码中的PSNR或SSIM进行调整,因此发现指标分数的影响是均匀的,还强烈感觉到视觉比较将是最重要的,并且调整可能会脱离主观结果。

基准测试结果

表2显示了VMAF,PSNR和SSIM的单独列的基准测试结果(表2的总平均得分是上面图1的基础)。橙色背景表示三者中最低的分数,绿色表示最高分数。使用VMAF,FFmpeg Filter方法无疑是赢家。使用PSNR和SSIM,Baseline表现最佳,BitSave在PSNR和SSIM中胜过FFmpeg Filter。

表2 Baselin和FFmpeg文件与BitSave比较(BitSave的比特率是另两个文件的60%)

为了说明这一点,表3显示了一些初步测试,这些测试是使用相同的编码字符串但以单个数据速率针对所有技术以每秒1.75 Mbps的速率在一组单独的5秒文件上运行的(表3中的总平均得分是上面图2的基础)。在这里,BitSave显然在所有三个指标上都击败了基于滤波器的FFmpeg方法。

表3 Baselin和FFmpeg文件与BitSave比较(BitSave的比特率与另两个文件相同)

主观质量

主观质量始终很难,尤其是因为使用基于滤波器的方法具有“游戏中的皮肤”的功能。Jan认为,至少与FFmpeg Filter方法甚至可能与基准视频相比,BitSave都无法实现H.264编码所承诺的40%的带宽节省。

我们可以下载三个PDF文档,以帮助我们得出自己的结论。第一个标题为BitSave1_Contrast and Overview。这个演示文稿包括显示差异最大的序列,其中一些用圈起来的区域来引导你的注意力。最好的方法是全屏打开PDF,将灯光调暗,并在图像之间来回切换页面,这些图像先显示FFmpeg Filter,然后显示Baseline,然后显示BitSave,以使将基线与两种方法进行比较变得简单。除最终的足球剪序列外,所有图像均以其他两个文件的60%的数据速率显示BitSave。

深入研究与60%的BitSave进行比较的细节,发现了一些巨大的差异,包括图4中的侠盗猎车手框架。Jan询问了BitSave有关游戏的结果,他们说:“我们是第一个承认我们需要针对游戏等某些用例进一步改进我们的模型,实际上,我们正计划发布新版本。”

下图显示了莫斯科国立大学视频质量测量工具中VMAF分数的帧图的序列。

图4 FFmpeg Filter方法与BitSave的比较

结论

最重要的是,VMAF的可hack性使评估预处理技术变得复杂。尽管我们希望相信客观指标的简单性,以及它可以生成的精美图表和BD-Rate统计数据,但VMAF并不是对预处理技术的准确衡量。

另外,Jan的医师妻子喜欢说关联不是因果关系。这里的相似之处在于,仅仅因为我们在查看BitSave时发现VMAF是可hack的,并不意味着BitSave在hack VMAF。经过数小时的测试,发现BitSave的技术是有效和有价值的,尽管测试的结果将取决于它在你的测试序列的主观测试中的表现。

最后,对比度和清晰度在编码文件的主观外观上产生了巨大的差异,这两种预处理方法改进了Jan的许多测试文件。任何曾经在Adobe Premiere Pro或其他编辑器中调整过剪辑的颜色,亮度或对比度的人都知道,大多数未经专业调色的剪辑都可以在短时间内得到大幅改善。如果您负责剪辑,那么花额外的时间绝对值得。如果您是负责编码的压缩人员,在编码器中尽量减少不必要的调整。

参考链接

[1] https://www.isize.co/bitsave/

[2] http://ceur-ws.org/Vol-2485/paper12.pdf

[3] http://forpub.s3.amazonaws.com/BitSave1_Contrast_and_overview.pdf

[4] http://forpub.s3.amazonaws.com/BitSave_at60percent.pdf

[5] http://forpub.s3.amazonaws.com/BitSave_Analysis-Same_Data_Rate.pdf

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 媒矿工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
衡量视频质量有哪些指标和工具?
https://www.streamingmedia.com/Articles/Editorial/Featured-Articles/Buyers-Guide-to-Video-Quality-Metrics-130675.aspx
LiveVideoStack
2019/07/01
9.4K0
衡量视频质量有哪些指标和工具?
EVC,VVC,LCEVC 测试:最新的 MPEG 编解码器性能如何?
据我所知,这是第一次有研究对代表基本视频编码(Essential Video Coding,EVC)、通用视频编码(Versatile Video Coding,VVC)和低复杂度增强视频编码(Low Complexity Enhancement Video Coding,LCEVC)的编解码器以及 AV1、HEVC 和 H.264 的质量和性能进行比较。它并不像我希望的那样详尽,但结果应该有助于你了解三个较新的 MPEG 编解码器的目标,以及它们与旧编解码器的对比情况。
用户1324186
2022/02/18
4.7K0
EVC,VVC,LCEVC 测试:最新的 MPEG 编解码器性能如何?
【视频编码】 Content Aware ABR技术(三)
本系列的前面贴子中,我们梳理了Netflix和YouTube在ABR方面的一些进展,本文将简要介绍一下编码优化领域的一位新贵—Beamr的技术动态。 Beamr是内容自适应视频编码与优化解决方案的提供
用户1324186
2018/03/06
1.5K0
【视频编码】 Content Aware ABR技术(三)
视频编码质量评价
视频已经成为我们现代生活中不可或缺的元素,众所周知,视频的原始数据量大的惊人,不利于存储和传输!于是乎有了视频编码,不同的编码器,不同的参数,软件与硬件,到底哪一种编码编的好呢?于是乎就有了视频编码质量评价!一起来看看!
视界音你而不同
2021/01/06
2K1
视频编码质量评价
视频质量评估的新方式:VMAF百分位数
原文链接 / https://blog.twitter.com/engineering/en_us/topics/infrastructure/2020/introducing-vmaf-percentiles-for-video-quality-measurements.html
LiveVideoStack
2020/12/16
3.2K0
视频质量评估的新方式:VMAF百分位数
衡量QoE和视频质量的最新ITU-T标准
本文来自Streaming Learning Center的博客,作者是H.264,H.265和VP9编码实时和按需制作的领先专家Jan Ozer,本文主题是“衡量QoE和视频质量的最新ITU-T标准”。
用户1324186
2020/08/31
3.1K0
衡量QoE和视频质量的最新ITU-T标准
动态优化器—一种感知视频编码优化框架
视频编码推动了过去25年的学术研究,并且推出了引人注目的产品与服务。众多公司都围绕视频编码和传输而构建--- Netflix和Google的YouTube是两个最好的例证。
LiveVideoStack
2021/09/02
9410
动态优化器—一种感知视频编码优化框架
透过 Top 500 美拍短视频看 AV1 性能
AV1 以其出色的压缩性能,无疑是自 2017 年以来备受关注的新生代视频编码标准。业界也相继对 AV1 进行了一些评测工作,如 Facebook、Netflix 对它的编码复杂度也从早期的 VP9 的近千倍降到了百倍。为了验证 AV1 在短视频上的性能,美图音视频团队自 2018 年 11 月,基于 Top 500 美拍短视频进行了一次全面的 AV1 性能评估,对标编码器采用在实际生成环境中使用的主流视频编码器 x264、x265、VP9。
LiveVideoStack
2019/07/01
1.3K0
透过 Top 500 美拍短视频看 AV1 性能
视频编码标准和FB的提升工作
本文来自Video Scale 2020,演讲者是来自Facebook的研究科学家Ioannis Katsavounidis。演讲题目是视频编码标准和FB的提升工作。演讲分为如下几个部分。
用户1324186
2020/12/28
9060
视频编码标准和FB的提升工作
LCEVC vs. AVC – 3倍编码速度下28%的增益
原标题:LCEVC vs. AVC – Incredible 28% Gain at 3x Speed
用户1324186
2021/02/12
1.5K0
LCEVC vs. AVC – 3倍编码速度下28%的增益
VVC编码进展:码率降低,速度仍需提升
https://medium.com/@ewoutterhoeven/a-quick-and-dirty-look-at-vvc-16e8c2c56512
LiveVideoStack
2019/07/01
1.5K0
VVC编码进展:码率降低,速度仍需提升
从云计算到低延时,传统编码器与创新技术双剑合璧严把成本质量关
大家好,我是赛灵思DCG数据中心负责Video业务的Sean Gardner,本次演讲的主要内容是赛灵思在中国发展过程中寻求新的业务探索与技术创新落地。
LiveVideoStack
2019/09/17
7080
从云计算到低延时,传统编码器与创新技术双剑合璧严把成本质量关
如何选择和使用视频质量客观评价指标
无论您是否知道,您观看的许多视频其实都是使用视频质量评价指标来优化的。哦,您不同意?那您最近看过Netflix吗?在过去两年多的时间里,Netflix的编码阶梯已经由公司的视频多方法评估融合(VMAF)的体系来驱动,然而在此之前使用的是峰值信噪比(PSNR)。您不是Netflix的客户?那么,YouTube呢? YouTube使用基于恒定码率因子(CRF)编码的神经网络,该编码本身也是由其内部的视频质量评价指标来驱动的。
LiveVideoStack
2021/09/02
1.9K0
如何选择和使用视频质量客观评价指标
Netflix视频质量感知评价模型之路
在Netflix公司,我们很关注视频质量,同时也关注如何规模化地精确评价视频质量。我们提出了视频多方法评估融合(VMAF)评价模型——试图反映观众对我们流媒体质量的感受。目前,我们正在将这个工具开源,并邀请研究界就这个重要课题与我们进行合作。
LiveVideoStack
2021/09/02
1.6K0
Netflix视频质量感知评价模型之路
AV1显著超越H.265和VP9?—MSU最新比较公布
前言 最新的编码质量对比研究表明,视频编码标准AV1在质量已经登顶,但在编码速度方面仍与VP9、HEVC相差甚远。同时,莫斯科国立大学(MSU)开启了一项从主观层面对比视频质量的服务,名为Subjectify.us。 MSU的研究表明,仅考虑编码质量时,AV1的性能已胜过HEVC和VP9,成为目前质量最高的可用视频编码标准。同时发现,在常规操作模式下,VP9相比于HEVC也有更好的编码质量。不过,以上仅是MSU 2017编码对比报告中诸多亮点的一小部分,除此之外,MSU开展了在线对比视频与静态图像主观质量的
用户1324186
2018/03/06
1.8K0
AV1显著超越H.265和VP9?—MSU最新比较公布
微帧科技:综合多项指标评价视频质量,才能更接近主观感受
视频流量在整个互联网流量的占比每年都在高速增长,为降低视频存储成本和数据传输通道的负载,视频压缩标准及算法在不断积极开发和改进。视频质量的评估在其中也起着至关重要的作用,尽管已经发展出了大量视频质量评估方法,但普遍接受度最高、最知名的评价方法还是经典的PSNR、SSIM以及VMAF。
微帧Visionular
2024/10/30
3100
微帧科技:综合多项指标评价视频质量,才能更接近主观感受
2019MSU编解码器比较及总结
原文标题:3 Takeaways From Moscow State University's 2019 Codec Comparison
用户1324186
2019/11/19
1.1K0
2019MSU编解码器比较及总结
失真对编码性能的影响研究
近几年来,视频流的技术环境发生了巨大的变化,互联网上的视频流量急剧增加。根据 Cisco 公司的报告的预测,视频流量将超过整个互联网使用量的 80%。这也使得人们对视频流和实时视频通信应用中的视频压缩的比特率与质量的权衡关系产生了更大的兴趣。然而这些编解码器在实际系统中的实际部署表明,还有其他考虑因素进一步限制了编解码器的性能,例如设备上的资源、云中的计算资源和 CDN(内容交付网络)中不同服务器之间的带宽。尤其是转码已经成为流媒体和通信生态系统的一个关键设备,使 Netflix、YouTube、Zoom、微软、Tiktok 和 Facebook 的视频应用成为可能。用户生成内容(UGC)的流媒体的一个主要问题是失真的影响,如噪音、曝光/光线和相机抖动。对于 UGC,这些失真通常会导致比特率提高,图片质量降低。
用户1324186
2021/11/23
1.2K0
per-title编码视频
本文来自Streaming Media,Jan Ozer和 Abdul Rehman介绍了per-title编码视频的发展。
用户1324186
2021/04/14
8010
GTC 2024 | 使用NVIDIA GPU和VMAF-CUDA计算视频质量
传统的视频质量评价指标包括 PSNR 和 SSIM 等。而 VMAF 由 Netflix于 2017 年提出,是一种全参考的视频质量评价指标,分数范围由 0 到 100,越高代表质量越好。VMAF 试图准确地捕捉人类的感知,将人类视觉建模与不断发展的机器学习技术相结合,使其能够适应新的内容,在与人类视觉感知保持一致方面表现出色。VMAF 现在已经被 Netflix,Snap,V-Nova等公司采用。
用户1324186
2024/05/31
4370
GTC 2024 | 使用NVIDIA GPU和VMAF-CUDA计算视频质量
推荐阅读
相关推荐
衡量视频质量有哪些指标和工具?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档