前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >使用 JPEG XS 和 AWS CDI 的云端实时视频

使用 JPEG XS 和 AWS CDI 的云端实时视频

作者头像
用户1324186
发布于 2021-12-17 06:17:53
发布于 2021-12-17 06:17:53
1.4K0
举报
文章被收录于专栏:媒矿工厂媒矿工厂

目录

  • 引言
  • JPEG XS:低复杂度,低延迟,高质量
  • CDI — 云数字接口:云端未经压缩的视频/音频/元数据
  • 结论

本次演讲主题为使用 JPEG XS 和 AWS CDI 的云端实时视频,主讲人为来自亚马逊云科技专门从事广播的首席解决方案架构师 Thomas Edwards。

引言

在英国有一个成语 “Horses For Courses”,主要意思是我们应当为客户具体的需求,选择合适的技术方案或者策略。所以有时候我们需要高压缩率,在由带宽限制的条件下,也许是直接面向消费者的视频,延迟也许并不重要。但是有时候可能需要未经过压缩或者轻微压缩的视频,来实现非常高的质量和非常低的延迟。因此我们需要根据实际需求进行衡量。

JPEG XS:低复杂度,低延迟,高质量

首先主讲人介绍了 JPEG XS,JPEG XS 作为一个低复杂度的编解码器,具有非常低的延迟,同时也能够提供非常高的质量。JPEG XS 由国际标准化组织(ISO)和国际电工委员会(IEC)的联合工作小组 JPEG 联合制定,并将 JPEG XS 标准化为 ISO/IEC 21122。

首先 JPEG XS 不是目前在互联网上通用的,使用离散余弦变换的 JPEG,也不是 JPEG 2000。和 JPEG 2000 相同点是 JPEG XS 也是一个小波编解码器。但是 JPEG 2000 编解码器的复杂度是非常之高的,目前 JPEG 2000 确实在高质量的视频压缩方面非常有效,但是他需要 FPGA 硬件支持来实现实时性。JPEG 2000 的软件实现在实时性方面并不实用。这个时候 JPEG XS 的提出是非常有意义的。

JPEG XS 的目标之一就是实现一个低计算复杂度的编解码器,满足在基于 Intel Core i7 硬件基础上实现 4K 60p 的实时性。使用 JPEG XS 需要支付一定的专利费,

当我们查看 JPEG XS 的延迟时。它是硬件实现中的端到端延迟。FPGA 实现可以将延迟低至 32 行。即使直接对比现实世界和软件实现,我们只能观察到大约一帧的延迟。JPEG XS 具有非常低的多代损失,所以如果你压缩然后解压、再次压缩然后解压,进行10个周期,只会观察到小于 1 个 dB 的 PSNR 损失。JPEG XS 在多次压缩解压缩中是非常稳定的。但对于 H.264、HEVC 或者 VVC,他们进行了更高水平的压缩,在一个周期内的压缩是非常高效和高质量的,但是如果向上面一样进行一次又一次的压缩解压缩,伪影会越来越多。

JPEG XS

因此我的个人观点是,JPEG XS 需要每秒 175 Mbps 来提供一个视觉上无损的 HD 视频。如果将其与 JPEG 2000 相比较,这大约是每个像素多了一个比特。而客户有稍微不同的观点,他们是使用 JPEG XS 的网络。他们喜欢 10:1 的压缩,例如,720p60 需要每秒约 110 Mbps 的带宽。对于体育内容,客户对视觉损失更加挑剔,他们倾向于 5:1 的压缩水平。因此对于 720p60 这将需要到 220Mbps 的带宽。更多信息可以从下面这个白皮书中找到:http://ds.jpeg.org/whitepapers/jpeg-xs-whitepaper.pdf

CDI — 云数字接口:云端未经压缩的视频/音频/元数据

然后主讲人介绍了什么是 CDI: CDI 是云数字接口,他在云端提供未压缩的视频、音频和元数据。因此:

  • CDI 允许在云端以高水平的可靠性移动未经压缩的多媒体数据;
  • 其预期延迟:小于 1 帧;
  • GitHub 上有开源的 SDK
  • 它在亚马逊网络服务上通过使用可扩展的可靠数据报协议 SRD 来实现,它在 RF 上运行,作为弹性结构适配器。

进一步主讲人介绍了云端 UDP 以及一个简单的云端网络和 ECMP(Equal-Cost Multi-Path Routing)的相关内容。同时介绍了 SDR(Scalable Reliable Datagram)协议的特性和效果。

CDI 在 SRD 的基础上提供了一个 SDK,并且有 WindowsLinux 两个版本。这个 SDK 是作为一个开源项目在 2-clause BSD 许可下提供的。不需要额外的版权费,客户只需为支持 EFA 的 EC2 indtance 使用付费。SDK 用于可用性内部的区域传输,并针对 EC2 配置组进行了优化。为了提高供应商之间的互操作性,SDK 有一个音频/视频/元数据(AVM)层,其样本映射与 ST 2110 相似。

AWS CDI SDK 概念

结论

最后主讲人进行了总结,如果你想获得最低延迟和最高质量的云视频,主讲人建议使用 JPEG XS,它可以在输入和输出云端时进行较轻的压缩。同时,JPEG XS 是一个国际标准,任何人都可以得到,而且它是一个非常友好的编解码器。因此它在云端的软件中也很好用。在 Prem 上,你可能想使用基于软件的编码器,或者你可以使用 FPGA 编码器以获得最低延迟。

另一方面,CDI 是未压缩的视频、未压缩的音频,是云端的辅助数据。它由云网络的设计提供动力,其固有的能力是使 CDI 工作的原因。并且 CDI 是一个开源的 SDK,任何人都可以得到。

结论

附上演讲视频: http://mpvideo.qpic.cn/0bc3tqac2aaabyapn2vzvvqvbhgdfwoaalia.f10002.mp4?dis_k=8491df6bac71923684403b38470d63a3&dis_t=1639721754&vid=wxv_2180669849335627781&format_id=10002&support_redirect=0&mmversion=false

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 媒矿工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
JEPG XS:低延时视觉无损压缩
本次演讲来自SMPTE,演讲者是来自Evertz Compression System的两位产品技术经理Branislav KuKuji和Rajvlr Singh。本次演讲主要介绍了JPEG XS这一低延时且视觉无损的新压缩标准。
用户1324186
2021/02/08
3K0
W3C: 媒体工作流集成 (1)
本次分享的主持人为来自 W3C/SMPTE 网络专业媒体制作联合研讨会主席 Pierre-Anthony Lemieux,他向我们分享了最新的网络浏览器发展,现在在任何网络浏览器中使用专业媒体已经成为可能,并且实际上可以在 HTTP 服务器上播放无损的 UHD 视频,无需代码和插件。
用户1324186
2022/04/11
4850
W3C: 媒体工作流集成 (1)
JPEG XS 图像编码新标准
原标题:JPEG White paper: JPEG XS, a new standard for visually lossless low-latency lightweight image coding system
用户1324186
2019/08/08
7.7K0
JPEG XS 图像编码新标准
用 Livepeer 在区块链上进行实时视频转码
P2P 时代(90 年代)遗存下来的 BitTorrent 现在仍占据了 15-20% 的互联网流量。回过头去看看,人们真正创造 BitTorrent 的目的是想在互联网上从点对点的角度分享信息,在某些情况下比集中式系统性能更好。区块链是一种新的类型的去中心化系统,但实际上人们在去中心化的基础上又增加了许多其他有趣的功能。
用户1324186
2022/02/18
1.2K0
视频领域的 A/B 测试
许多学科都是从艺术开始的,并随着时间的推移演变成艺术与科学的混合体。市场营销曾经被品牌广告和电视创意所主导,几乎没有办法将原因和效果联系起来。今天,虽然这是由绩效营销人员推动的,但是可以衡量广告创意的有效性,并衡量客户获取成本和价值等方面的指标。主讲人在这里引用了 "Mad Men"(广告狂人),因为没有他们,现在的人很难想象营销曾经是主要的艺术形式。
用户1324186
2022/04/11
5340
实时 8K 服务的现状
8K 内容能给观众带来更强烈的真实感,使用户获得更好的身临其境的体验。当我们说某些视频内容是 8K 时,那么就不得不提及分辨率、帧率以及色度等等。分辨率为 4K 的 4 倍或者 FHD 的 16 倍、60FPS 甚至 120FPS 的高帧率、高动态范围、10 比特的比特深度等等,这些似乎都是 8K 内容的标签。那么怎样的参数或者视频技术的组合才真正能定义 8K 格式呢?我们需要一个明确的标准来定义 8K。
用户1324186
2022/02/18
5280
实时 8K 服务的现状
JPEG 最近在忙啥?
第81届JPEG会议在加拿大不列颠哥伦比亚省温哥华举行,会议对下一代图像编码标准(称为JPEG XL)的提案征集的回应进行了大量工作,预计将提供解决方案用于提高质量和灵活性的图像格式,具有更好的压缩效率。征求建议书回复的初步评估证实了不同各方对此活动的兴趣以及质量和压缩效率的演变,这将由未来的标准提供。
用户1324186
2018/12/24
1.3K0
JPEG-XS:用于IP视频的母片图像(mezzanine image)编解码器
本帖参考T. Richter等人发表在SMPTE Motion Imaging Journal的文章JPEG-XS—A High-Quality Mezzanine Image Codec for Video Over IP。超高清(UHD)内容的生产,需要更多的带宽用来传输和交换数据;基于IP协议栈的基础架构则更多的灵活性。在生产工作流程中的母片压缩技术可以减少必要的数据传输容量,甚至可以使用旧的、支持HD的基础架构。这类编解码器设计的主要难点是满足超低延迟并且保持高质量的同时,降低设计复杂性。考虑到这一点,联合图像专家组(JPEG)委员会启动了一个名为JPEG-XS的工作组,应对此需求。本文介绍了此类编解码器的具体要求、标准题案的结果、核心实验的阶段进展,及对所选技术的一些评述。
用户1324186
2018/12/07
5.4K1
JPEG-XS:用于IP视频的母片图像(mezzanine image)编解码器
失真对编码性能的影响研究
近几年来,视频流的技术环境发生了巨大的变化,互联网上的视频流量急剧增加。根据 Cisco 公司的报告的预测,视频流量将超过整个互联网使用量的 80%。这也使得人们对视频流和实时视频通信应用中的视频压缩的比特率与质量的权衡关系产生了更大的兴趣。然而这些编解码器在实际系统中的实际部署表明,还有其他考虑因素进一步限制了编解码器的性能,例如设备上的资源、云中的计算资源和 CDN(内容交付网络)中不同服务器之间的带宽。尤其是转码已经成为流媒体和通信生态系统的一个关键设备,使 Netflix、YouTube、Zoom、微软、Tiktok 和 Facebook 的视频应用成为可能。用户生成内容(UGC)的流媒体的一个主要问题是失真的影响,如噪音、曝光/光线和相机抖动。对于 UGC,这些失真通常会导致比特率提高,图片质量降低。
用户1324186
2021/11/23
1.2K0
互动场景下的低延迟编码技术
本次分享的主题是互动场景下的低延迟编码技术,内容分为四个方面:一是互动媒体服务;二是低延迟视频编码技术;三是低延迟编码方案;四是应用场景和发展趋势。
LiveVideoStack
2020/07/29
3.3K0
视频编码复杂度持续增加,云端硬编码方案优势凸显
过去十年,基于H.264/AVC的视频编解码器一直在流媒体应用领域占主导地位,但随着Apple在iOS 11中采用H.265/HEVC以及Google在Android上力推VP9,形势悄然发生变化。明年Open Media联盟将会发布性能更高的AV1视频编解码器。视频内容提供商不久就要决定除了H.264之外是否需要进一步支持H.265和VP9,带来的结果就是视频编解码器市场将会变得支离破碎。 A. 视频编码复杂度增加: 随着视频编解码器市场的风云变幻以及消费者对更高质量视频的需
用户1324186
2018/03/05
2.1K0
视频编码复杂度持续增加,云端硬编码方案优势凸显
音视频技术开发周刊 | 225
视觉体验在全真时代显得越发重要,如何提高用户的视觉体验?更好的编码标准带来的低码率高画质、超分等视频处理手段带来的画质提升、三维视频带来深度感知、任意视点视频或者VR360视频带来的用户交互、扩展现实与虚拟现实带来的超现实感;另一方面,智能时代革新了音视频技术,通过音视频分析更好的理解数据与连接用户、通过辅助创作让音视频内容极大丰富。LiveVideoStack2021北京站邀请到腾讯多媒体实验室视频技术总监—李松南,带领我们一起发掘在全真时代与智能时代里多媒体技术的无限可能。
LiveVideoStack
2021/12/21
7320
音视频技术开发周刊 | 225
航拍 HDR 视频的 VVC 和 AV1 编码
视频产业现在处于一个十字路口,巨大的视频服务行业每年价值约 2000 亿美元。视频占互联网所有流量的 80%,这个比例还在增长。而在这 80% 的流量中,80% 是由 H.264 比特流组成的 -- 这是当今主流的视频编解码器。但 H.264 是在 2003 年实现标准化的,整整 18 年了,现在时机已经成熟,需要一个更新、更强大的编解码器来取代它。
用户1324186
2021/11/15
2.3K0
音视频技术开发周刊(第121期)
Appear.in Vs. Jitsi: WebRTC 商业订阅服务对决开源免费服务
LiveVideoStack
2019/11/28
1.1K0
MPEG视频编码增强方案初探
一方面,大多数国家网络带宽不足以支持传送高质量的OTT视频内容。即使在美国,欧洲和日本等发达国家,3Mbps以上用户只有不到10%,2Mbps和3Mbps之间的比例为15-20%,1Mbps和2Mbps之间的比例为40-50%,低于1Mbps的比例超过30%。另一方面,H.264/AVC编解码设备已广泛部署,消费电子设备的更换周期长,难以短时间内升级到更高性能的方案,尽管存在多种新编码替代方案(例如,HEVC,SHVC,VP9,AV1和VVC)。
用户1324186
2019/03/07
1.4K0
MPEG视频编码增强方案初探
音视频编码格式详解
音视频编码格式指的是将音频和视频数据进行压缩、编码和封装的技术,使其在数字通信、存储和传输中更加高效。音视频编码格式可以分为两个部分:编码标准和容器格式。
inthemostwantedsea
2023/04/13
3.7K1
音视频编码格式详解
【前沿动态】视频编码步入更压缩高性能时代
目前,针对海量多媒体数据的压缩和处理,特别是VR和HDR视频数据,开发并提出新的高性能codec及处理方案是多媒体通信应用行业共同面临的难题。MPEG已经开始着手更新一代视频编解码标准VVC的制定,视频压缩性能有望进一步大幅提高。在此背景下,本文简要梳理一下当前针对大规模多媒体数据的高效压缩技术。
用户1324186
2018/07/26
1.2K0
实时通信优化探索,吞吐量与延迟的最佳平衡
吞吐量被定义为在单位时间内通过网络传输的数据量,通常以比特每秒(bps)来衡量。它衡量了网络承载数据的能力。延迟则是指在网络上传输数据时发生的延迟,代表数据包从源到目的地所需的时间。在实时通信中,保持吞吐量与延迟之间的最佳平衡对于确保高效的数据传输和最小化网络拥堵至关重要。
腾讯云音视频
2025/05/20
1460
音视频技术开发周刊 | 235
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 视频超分中的自监督适应方案 本文分享论文『Self-Supervised Adapta
LiveVideoStack
2022/03/08
1.2K0
VP9与H.265的6个不同点
先来了解一下视频在互联网上传输需要经历哪些环节。它必须先使用麦克风和摄像机捕捉音频与视频。然后,原始数据必须压缩(编码)到编解码器中,通过互联网连接(使用传输协议)广播,发送到某种服务器端解决方案(server-side solution)(通常是CDN或一个基于云的集群(cloud-based cluster),如Red5 Pro),然后解压(解码),最终供用户观看视频。
LiveVideoStack
2020/09/24
2.6K0
相关推荐
JEPG XS:低延时视觉无损压缩
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档