Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >音视频知识图谱 2022.11

音视频知识图谱 2022.11

作者头像
关键帧
发布于 2023-02-14 08:38:26
发布于 2023-02-14 08:38:26
1K0
举报
文章被收录于专栏:关键帧Keyframe关键帧Keyframe

前些时间,我在知识星球上创建了一个音视频技术社群:关键帧的音视频开发圈,在这里群友们会一起做一些打卡任务。比如:周期性地整理音视频相关的面试题,汇集一份音视频面试题集锦,你可以看看这个合集:音视频面试题集锦。再比如:循序渐进地归纳总结音视频技术知识,绘制一幅音视频知识图谱,你可以看看这个合集:音视频知识图谱

下面是 2022.11 月知识图谱新增的内容节选:

1)图谱路径:渲染/AspectRatios

  • PAR(Pixel Aspect Ratio),单个像素的宽高比。大多数情况像素宽高比为 1:1,是一正方形像素。如果不是 1:1,则为长方形像素。常用的 PAR 有:1:1、10:11、40:33、16:11、12:11。
  • SAR(Sample Aspect Ratio),采样纵横比。表示横向的像素点数和纵向的像素点数的比值,即我们通常提到的分辨率的宽高比。比如 VGA 图像 SAR 是 640/480=4:3,D-1 PAL 图像 720/576=5:4 等。
  • DAR(Display Aspect Ratio),显示宽高比。即最终播放出来的画面的宽高比。比如常见的 16:9、4:3 等。缩放视频也要按这个比例来,否则会使图像看起来被拉伸了。
  • 关系:PAR x SAR = DAR 或 PAR = DAR / SAR
  • 播放器处理:播放器标准的播放流程,应该是先找视频容器格式也就是 container 中的 DAR,按这个比例来显示视频,进行播放;如果没有 DAR 的话,则使用 SAR 进行视频显示。
  • 视频制式:视频制式按照录制设备可以分为计算机制式和电视制式。计算机制式的 PAR 常为 1:1,而电视制式的 PAR 通常不是 1:1,电视制式又分为 NTSC 或 PAL 制式,它们的 PAR 又可能不同。

2)图谱路径:渲染/图像渲染技术/OpenGL

  • OpenGL:一套跨语言、跨平台,支持 2D、3D 图形渲染接口。这套接口由一系列的函数组成,定义了如何对简单及复杂的图形进行绘制。这套接口涉及到对设备的图像硬件进行调用,因此在不同的平台基于这套统一接口做了对应的实现。
  • OpenGL ES:OpenGL 的子集,是针对手机和游戏主机等嵌入式设备而设计,去除了许多不必要和性能较低的 API 接口。
  • OpenGL 在程序中角色:OpenGL 位于 GPU 驱动和平台图形绘制 API 之间;也可以直接使用用于图形绘制。驱动 GPU 芯⽚⾼效图形渲染。
  • OpenGL 的渲染架构:OpenGL 的渲染架构是 Client/Server 模式。我们开发的过程就是不断用 Client 通过 OpenGL 提供的通道去向 Server 端传输渲染指令,来间接的操作 GPU 芯片。Client 向 Server 传递参数和渲染信息的通道:
    • Attribute(属性通道):通常用来传递经常可变参数。
    • Uniform(统一变量通道):通常用来传递不变的参数。
    • Texture Data(纹理通道):专门用来传递纹理数据的通道。
  • OpenGL 状态机:一系列的变量描述 OpenGL 此刻应当如何运行。OpenGL 的状态通常被称为 OpenGL 上下文(Context)。我们通常使用如下途径去更改 OpenGL 状态:设置选项,操作缓冲。最后,我们使用当前 OpenGL 上下文来渲染。
  • OpenGL 图形渲染管线:顶点着色器 → 图元装配 → 几何着色器 → 光栅化 → 片段着色器 → 测试与混合
  • EGL:OpenGL ES 渲染 API 和本地窗口系统之间的一个中间接口层,它主要由系统制造商实现。
    • OpenGL ES 系统与本地窗口(UIKit)系统的桥接由 EAGL 上下文系统实现。
    • Android EGL 不同的是,iOS EAGL 不会让应用直接向 BackFrameBuffer 和 FrontFrameBuffer 进行绘制,也不会让应用直接控制双缓冲区的交换(swap),系统自己保留了这些操作权,以便可以随时使用 Core Animation 合成器来控制显示的最终外观。
    • Display 是对实际显示设备的抽象。在 Android 上的实现类是 EGLDisplay。
    • Surface 是对用来存储图像的内存区域 FrameBuffer 的抽象,包括 Color Buffer、Stencil Buffer、Depth Buffer。在 Android 上的实现类是 EGLSurface。
    • Context 存储 OpenGL ES 绘图的一些状态信息。在 Android 上的实现类是 EGLContext。
    • 与设备的原生窗口系统通信;
    • 查询绘图图层的可用类型和配置;
    • 创建绘图图层;
    • 在 OpenGL ES 和其他图形渲染 API 之间同步渲染;
    • 管理纹理贴图等渲染资源。
    • Android EGL
    • iOS EGL = EAGL(Embedded Apple Graphics Library)
  • VBO、EBO 和 VAO
    • VBO(Vertex Buffer Objects)顶点缓冲区对象,指的是在 GPU 显存里面存储的顶点数据(位置、颜色)。
    • EBO/IBO(Element/Index Buffer Object)索引缓冲区对象,存储索引来达到减少重复数据。
    • VAO(Vertex Array Object)顶点数组对象。
    • VBO 和 EBO 的作用是在 GPU 显存中开辟一块存储空间来缓存顶点数据或者图元索引数据,避免每次绘制时 CPU 内存到 GPU 显存的数据拷贝,从而提升渲染性能。
    • VAO 的作用是管理 VBO 或 EBO,减少 glBindBuffer、glEnableVertexAttribArray、glVertexAttribPointer 这些调用操作,高效地实现在顶点数组配置之间切换。
  • FBO:帧缓冲区对象 FBO(Frame Buffer Object)
    • 默认的帧缓冲区(Default Frame Buffer):在建立了 OpenGL 的渲染环境后,我们相当于有了一只画笔和一块默认的画布,这块画布就是我们的屏幕,是一块默认的帧缓冲区(Default Frame Buffer)。
    • 离屏渲染:我们可以认为 OpenGL 的 FBO 就相当于是模拟了默认帧缓冲区的功能和结构创建了一种可以作为『画布』使用的 Object。从而支持离屏渲染。
    • 附着与附件:FBO 并不是一个真正的缓冲区,因为 OpenGL 并没有为它分配存储空间去存储渲染所需的几何、像素数据,它是一个指针的集合,这些指针指向了颜色缓冲区、深度缓冲区、模板缓冲区、累积缓冲区等这些真正的缓冲区对象,我们把这里的指向关系叫做『附着』。附着点类型有:颜色附着、深度附着和模板附着。这些附着点指向的缓冲区通常包含在某些对象里,我们把这些对象叫做『附件』。附件的类型有:纹理(Texture)或渲染缓冲区对象(Render Buffer Object,RBO)。

3)图谱路径:渲染/伽马校正

伽马校正的历史:

  • 显示伽马(Display Gamma)
    • 人们在使用 CRT 时发现它有一个问题:调节电压为原来的 n 倍,对应的屏幕发光亮度并没有提高 n 倍,而是一个类似幂律曲线的关系。典型的 CRT 显示器产生的亮度约为输入电压的 2.2 次幂,这个就是『显示伽马』。
  • 伽马校正(Gamma Correction)
    • 由于显示伽马问题的存在,为了使最终显示出来的图像亮度与捕捉到的真实场景的亮度是成线性比例关系,就需要在将图像输入到显示器之前对信号进行一个修正,这个修正过程就叫做『伽马校正』。
  • 编码伽马(Encoding Gamma)
    • 修正显示伽马过程增加的伽马则叫做『编码伽马』。
    • 增加编码伽马通常是在图像采集设备的电路中完成的。
  • 端到端伽马(End-to-End Gamma)
    • 编码伽马和显示伽马的乘积就是整个图像系统的『端到端伽马』。
    • 如果端到端伽马乘积为 1,那么显示出来的图像亮度与捕捉到的真实场景的亮度就是成线性比例的。
  • 额外收益
    • 伽马校正的所做非线性转换过程除了解决显示伽马的问题外,还带来了一个额外收益:传输期间增加的噪声(模拟信号时代),在噪声比较明显的较暗信号区域(在接收器做了伽马校正后)会被减少。因为我们的视觉系统对相对亮度差别是敏感的,经过伽马校正后的非线性梯度明显对人眼感知来说更均匀。

伽马校正技术的延伸:

  • sRGB 颜色空间
    • 2.2 是大多数 CRT 显示器的平均 Gamma 值。基于这个原因,1996 年,惠普与微软选择 Gamma 校准系数为 2.2 的颜色空间作为一种标准推出作为生成在因特网上浏览的图像的通用颜色空间,这就是 sRGB(Standard RGB)颜色空间,这是一个非线性的颜色空间。
    • sRGB 颜色空间得到了众多厂商支持,这样一来,遵循 sRGB 标准的图像处理都在这个非线性颜色空间中处理即可。
  • LCD 显示器向前兼容显示伽马
    • LCD 显示器本身确实没有 CRT 显示器的伽马效应,但是为了兼容性,LCD 以及其他非 CRT 显示设备都模拟了这个伽马效应以实现先前兼容,甚至可以支持动态调节伽马参数。
  • 光电转换函数设计目标面向人眼的特性而非显示伽马
    • 因为人眼对亮度感知是非线性的特点,我们可以用更多的码率来编码人眼敏感的中等亮度或暗部细节,从而使得编码在讨好人眼上有更好的 ROI。这样一来,我们在采集电路中采集到光信号向电信号转换时,通常会将其转换为非线性信号,以利于我们做编码,因此在传感数据上做伽马校正仍然是有用的。只是我们的伽马曲线参数要做调整了,曲线参数的目标不再是面向之前的 CRT 显示伽马,而是面向人眼的特性。这就有了后续的光电转换函数(Optical-Electro Transfer Function)和电光转换函数(Electro-Optical Transfer Function)。
    • PQ(Perceptual Quantizer,感知量化)曲线的设计更接近人眼的特点,亮度表达更准确。
    • HLG(Hybrid Log Gamma,混合对数伽马)曲线在低亮度区域基本与 Gamma 曲线重合,所以提供了与 SDR 显示设备很好的兼容性。
  • 线性颜色空间仍有使用场景
    • 计算机视觉的一些图像处理场景,还是需要图像的亮度信息在线性颜色空间中才能进行处理,这时候则需要撤销伽马校正后再进行处理。在处理完成后,将图像输入显示器之前再重新做伽马校正。

4)图谱路径:渲染/HDR

  • HDR 与 SDR 的区别:
    • SDR 支持的亮度范围在 0.1nit 到 100nit 之间,使用 Rec.709/sRGB 色域,并使用 Gamma 曲线来作为它的电光转换函数
    • HDR 支持更大的亮度范围(0.0005-10000nit)、更宽广的色域(BT.2020)、更高精度的量化(10bit 或 12bit),转换函数使用 PQ 或 HLG。
    • HDR 视频画面可以展现出更多的亮部和暗部细节,画面拥有丰富的色彩和生动自然的细节表现,因此画面更接近人眼所见。
  • SDR 和 HDR 的转换函数:
    • BT.709 Gamma(SDR)
    • HLG(HDR):HLG(Hybrid Log Gamma,混合对数伽马)曲线是另外一个重要的 HDR 转换函数曲线,由 BBC 和 NHK 公司开发。这个曲线与 PQ 曲线不同,HLG 规定的是 OETF 曲线,因为在低亮度区域基本与 Gamma 曲线重合,所以提供了与 SDR 显示设备很好的兼容性,在广播电视系统里有着广泛的应用。HLG 曲线最早在 ARIB STD-B67 中进行了标准化,后面也进入了 ITU-R BT.2100。
    • PQ-SMPTE ST2084(HDR):PQ(Perceptual Quantizer,感知量化)曲线的设计更接近人眼的特点,亮度表达更准确。基于人眼的对比敏感度函数(Contrast Sensitivity Function,CSF),在 SMPTE ST 2084 标准中规定了 EOTF 曲线。亮度范围可从最暗 0.00005nit 到最亮 10000nit。PQ 曲线最早是由 Dolby 公司开发的,并且在 ST 2084 中进行了标准化。
  • HDR 视频转 SDR 视频:
    • 1、HDR 非线性电信号转为 HDR 线性光信号(EOTF)
    • 2、HDR 线性光信号做颜色空间转换(Color Space Converting),通常是从 BT.2020 转换到 BT.709
    • 3、HDR 线性光信号色调映射为 SDR 线性光信号(Tone Mapping)
    • 4、SDR 线性光信号转 SDR 非线性电信号(OETF)

下面是 2022.11 月的知识图谱新增内容快照(图片被平台压缩不够清晰,可以加文章后面微信索要清晰原图):

2022.11 知识图谱新增内容

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-12-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 关键帧Keyframe 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
HDR关键技术:HEVC/H.265编码优化
与传统标准动态范围(SDR)视频相比,高动态范围(HDR)视频由于比特深度的增加提供了更加丰富的亮区细节和暗区细节。最新的显示技术通过清晰地再现HDR视频内容使得为用户提供身临其境的观看体验成为可能。面对目前日益增长的HDR视频消费需求,研究现有的压缩工具或引入新的技术来高效压缩HDR视频变得十分迫切。本文将介绍有关MPEG及VCEG针对HDR视频压缩的研究进展。
用户1324186
2018/08/08
5.4K0
HDR关键技术:HEVC/H.265编码优化
想在自己的视频平台支持 HDR 需要做哪些工作?丨有问有答
今天我们要讨论的是关键帧的音视频开发圈的一位朋友在社群里提的问题,如下: 当下流行的 HDR 与编解码之间有什么关系?如果想要自己的视频平台支持 HDR 格式视频大概需要做哪些工作?HDR 如何兼容 SDR 显示设备? 以下是回答,欢迎大家留言讨论补充: 1、HDR 与编解码之间有什么关系? 从概念上初看,HDR 和编解码没啥关系;但从实现上看,HDR 需要编解码标准的支持。 HDR 本质上是属于『颜色空间』这个方向,目标是提升对现实场景进行数字化后的颜色体验。HDR 是相对 SDR 的技术改进,HDR 提
关键帧
2022/11/29
4300
图像的表示(2):YCbCr 怎么来的?必看这篇颜色空间发展简史丨音视频基础
在前面的文章《图像的表示(1)》里,我们提出了一个问题:从我们眼睛看见的『画面』,到我们用手机、电脑所处理的『图像数据』,其中经历了什么?从这个问题出发,我们探讨了『图像的定义是什么』和『图像成像的原理是什么』这两个问题,接下来我们继续探讨下个问题:『怎样对图像进行数学描述』。全文分为如下几节内容:
关键帧
2022/06/13
2K0
图像的表示(2):YCbCr 怎么来的?必看这篇颜色空间发展简史丨音视频基础
Gamma校正_显示器伽马值调多少
过去, 大多数监视器是阴极射线管显示器(CRT). 这些监视器有一个物理特性就是两倍的输入电压产生的不是两倍的亮度. 输入电压产生约为输入电压的 2.2 次幂的亮度. 这本质上是一个问题, 但是由于一个神奇的巧合, CRT显示器的这一特性被保留了下来.
全栈程序员站长
2022/11/08
3.5K0
Gamma校正_显示器伽马值调多少
HDR关键技术:主要标准介绍
HDR是UHD技术中最重要维度之一,带来新的视觉呈现体验。HDR技术涉及到采集、加工、传输、呈现等视频流程上的多个环节,需要定义出互联互通的产业标准,以支持规模化应用和部署。本文整理当前HDR应用中的一些代表性的国际标准。
用户1324186
2018/08/23
6.4K0
HDR关键技术:主要标准介绍
HDR关键技术:逆色调映射(一)
HDR技术近年来发展迅猛,在未来将会成为图像与视频领域的主流。当前HDR内容非常短缺,限制了HDR视听节目的广泛应用。逆色调映射(Inverse Tone Mapping)应运而生,它是一种用来将SDR源信号转换为HDR源信号的技术,可以应用于生产端或终端设备,在一定程度上实现对现有SDR节目的HDR“还原”及向上兼容。本系列中,我们将会详细分类介绍逆色调映射算法。分为两个部分:(一)逆色调映射概述及一些经典算法,包括全局算法,分类算法以及拓展映射算法;(二)介绍最近的研究趋势,特别是基于机器学习的逆色调映射算法。Let's go for the first part!
用户1324186
2018/07/26
10.8K0
HDR关键技术:逆色调映射(一)
HDR关键技术:HEVC/H.265编码方案
前文我们对HEVC的HDR编码优化技术做了介绍,侧重编码性能的提升。本章主要阐述HEVC中HDR/WCG相关的整体编码方案,包括不同应用场景下的HEVC扩展编码技术。
用户1324186
2018/08/08
7.5K0
HDR关键技术:HEVC/H.265编码方案
音视频面试题集锦(第 11 期)
双缓冲机制主要目的是为了解决计算机图形学中的屏幕闪烁和画面流畅性问题。该机制通过在内存中创建两个缓冲区:一个用于绘制图像的后缓冲区,一个用于显示图像的前缓冲区,来避免因为输入输出速度不匹配造成的界面闪烁、卡顿等现象。这个问题是很老的问题了,目前的系统基本都已经支持双缓冲了。
关键帧
2023/11/30
5000
音视频面试题集锦(第 11 期)
HDR关键技术—色域映射
HDR系列前几期为大家介绍了HDR的色调映射技术(Tone Mapping)。其中提到:在色调映射环节,为了便于操作,且不使图像颜色产生巨大失真,色调映射算法通常会仅处理图像亮度信息,将HDR图像亮度映射到SDR图像亮度域中,通过原HDR图像的颜色信息,恢复并重建SDR图像的颜色信息。由于前面的主题是色调映射,因此颜色转换相关技术,我们没有深入介绍。但颜色转换或色域映射问题(Color Transfer or Gamut Mapping),也是HDR的重要环节。本文将介绍HDR中颜色转换(或色域映射)技术,分为两个部分,第一部分介绍色域映射的定义以及相关背景知识;第二部分将介绍代表性的色域映射算法,特别对ITU中相关标准进行浅析。
用户1324186
2018/07/26
9.7K0
HDR关键技术—色域映射
WWDC 2022 音视频相关 Session 概览(EDR 相关)丨音视频工程示例
这个公众号会路线图式的遍历分享音视频技术:音视频基础(完成) → 音视频工具(完成) → 音视频工程示例(进行中) → 音视频工业实战(准备)。关注一下成本不高,错过干货损失不小 ↓↓↓
关键帧
2022/11/29
2.7K0
WWDC 2022 音视频相关 Session 概览(EDR 相关)丨音视频工程示例
显示器中的HDR10、HDR400、HDR600有什么区别?
HDR10和HDR400、HDR500、HDR600、HDR1000等看似是类似的概念,都是HDR后面带了一个数字,但实际意义却相差甚远。
微帧Visionular
2024/11/13
10.4K0
显示器中的HDR10、HDR400、HDR600有什么区别?
ISP Pipeline | camera成像原理
由于Sensor漏电流存在,刚把镜头放入一个全黑的环境,Sensor输出的原始数据不为0;而我们希望全黑时原始数据为0。
iResearch666
2023/12/14
1.5K0
ISP Pipeline | camera成像原理
即时通讯音视频开发(二十):一文读懂视频的颜色模型转换和色域转换
在视频处理中,我们经常会用到不同的色彩空间:非线性RGB,线性 RGB,YUV,XYZ……为什么需要这么多的色彩空间呢?为什么在 FFMpeg 中会有 color_space,color_transfer,color_primaries 等一系列的颜色属性呢?这些术语之间究竟隐藏着什么秘密?
JackJiang
2023/10/12
5590
即时通讯音视频开发(二十):一文读懂视频的颜色模型转换和色域转换
伽马校正和颜色空间
所谓gamma校正,实际上是一个颜色的非线性变换。下面来解释这个变换曲线存在的原因。
全栈程序员站长
2022/11/08
8670
伽马校正和颜色空间
伽马校正_液晶电视伽马校正
注:本文为博主参考书籍和他人文章并加上自己的理解所编,作为学习笔记使用并将其分享出去供大家学习。若涉及到引用您的文章内容请评论区告知!如有错误欢迎指正!
全栈程序员站长
2022/11/10
1.2K0
伽马校正_液晶电视伽马校正
符合HVS的色调映射方法
目前大多数的高动态范围 HDR 混合 Log-GAMMA(HLG)到标准动态范围(SDR)的转换都依赖于一种数学方法,将色彩量从 BT.2100 减少到 BT.709。通常情况下,色调映射将一个色彩空间的亮度分量映射到另一个色彩空间,以实现 HDR 到 SDR 内容之间的非线性映射。
用户1324186
2022/02/18
1.9K0
符合HVS的色调映射方法
音视频知识图谱 2022.04
前些时间,我在知识星球上创建了一个音视频技术社群:关键帧的音视频开发圈,在这里群友们会一起做一些打卡任务。比如:周期性地整理音视频相关的面试题,汇集一份音视频面试题集锦,你可以看看《音视频面试题集锦 2022.04》。再比如:循序渐进地归纳总结音视频技术知识,绘制一幅音视频知识图谱。
关键帧
2022/06/13
7570
音视频知识图谱 2022.04
HDR关键技术:主要标准介绍(续)
前文我们已经对HEVC的HDR编码优化技术和HDR/WCG相关的整体编码方案做了介绍,本文总结几种具有代表性的技术方案,对业内常用的几个HDR分发标准做简要梳理。
用户1324186
2018/08/23
4.3K0
HDR关键技术:主要标准介绍(续)
图像伽马校正_自动梯形校正
图中可以看到,sRGB和Rec.709的色域虚线一样,三原色的位置是相同的,那么它们之间的区别就是:传递函数不同
全栈程序员站长
2022/11/08
1.6K0
图像伽马校正_自动梯形校正
Unity-伽马空间和线性空间是什么与他们之间的不同?
译自:http://www.kinematicsoup.com/news/2016/6/15/gamma-and-linear-space-what-they-are-how-they-differ
祝你万事顺利
2019/07/18
2.4K0
Unity-伽马空间和线性空间是什么与他们之间的不同?
相关推荐
HDR关键技术:HEVC/H.265编码优化
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档