前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >视频技术入门指南

视频技术入门指南

原创
作者头像
timerring
修改2025-06-06 01:01:40
修改2025-06-06 01:01:40
1520
举报

本文翻译自我的英文博客,最新修订内容可随时参考:视频技术入门指南

你真的理解视频技术吗?什么是帧率、分辨率、码率?它们之间有什么关系?你知道“1080p”和“4K”中的“p”和“K”代表什么吗?如何描述视频质量?蓝光光盘(Blu-ray Disc)究竟是什么?H.264/AVC、H.265/HEVC、AV1 等编解码器有什么区别?苹果的 Apple ProRes 又有什么特殊用途?HDR 和杜比视界(Dolby Vision)是什么?为什么视频文件有.mp4、.mkv、.flv 等多种后缀?

本文将从基础概念入手,带你系统理解视频技术的核心要素。

一、基础概念:存储与带宽

1. 存储单位:Gib 与 GB 的区别

  • GB(Gigabyte):十进制单位,1GB = (10^9) 字节(约 10 亿字节),用于硬盘、SSD 等存储设备容量及软件安装包大小。
  • Gib(Gibibyte):二进制单位,1Gib = (2^{30}) 字节(约 10.7 亿字节),用于内存(RAM)、文件系统等需要二进制表示的场景。

2. 带宽(Bandwidth)

  • 单位:bps(bits per second,比特/秒),常见单位为 Mbps(兆比特/秒)。
  • 换算:网络带宽(Mbps)需除以 8 转换为实际传输速度(MBps)。例如,100 Mbps 带宽的实际下载速度约为 12.5 MB/s。
  • 应用场景:流媒体传输(如视频网站、直播)的核心指标,决定视频加载速度和流畅度。

二、视频的核心要素:帧、分辨率与帧率

1. 帧(Frame)与帧率(Frame Rate)

  • 定义:每秒显示的画面数量,单位为 fps(Frames Per Second)。
  • 常见帧率
    • 电影:24 fps(传统胶片感);
    • 电视/网络视频:25 fps(PAL 制式)、30 fps(NTSC 制式);
    • 高帧率(HFR)视频:60 fps(运动场景)、120 fps(慢动作)。
  • 与刷新率的区别
    • 刷新率(Hz):屏幕每秒刷新的次数(如 60Hz、144Hz),若视频帧率高于屏幕刷新率,多余帧会被丢弃。
    • 关键逻辑:视频帧率由内容决定,刷新率由设备硬件决定,两者独立。例如:120Hz 屏幕播放 24fps 视频时,仍以 24fps 显示。

2. 分辨率(Resolution):像素的秘密

  • 定义:视频/屏幕的水平和垂直像素数,如 1920×1080 表示水平 1920 像素、垂直 1080 像素。
  • P 与 i:逐行扫描 vs 隔行扫描
    • 1080p(Progressive Scan):逐行扫描,每帧完整显示所有像素,适合高速运动场景(如体育赛事)。
    • 1080i(Interlaced Scan):隔行扫描,每帧仅显示奇数或偶数行像素,通过交替显示合成完整画面,节省带宽但可能导致动态模糊。
  • K 的含义
    • 电影标准:以水平像素数命名,如 4K 为 4096×2160(接近 4000 像素);
    • 电视/消费级:3840×2160 称为 4K UHD(Ultra High Definition),强调垂直像素为 2160(即 2160p)。

3. 宽高比(Aspect Ratio)

  • 定义:画面宽度与高度的比例,常见比例:
    • 16:9(高清视频、电影);
    • 4:3(传统电视、老电影);
    • 21:9(超宽屏电影)。

三、码率(Bit Rate):质量与体积的平衡

1. 基本概念

  • 定义:编码器每秒生成的数据量,单位为 kbps(千比特/秒)或 Mbps(兆比特/秒)。
  • 计算示例:一部 2 小时、35GB 的电影,码率约为:undefined$$ \frac{35 \times 1024 \times 1024 \times 8}{2 \times 3600} \approx 41 \text{ Mbps} $$
  • 核心逻辑:码率越高,画质越细腻;码率固定时,分辨率越高则画质越模糊(像素增多导致单像素数据量减少)。

2. 码率类型

  • VBR(可变码率):根据画面复杂度动态调整码率(如静态画面用低码率,动态场景用高码率),适合网络视频(节省带宽)。
  • CBR(固定码率):码率恒定,适合直播和电视广播(保证播放稳定性)。

3. 公式与实践

  • 码率估算公式:undefined$$ \text{码率(bps)} = \text{分辨率宽度} \times \text{分辨率高度} \times \text{帧率} \times \text{压缩因子} $$undefined (例:720×480@25fps 视频,压缩因子取 0.08,码率≈720×480×25×0.08 = 691,200 bps ≈ 675 kbps)。
  • 问题解答:undefined 场景:10MB 视频,时长 2 分 21 秒(141 秒),10 Mbps 网络可支持多少人同时观看?undefined 计算:undefined $$ \text{视频码率} = \frac{10 \times 1024 \times 1024 \times 8}{141} \approx 594,937 \text{ bps} \approx 0.595 \text{ Mbps}undefined$$ $$ \text{支持人数} = \frac{10 \text{ Mbps}}{0.595 \text{ Mbps}} \approx 16.8 \rightarrow \text{16人(向下取整)} $$

四、视频质量:从 PSNR 到 VMAF

1. 客观指标

  • PSNR(峰值信噪比):衡量图像压缩后的失真程度,单位为 dB(分贝)。
    • 50 dB:几乎无失真(无损压缩);
    • 35 dB:可接受的压缩质量(常见于网络视频)。
  • VMAF(视频多方法评估融合):Netflix 开发的综合指标,结合清晰度、块效应、运动流畅度等多维度评估画质。

2. 主观感受与压缩 trade-off

  • 分辨率 vs 码率
    • 低码率下,高分辨率可能因像素过多导致画质劣于低分辨率(如图)。
    • 网络视频平台策略:若设备不支持高分辨率,优先提高码率以提升画质(如 YouTube 的“高清增强”)。

五、编解码器(Codec):压缩的艺术

1. 核心原理

  • 流程:摄像头采集原始图像 → 编码器压缩为字节流 → 存储/传输 → 解码器还原为像素数据(如 YUV420P、RGB)。
  • 容器 vs 编解码器
    • 容器(如 .mp4、.mkv):仅定义数据封装格式,不涉及压缩;
    • 编解码器(如 H.264、AV1):负责视频压缩与解压缩。

2. 主流编解码器对比

编解码器

发布时间

压缩效率(对比 H.264)

特点

应用场景

H.264/AVC

2003

基准(100%)

兼容性最强,专利收费,最高支持 4K(部分场景需高码率)

网络视频、蓝光、直播

H.265/HEVC

2013

+50%

同等画质下码率减半,支持 8K,专利收费

4K/8K 流媒体、蓝光(如杜比视界)

AV1

2018

+20%(对比 VP9)

开源无专利费,压缩效率高,硬件支持逐步普及

网页流媒体(YouTube、B站)

Apple ProRes

低压缩( intra 编码)

保留完整帧数据,便于后期编辑,文件体积大

影视后期制作、苹果生态

3. 压缩技术:帧内 vs 帧间

  • 帧内压缩(Intra):仅压缩单帧画面(如 ProRes),适合需要频繁剪辑的场景(如 Premiere Pro)。
  • 帧间压缩(Inter):利用相邻帧的相似性压缩(如 H.264 的 I/P/B 帧结构),压缩率更高但编辑难度大。
    • I 帧(关键帧):独立完整帧,体积最大;
    • P 帧:参考前一 I/P 帧的差异帧;
    • B 帧:参考前后帧的双向差异帧,体积最小。

六、HDR 与色彩:超越人眼的视觉体验

1. 高动态范围(HDR)

  • 核心优势:相比 SDR(标准动态范围),HDR 可显示更宽的亮度范围(如 0.0001 nit 到 1000 nit+)和更丰富的色彩(10-bit/12-bit 色深)。
  • 主流标准:undefined| 标准 | 色深 | 亮度支持 | 动态元数据 | 特点 |undefined|------------|--------|----------------|------------|-------------------------------|undefined| HDR10 | 10-bit | 1000 nit | 静态 | 开源免费,适合流媒体 |undefined| Dolby Vision | 12-bit | 10000 nit | 动态 | 画质最佳,需授权(高端电视/电影)|undefined| HDR10+ | 10-bit | 4000 nit | 动态 | 三星主导,兼容 HDR10 |

2. 色彩空间与色深

  • 色深:单个像素的色彩位数,8-bit 色深可显示 (256^3=1677) 万色,10-bit 则达 10.7 亿色(色彩过渡更平滑)。
  • YUV 格式:将亮度(Y)与色度(UV)分离存储,节省带宽(如 YUV420P 仅存储 1/4 色度数据)。

七、视频格式:容器的秘密

1. 常见容器格式

格式

特点

应用场景

MP4

最通用容器,支持流媒体,fMP4(碎片化 MP4)可边下载边播放

手机视频、网络点播

FLV

结构简单,适合直播(如 RTMP 推流)

实时直播、早期视频网站

TS

流媒体专用,HLS 协议基于 TS(分段为 .ts 文件)

苹果生态直播、电视广播

MKV

开源容器,支持多音轨/字幕,适合高清片源

本地播放、影视收藏

2. 流媒体协议

  • HLS(HTTP Live Streaming):将视频切分为 .ts 片段,通过 m3u8 索引文件播放,适合移动端和弱网环境。
  • RTMP/HTTP-FLV:基于 FLV 格式的实时推流协议,延迟较低(约 1-3 秒),常见于直播平台。

八、蓝光(Blu-ray)与存储介质

  • 本质:利用蓝色激光(波长 405nm)读取存储数据,容量远超 DVD(单层蓝光碟容量 25GB,双层 50GB)。
  • 超高清蓝光(Ultra HD Blu-ray):支持 4K UHD(3840×2160)、H.265 编码、HDR10 及杜比视界,容量可达 100GB。

九、设备与性能:解码的挑战

  • 硬件加速:现代 GPU/CPU 支持 H.264/H.265 硬件解码(如 Intel Quick Sync、NVIDIA NVDEC),降低功耗。
  • 兼容性问题:AV1 编码画质优秀但依赖高端设备,低端手机可能无法流畅播放(需软件解码,功耗高)。

总结:关键概念速查表

概念

定义/特点

帧率

每秒画面数(fps),影响流畅度,电影常用 24fps,游戏常用 60fps+

分辨率

像素数(如 1080p=1920×1080),“p”=逐行扫描,“K”≈千级水平像素

码率

每秒数据量(bps),决定画质,VBR 动态优化,CBR 固定稳定

编解码器

压缩算法,H.264 兼容强,H.265 高效但收费,AV1 开源适合未来

HDR

高动态范围,提升亮度和色彩,Dolby Vision 画质最佳,HDR10 最普及

容器格式

数据封装方式,.mp4 通用,.ts 适合直播,.mkv 适合多音轨高清文件

通过理解这些核心概念,可帮助你在视频制作、流媒体开发或观影体验优化中做出更明智的选择。如需深入探讨编码参数调优或设备性能分析,欢迎访问博客获取更多技术细节:视频技术入门指南

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、基础概念:存储与带宽
    • 1. 存储单位:Gib 与 GB 的区别
    • 2. 带宽(Bandwidth)
  • 二、视频的核心要素:帧、分辨率与帧率
    • 1. 帧(Frame)与帧率(Frame Rate)
    • 2. 分辨率(Resolution):像素的秘密
    • 3. 宽高比(Aspect Ratio)
  • 三、码率(Bit Rate):质量与体积的平衡
    • 1. 基本概念
    • 2. 码率类型
    • 3. 公式与实践
  • 四、视频质量:从 PSNR 到 VMAF
    • 1. 客观指标
    • 2. 主观感受与压缩 trade-off
  • 五、编解码器(Codec):压缩的艺术
    • 1. 核心原理
    • 2. 主流编解码器对比
    • 3. 压缩技术:帧内 vs 帧间
  • 六、HDR 与色彩:超越人眼的视觉体验
    • 1. 高动态范围(HDR)
    • 2. 色彩空间与色深
  • 七、视频格式:容器的秘密
    • 1. 常见容器格式
    • 2. 流媒体协议
  • 八、蓝光(Blu-ray)与存储介质
  • 九、设备与性能:解码的挑战
  • 总结:关键概念速查表
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档