数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。本专栏将以学习笔记形式对数字图像处理的重点基础知识进行总结整理,欢迎大家一起学习交流! 专栏链接:数字图像处理学习笔记
内插是在诸如放大、收缩、旋转和几何校正等任务中广泛应用的基本工具 从根本上看,内插是用已知数据来 估计未知位置的数值的处理 实现图像内插的方法有三种: 最近邻内插法、双线性内插法、双三次内插法
理解:在原图像中寻找最接近的像素,并把该像素的灰度赋给加想要创建大小的网格中的新像素 当我们完成对网格中覆盖的所有点的灰度赋值后,就把图像扩展到原来规定的大小,得到放大后的图像 本方法不常用是因为会产生不希望的人为缺陷的倾向(如某些直边缘的严重失真)
赋于点(x,y)灰度值公式:v(x,y)=ax+by+cxy+d
注:与该方法名称相反的是,双线性内插不是一种线性内插方法,因为其中包含有xy项 4个系数可由4个用(x,y)点最近邻点写出的未知方程确定(四个未知数四个方程) 双线性内插法给出了比最近邻内插好得多的结果,但随之而来的是计算量的增加
赋于点(x,y)灰度值公式:v(x,y)=
注:双三次内插包括16个最近邻点 16个系数可由16个用(x,y)点最近邻点写出的未知方程式确定 如果求和的上下限为1和0时,那么就变成了双线性内插v(x,y)=ax+by+cxy+d公式的形式 通常,双三次内插在保持细节方面比双线性内插相对较好,但其计算量非常大 双三次内插是商业图像编辑程序的标准内插方法
关于最近邻内插法、双线性内插法、双三次内插法的代码实现之后会有一节笔记专门讲述,请打开专栏查看! 专栏链接:数字图像处理学习笔记
关于数字图像的度量,有欧氏距离、曼哈顿距离、切比雪夫距离之分
对于坐标分别为(x,y),(s,t),(v,w)的像素p,q,z
注:距点(x,y)的距离小于等于某个值r的像素是中心在(x,y)且半径为r的圆平面
(又称城市街区、曼哈顿)距离
注:距点(x,y)的距离小于等于某个值r的像素形成一个中心在(x,y)的菱形 例如距中心点(x,y)的距离小于等于2的像素,形成固定距离的如右图轮廓:
其中
=1的像素是(x,y)的4领域。
(又称切比雪夫、棋盘)距离
注:距点(x,y)的距离小于等于某个值r的像素形成一个中心在(x,y)的方形
例如距中心点(x,y)的距离小于等于2的像素,形成固定距离的如右图轮廓:
其中
=1的像素是(x,y)的8领域。
☞注:x,y说明图像像素的空间坐标 函数值 f 代表了在点(x,y)处像素的灰度值
☞注:m , n说明图像的宽和高。 矩阵元素a(i,j)的值,表示图像在第 i 行,第 j 列的像素的灰度值(i,j表示几何位置)
☞如图像高度和宽度等信息
☞顺序存放的连续数据
☞1.位图文件头
☞ 2.位图信息头
☞ 3.调色板 注:有些位图不需要调色板,如真彩色图,它们的后面直接是位图数据
☞4.图像数据 注:1字节=8位 对于2色位图,1位表示一个像素颜色(2=
), 所以一个字节表示8个像素 对于16色位图,4位表示一个像素颜色(16=
), 所以一个字节表示2个像素 对于256色位图,8位表示一个像素颜色(256=
),所以1个字节表示1个像素 对于真彩色图,3个字节表示一个像素(因为真彩图有R、G、B三个通道)
表示像素明暗程度的整数量 例如:像素的取值范围为0-255,就称该图像为256个灰度级的图像
表示图像实际拥有的灰度级的数量 例如:具有32种不同取值的图像,可称该图像具有32个层次 图像数据的实际层次越多,视觉效果就越好
指一幅图像中灰度反差的大小
对比度 = 最大亮度 / 最小亮度(即最大像素值/最小像素值)
与清晰度相关的主要因素:亮度、对比度、尺寸大小、细微层次、颜色饱和度