对于使用深度学习的计算机视觉任务,我是否应该担心图像大小(例如256×256)或PPI (每英寸像素)?
我发现在计算机视觉/深度学习文献中没有讨论PPI。
大小为256 x 256的图像的最佳PPI是多少?
发布于 2018-05-18 13:24:04
PPI只与物理对象相关,如屏幕或纸上的表示。它是每英寸的像素,并定义了图像X与Y像素在该对象上的大小。所以,如果你有一个256×256像素的图像,并且在屏幕上显示256 PPI,如果你把尺子放在上面,它将是1英寸正方形。
许多物理器件具有自然的PPI特性。屏幕通常是72 PPI,100 PPI,或大约300 PPI用于"Retina“设备。激光打印机开始在300 PPI和更高。
因此,如果在100个PPI屏幕上显示一个256x256图像,作为一个图像像素到一个屏幕像素的直接映射,您将得到一个2.56“的图像。
如果你放大图像,你可以使它在屏幕上更大,现在它将覆盖超过256像素的屏幕。底层图像数据仍然是一个256 x 256值的数组。
扫描仪是PPI的另一个重要领域。如果你以300 PPI扫描1英寸的图像,你会得到300×300像素的图像。将扫描仪设置为1200 DPI,得到1200 x 1200像素的图像,这是更精细的细节。
总之,PPI与CV或ML算法无关,因为它们只关心像素数。
发布于 2021-07-06 14:38:23
图像分辨率和PPI在目标检测和识别中起着重要的作用。不管你是使用复杂的神经网络,传统的计算机视觉方法,还是用你自己的眼睛看,如果你有一个物体在一幅图像中只有4到4个像素,那么你将无法用任何方法可靠地检测到它,除非它在场景中有一个独特的颜色。即使如此,另一个在正确距离上颜色相同的物体也会被误认为它,因为根本就没有足够的像素来分辨区别。
这背后的概念叫做像素密度。不同的计算机视觉任务,无论它们提出的解决方案,需要不同的最小像素密度。例如,如果我们对人类感兴趣,这里有一个很好的例子:
https://datascience.stackexchange.com/questions/31820
复制相似问题