现在大家在日常办公的时候都会接触到压缩软件,但是有些比较大的软件压缩就很慢,而且压缩文件不能一层层压缩自身。
信息表示也是有极限的,比如标量压缩,后来又矢量压缩码书啥的,还有信道传输里的各种编码,不过是为了逼近香农限。压缩是要还原的。不管量化有损无损,压缩本身的极限放在那里。否则md5这种hash函数类再多的信息也可以压成固定大小,然而恢复不回来了。
压缩算法只不过是想将「文件容量大于其所含信息量的那一部分」当成海绵中的水挤出来,但是总不能挤到连海绵都被挤消失的地步。
事实上,压缩总归是有个算法的。就是说压缩也不是凭空压缩的,是根据特定的方法来压缩,而这个特定的方法就决定了压缩的结果。
而接近无限小是压缩的终极目标,但所谓人力有限,小到一定程度,就是极限了,在极限的情况下在压缩,结果就是不变,但是压缩软件还需要给新的一次压缩结果写上压缩信息以在解压时识别,这样,数据反而增加了。
从理论上说的确可以一次又一次,越压缩越小的可能,但是只有一种情况,就是不断地提高压缩时的损失率,最终,当你舍弃所有的信息的时候,你可以把文件压缩到0字节。但是这种“为了压缩而压缩”的做法,是没有任何实际意义的。
领取专属 10元无门槛券
私享最新 技术干货