摘要算法又称哈希算法,它表示输入任意长度的数据,输出固定长度的数据,相同的输入数据始终得到相同的输出,不同的输入数据尽量得到不同的输出。
Java中的Object.hashCode()
方法就是一个摘要算法,它可以输入任意数据,它的输出是一个int类型,即4个字节的固定长度数据,同时,相同的输入会得到相同的输出,这也是重写equals方法必须重写hashCode方法的原因。
由于输出的长度是固定且输出的长度是不固定的,意味着两个不同的输入可能得到相同的输出,这就是碰撞问题。这就要求在设计Hash算法时,尽量使得碰撞率低,而且不能猜测输出,例如:hash("java1")="123456",hash("java2")="123457",那么我们就可以猜测出hash("java3")="123458",也就是说一个安全的hash算法很难从输出反推输入,只能依靠暴力穷举。
目前常用的摘要算法:
算法 | 输出长度 |
---|---|
MD5 | 128bit |
SHA-1 | 160bit |
SHA-256 | 256bit |
MD5的用途:验证文件完整性;存储用户口令。
系统不用存储用户原始口令,而是存储用户原始口令的MD5,系统计算用户输入的原始口令的MD5并与数据存储的MD5进行对比,如果相同,则说明口令正确,反之则说明口令错误。在使用MD5时我们需要注意彩虹表攻击,彩虹表就是预先存储常用口令和对应MD5值,那么黑客就可以根据彩虹表反查MD5对应的密码,所以为了抵御彩虹表攻击我们不能简单的记录原始口令的MD5值,而是对每个口令额外添加随机数salt,即md5(salt+password)。Java代码如下:
SHA-1算法也是一种哈希算法,输出160bit,它的同类型算法有SHA-256和SHA-512,输出的长度分别是256bit和512bit。SHA-1在Java中使用同MD5类似: