哈希函数可以把给定的数据转换成固定长度的无规律数值。转换后的无规律数值可以作为数据摘要应用于各种各样的场景。
哈希函数的特征
第一个特征是输出的哈希值数据长度不变。
第二个特征是如果输入的数据相同,那么输出的哈希值也必定相同。
第三个特征是即使输入的数据相似,但哪怕它们只有一比特的差别,那么输出的哈希值也会有很大的差异。输入相似的数据并不会导致输出的哈希值也相似。
第四个特征是即使输入的两个数据完全不同,输出的哈希值也有可能是相同的,虽然出现这种情况的概率比较低。这种情况叫作“哈希冲突”。
第五个特征是不可能从哈希值反向推算出原本的数据。输入和输出不可逆这一点和加密有很大不同。
最后一个特征是求哈希值的计算相对容易。
哈希函数的算法
哈希函数的算法中具有代表性的是MD5、SHA-1和SHA-2等。其中SHA-2是现在应用较为广泛的一个,而MD5和SHA-1存在安全隐患,不推荐使用。
虽然如果输入的数据相同,那么输出的哈希值也必定相同,但这是在使用同一个算法的前提下得出的结论。若使用的算法不同,那么就算输入的数据相同,得到的哈希值也是不同的。
应用示例
将用户输入的密码保存到服务器时也需要用到哈希函数。
如果把密码直接保存到服务器,可能会被第三者窃听,因此需要算出密码的哈希值,并只存储哈希值。当用户输入密码时,先算出该输入密码的哈希值,再把它和服务器中的哈希值进行比对。这样一来,就算保存的哈希值暴露了,鉴于上文中提到的哈希函数的第五个特征(输入输出不可逆),第三者也无法得知原本的密码。
就像这样,使用哈希函数可以更安全地实现基于密码的用户认证。
参考: 我的第一本算法书 5-3 哈希函数