Nodejs进阶：MD5入门介绍及crypto模块的应用

2022-08-24 18:41:51

本文摘录自《Nodejs学习笔记》，更多章节及更新，请访问 github主页地址。欢迎加群交流，群号 197339705。

简介

MD5（Message-Digest Algorithm）是计算机安全领域广泛使用的散列函数（又称哈希算法、摘要算法），主要用来确保消息的完整和一致性。常见的应用场景有密码保护、下载文件校验等。

本文先对MD5的特点与应用进行简要概述，接着重点介绍MD5在密码保护场景下的应用，最后通过例子对MD5碰撞进行简单介绍。

特点

运算速度快：对jquery.js求md5值，57254个字符，耗时1.907ms
输出长度固定：输入长度不固定，输出长度固定（128位）。
运算不可逆：已知运算结果的情况下，无法通过通过逆运算得到原始字符串。
高度离散：输入的微小变化，可导致运算结果差异巨大。
弱碰撞性：不同输入的散列值可能相同。

应用场景

文件完整性校验：比如从网上下载一个软件，一般网站都会将软件的md5值附在网页上，用户下载完软件后，可对下载到本地的软件进行md5运算，然后跟网站上的md5值进行对比，确保下载的软件是完整的（或正确的）
密码保护：将md5后的密码保存到数据库，而不是保存明文密码，避免拖库等事件发生后，明文密码外泄。
防篡改：比如数字证书的防篡改，就用到了摘要算法。（当然还要结合数字签名等手段）

nodejs中md5运算的例子

在nodejs中，crypto模块封装了一系列密码学相关的功能，包括摘要运算。基础例子如下，非常简单：

var crypto = require('crypto');

var md5 = crypto.createHash('md5');

var result = md5.update('a').digest('hex');

// 输出：0cc175b9c0f1b6a831c399e269772661

console.log(result);

例子：密码保护

前面提到，将明文密码保存到数据库是很不安全的，最不济也要进行md5后进行保存。比如用户密码是123456，md5运行后，得到输出：e10adc3949ba59abbe56e057f20f883e。

这样至少有两个好处：

防内部攻击：网站主人也不知道用户的明文密码，避免网站主人拿着用户明文密码干坏事。
防外部攻击：如网站被黑客入侵，黑客也只能拿到md5后的密码，而不是用户的明文密码。

示例代码如下：

var crypto = require('crypto');

function cryptPwd(password) {

    var md5 = crypto.createHash('md5');

    return md5.update(password).digest('hex');

}

var password = '123456';

var cryptedPassword = cryptPwd(password);

console.log(cryptedPassword);

// 输出：e10adc3949ba59abbe56e057f20f883e

单纯对密码进行md5不安全

前面提到，通过对用户密码进行md5运算来提高安全性。但实际上，这样的安全性是很差的，为什么呢？

稍微修改下上面的例子，可能你就明白了。相同的明文密码，md5值也是相同的。

var crypto = require('crypto');

function cryptPwd(password) {

    var md5 = crypto.createHash('md5');

    return md5.update(password).digest('hex');

}

var password = '123456';

console.log( cryptPwd(password) );

// 输出：e10adc3949ba59abbe56e057f20f883e

console.log( cryptPwd(password) );

// 输出：e10adc3949ba59abbe56e057f20f883e

也就是说，当攻击者知道算法是md5，且数据库里存储的密码值为e10adc3949ba59abbe56e057f20f883e时，理论上可以可以猜到，用户的明文密码就是123456。

事实上，彩虹表就是这么进行暴力破解的：事先将常见明文密码的md5值运算好存起来，然后跟网站数据库里存储的密码进行匹配，就能够快速找到用户的明文密码。（这里不探究具体细节）

那么，有什么办法可以进一步提升安全性呢？答案是：密码加盐。

密码加盐

“加盐”这个词看上去很玄乎，其实原理很简单，就是在密码特定位置插入特定字符串后，再对修改后的字符串进行md5运算。

例子如下。同样的密码，当“盐”值不一样时，md5值的差异非常大。通过密码加盐，可以防止最初级的暴力破解，如果攻击者事先不知道”盐“值，破解的难度就会非常大。

var crypto = require('crypto');

function cryptPwd(password, salt) {

    // 密码“加盐”

    var saltPassword = password + ':' + salt;

    console.log('原始密码：%s', password);

    console.log('加盐后的密码：%s', saltPassword);

    // 加盐密码的md5值

    var md5 = crypto.createHash('md5');

    var result = md5.update(saltPassword).digest('hex');

    console.log('加盐密码的md5值：%s', result);

}

cryptPwd('123456', 'abc');

// 输出：

// 原始密码：123456

// 加盐后的密码：123456:abc

// 加盐密码的md5值：51011af1892f59e74baf61f3d4389092

cryptPwd('123456', 'bcd');

// 输出：

// 原始密码：123456

// 加盐后的密码：123456:bcd

// 加盐密码的md5值：55a95bcb6bfbaef6906dbbd264ab4531

密码加盐：随机盐值

通过密码加盐，密码的安全性已经提高了不少。但其实上面的例子存在不少问题。

假设字符串拼接算法、盐值已外泄，上面的代码至少存在下面问题：

短盐值：需要穷举的可能性较少，容易暴力破解，一般采用长盐值来解决。
盐值固定：类似的，攻击者只需要把常用密码+盐值的hash值表算出来，就完事大吉了。

短盐值自不必说，应该避免。对于为什么不应该使用固定盐值，这里需要多解释一下。很多时候，我们的盐值是硬编码到我们的代码里的（比如配置文件），一旦坏人通过某种手段获知了盐值，那么，只需要针对这串固定的盐值进行暴力穷举就行了。

比如上面的代码，当你知道盐值是abc时，立刻就能猜到51011af1892f59e74baf61f3d4389092对应的明文密码是123456。

那么，该怎么优化呢？答案是：随机盐值。

示例代码如下。可以看到，密码同样是123456，由于采用了随机盐值，前后运算得出的结果是不同的。这样带来的好处是，多个用户，同样的密码，攻击者需要进行多次运算才能够完全破解。同样是纯数字3位短盐值，随机盐值破解所需的运算量，是固定盐值的1000倍。

var crypto = require('crypto');

function getRandomSalt(){

    return Math.random().toString().slice(2, 5);

}

function cryptPwd(password, salt) {

    // 密码“加盐”

    var saltPassword = password + ':' + salt;

    console.log('原始密码：%s', password);

    console.log('加盐后的密码：%s', saltPassword);

    // 加盐密码的md5值

    var md5 = crypto.createHash('md5');

    var result = md5.update(saltPassword).digest('hex');

    console.log('加盐密码的md5值：%s', result);

}

var password = '123456';

cryptPwd('123456', getRandomSalt());

// 输出：

// 原始密码：123456

// 加盐后的密码：123456:498

// 加盐密码的md5值：af3b7d32cc2a254a6bf1ebdcfd700115

cryptPwd('123456', getRandomSalt());

// 输出：

// 原始密码：123456

// 加盐后的密码：123456:287

// 加盐密码的md5值：65d7dd044c2db64c5e658d947578d759

MD5碰撞

简单的说，就是两段不同的字符串，经过MD5运算后，得出相同的结果。

网上有不少例子，这里就不赘述，直接上例子，参考(这里)[http://www.mscs.dal.ca/~selinger/md5collision/]

function getHashResult(hexString){

    // 转成16进制，比如 0x4d 0xc9 ...

    hexString = hexString.replace(/(\w{2,2})/g, '0x$1 ').trim();

    // 转成16进制数组，如 [0x4d, 0xc9, ...]

    var arr = hexString.split(' ');

    // 转成对应的buffer，如：<Buffer 4d c9 ...>

    var buff = Buffer.from(arr);

    var crypto = require('crypto');

    var hash = crypto.createHash('md5');

    // 计算md5值

    var result = hash.update(buff).digest('hex');

    return result;

}

var str1 = 'd131dd02c5e6eec4693d9a0698aff95c2fcab58712467eab4004583eb8fb7f8955ad340609f4b30283e488832571415a085125e8f7cdc99fd91dbdf280373c5bd8823e3156348f5bae6dacd436c919c6dd53e2b487da03fd02396306d248cda0e99f33420f577ee8ce54b67080a80d1ec69821bcb6a8839396f9652b6ff72a70';

var str2 = 'd131dd02c5e6eec4693d9a0698aff95c2fcab50712467eab4004583eb8fb7f8955ad340609f4b30283e4888325f1415a085125e8f7cdc99fd91dbd7280373c5bd8823e3156348f5bae6dacd436c919c6dd53e23487da03fd02396306d248cda0e99f33420f577ee8ce54b67080280d1ec69821bcb6a8839396f965ab6ff72a70';

var result1 = getHashResult(str1);

var result2 = getHashResult(str2);

if(result1 === result2) {

    console.log(`Got the same md5 result: ${result1}`);

}else{

    console.log(`Not the same md5 result`);

}

写在后面

如有错漏，敬请指出，欢迎多交流

码农公寓

简介

特点