文章目录
1. 需求描述
ICP备案是指网站在信息产业部提交网站信息进行官方认可。对国内各大小网站(包括企业及个人站点)的严格审查工作,对于没有合法备案的非经营性网站或没有取得ICP许可证的经营性网站, 根据网站性质,将予以罚款,严重的关闭网站,以此规范网络安全,打击一切利用网络资源进行不法活动的犯罪行为。
可以通过工信部政务服务平台-ICP/IP地址/域名信息备案管理系统查询ICP备案信息, 如下图
页面展示了ICP备案主体信息和ICP备案网站信息, 我们尝试采集该页面数据。
-
目标网站
https://beian.miit.gov.cn/#/Integrated/recordQuery
-
调研日期
2020-11-30 -
难点分析
该网站需要经过滑块验证才能查询,需要尝试破解该滑块
2. 抓包分析
-
获取滑块配置信息
链接:https://hlwicpfwc.miit.gov.cn/icpproject_query/api/image/getCheckImage
请求信息:
返回信息(由于返回的内容过长,这里提供截图):- 该链接请求头有个token参数,看着像一个加密的字符串,先记录下。
-
验证滑块结果
链接:https://hlwicpfwc.miit.gov.cn/icpproject_query/api/image/checkImage
请求信息:
返回内容:
{"code":200,"msg":"操作成功","params":"eyJ0eXBlIjozLCJleHREYXRhIjp7InZhZnljb2RlX2ltYWdlX2tleSI6ImJjNjUxNWU0LTNlZDUtNGMxMy05MDU4LTkzNDlmMjg3NTFiNyJ9LCJlIjoxNjA2ODA5MTk2NjI0fQ.gcJqYl2S9e995dStmYsKhh5dBcyWFIsZ0X-Y6t3Oo4o","success":true}```
- 该请求的请求头依然有token参数,且和链接1的请求头中的值保持一致
- 该请求的参数中,key的值,跟链接1返回结果的uuid一致,value值未知。
- 这一步是用来验证滑块的滑动结果,按以往研究极验滑块的经验来看,这里应该写入的有滑动路径参数,但是很明显value不是路径参数,跟路径相关的,除了滑动路径外,很容易想到的是滑动的长度,猜测value的值为滑动的距离,单位是’px’,当然这个猜想稍后会进行验证。
- 正由于没有像极验滑块那种加入路径参数,才让这个破解难度大大的降低,也为后续继续研究提供了动力
-
滑块验证通过,获取ICP信息
链接:https://hlwicpfwc.miit.gov.cn/icpproject_query/api/icpAbbreviateInfo/queryByCondition
请求信息:
返回结果:
{"code":200,"msg":"操作成功","params":{"endRow":0,"firstPage":1,"hasNextPage":false,"hasPreviousPage":false,"isFirstPage":true,"isLastPage":true,"lastPage":1,"list":[{"contentTypeName":"","domain":"baidu.com","domainId":10000245113,"homeUrl":"www.baidu.com","leaderName":"","limitAccess":"否","mainId":282751,"mainLicence":"京ICP证030173号","natureName":"企业","serviceId":282911,"serviceLicence":"京ICP证030173号-1","serviceName":"百度","unitName":"北京百度网讯科技有限公司","updateRecordTime":"2020-11-13 09:30:49"}],"navigatePages":8,"navigatepageNums":[1],"nextPage":1,"pageNum":1,"pageSize":10,"pages":1,"prePage":1,"size":1,"startRow":0,"total":1},"success":true}
- 该请求的请求头依然有token参数,且和前两个链接请求头的token值一致
- 请求头多了sign参数,不难发现,该sign的值,正是第二步返回结果json中键params的值
- 请求头中还多一个uuid参数,对比发现,正式链接1返回结果的uuid值
- 通过抓包分析,我们发现,整个过程就只有链接1请求头中的参数token和链接2的请求参数value的值是未知的,其他的值均可以通过请求链接获取,因此只需要研究token和value的生成,即可完成破解
3. token参数破解
-
尝试全局搜索token关键字,看能否找到关键信息,搜索之后发现很多文件都有token关键字,经过筛选,发现index.js中的代码片段,太有价值了,结合注释,简直就是量身定做,哈哈
-
在index.js代码的第66行出打上断点
-
断点打好之后,开始逐步跟踪调试即可,调试过程不再演示,我给出生成token的关键点,authapi.js 第22行
-
逐步调试发现,authKey的生成,采用md5加密,对应utils.js的第33行
加密的字符串为 authAccount + authSecret + timeStamp = “testtest1606813754781”
加密后的结果为 “32a38d257a706642a79270011677a139”
我在调试的时候,跳过了加密过程的执行,由于是md5加密,我考虑使用python的hashlib模块对字串"testtest1606813754781"进行md5加密,观察其结果是否与js调试的结果一致
发现python结果和js调试的结果是一致的,后续我们在生成这个参数的时候,可以直接使用python脚本进行执行 -
继续调试,是发送一个post请求,目标链接为“https://hlwicpfwc.miit.gov.cn/icpproject_query/api/auth” ,传入的参数为上面获取到的authKey和时间戳参数timeStamp,获取到的tokenData是一个json,tokenData.bussiness值即为我们要获取的token值
该步调试的时候,会发现,token应该有一个三分钟的有效时间,每次请求的时候,js会先检测当前的token值是否已经过期,如果过期则重新生成token
-
至此,我们通过js调试了解到了token的生成,费那么大力气,总结下来其实就两步
-
使用md5加密字符串 “testtest”+timeStamp(当前时间戳),获取authKey
-
post方式请求链接https://hlwicpfwc.miit.gov.cn/icpproject_query/api/auth,参数为 authKey = authKey,timeStamp = timeStamp, 从结果中提取键 bussiness 的值即可
-
4. value分析
value参数,是在抓包分析第二步的时候需要写入的参数,开始想通过全局搜索的方式搜索value来找到有价值的代码段,但是搜索发现太多文件和代码片段包含value关键字,此时换个思路,请求的链接为https://hlwicpfwc.miit.gov.cn/icpproject_query/api/image/checkImage,尝试搜索checkImage关键字,看看会不会有什么发现
-
全局搜索checkImage关键字,只有两个文件含有该关键字,分析发现,我们要研究的文件是 index.vue
-
点进来,发现这段代码刚好是我们研究的,post参数为 key: that.uuid和value: Math.round(that.puzzle * 1) + ""要知道value的值,我们需要知道that.puzzle的值,在该文件中搜索puzzle关键字,看能否找到puzzle的声明和赋值的地方
-
puzzle声明在index.vue的第247行,其实从注释,我们几乎已经能确定puzzle鼠标滑动滑块的距离了,为了更好地说明,我们继续搜索puzzle,找到其赋值的地方
-
puzzle赋值,在index.vue的第669行,这段代码无疑是证明了开始的猜想,value的值为滑动滑块的长度
-
分析发现,value为鼠标滑动滑块的距离,为了能正确解锁滑块,很明显,这个value的值,应为滑动验证码的图片缺口位置,为此,我们只需要获取带缺口的滑动验证码图片,计算其缺口位置,就能对value进行赋值了
5. 带缺口的滑动验证码图片获取
抓包分析的第一步是获取滑块验证码的配置信息,其返回值是一个json,记做res, 我们发现res.params 有键 “bigImage”,这很容联想到,这个键对应的值应该为带缺口的图片地址,分析网络请求也能发现,有个请求的缩略图,很像是滑块的大图,对比其链接和 "bigImage"的值发现,请求的链接为“data:text/javascript;base64,”+res.params.bigImage
观察其返回内容,却是一堆乱码
明明该请求的缩略图就是一个图像啊,为啥这里却反回一堆乱码,很苦恼,没有拿到预想的结果,此时,注意观察,该请求下面的连续两个请求,其缩略图也是图像,但是开头是以"data:Image/png;base64,“开头的,我尝试点进去一个链接,发现其返回的是一张图片
那我想着是不是请求的链接由“data:text/javascript;base64,”+res.params.bigImage换成“data:Image/png;base64,”+res.params.bigImage就能获取到图片了? 抱着试一试的态度,发现真的返回了图片
我们还能通过同样的方式获取缺口图片,对应的链接为“data:Image/png;base64,”+res.params.smallImage
当然,如果你知识和经验足够丰富的话,res.params.bigImage其实是对应图片的base64编码,要将base64编码转回图片,大概有两种方式,一种就是前面提到的, 使用浏览器请求页面“data:Image/png;base64,”+图片base64编码可获取图片,另外一种相对更简单些,直接对编码进行解码,就能获取图片,对应的python代码为
def base642pic():
base64str = ""
with open('bigImage.jpg','wb') as f:
f.write(base64.b64decode(base64str))
代码将解码后的文本写入’bigImage.jpg’,执行成功会生成该文件,打开即为滑块的背景图
图片获取之后,只需要计算下缺口的位置就可以了,将计算出来的位置值赋值给value进行请求即可。这里并不打算讲图片缺口位置的计算,网上有很多方法,可以参考下,我们的重点是调试和分析该滑块验证码的破解。
6. 总结
通过上述分析,该网站验证码的破解过程大致为:
- 使用md5加密字符串 “testtest”+timeStamp(当前时间戳),获取authKey
- post方式请求链接https://hlwicpfwc.miit.gov.cn/icpproject_query/api/auth,参数为 {“authKey” : authKey,“timeStamp”: timeStamp}, 从结果中提取键 bussiness 的值,作为token,该token用以后续请求的请求头中
- post请求https://hlwicpfwc.miit.gov.cn/icpproject_query/api/image/getCheckImage ,获取验证码配置信息,请求头中需添加token
- 从第3步的配置信息中,拿到验证码的uuid,以及对应的验证码图片并计算缺口位置,作为value的值
- post请求https://hlwicpfwc.miit.gov.cn/icpproject_query/api/image/checkImage,用以验证滑动结果,参数{“key”: uuid,“value”: 缺口位置},这两个参数值在第4步已获取。验证成功后,返回结果的取出键”params“的值,作为第6步请求头中的sign值,请求头中需添加token
- post请求https://hlwicpfwc.miit.gov.cn/icpproject_query/api/icpAbbreviateInfo/queryByCondition ,用于获取域名的icp备案信息,参数 {“pageNum”:"",“pageSize”:"",“unitName”:“baidu.com”},该请求头中除了token之外,还需要添加第5步拿到的sign值,以及第3步拿到的uuid
至此,完成了数据的获取,根据自己的需求,解析并保存即可。