API接口访问频次限制 / 网站恶意爬虫限制 / 网站恶意访问限制方案

2022-08-10 13:55:27

采用多级拦截,后置拦截的方式体系化解决

1 分层拦截

直接用商业服务

传统的F5硬件,不过现在用的很少了云时代就用云时代的产品,典型代表阿里云 web应用防火墙

API 网关(API Gateway)

kong为代表的开源 API 网关实现 openresty + lua 自实现 windows平台安全狗、云锁实现

用Redis内置lua脚本

redis是块砖,哪里需要哪里搬 redis内置了lua引擎,2.6版本后你可以编写一段lua脚本,完成逻辑判断流程

常见的有对某维度计数器法对某维度令牌桶法维度的概念比如就是IP或者IP+模块等, 多个字段合并成一个维度

本方案满足绝大多数应用层的限流需求当然也可以自己用应用层程序实现,前提是redis+lua满足不了你的需求

基本的套路其实很简单,从日志这里计算出恶意IP,恶意用户,再给其他系统用分控的基本思想也是这样的

已经在用ELK日志系统:可以用ES中定时查询高频IP,送入WAF做拦截已经在用流计算系统:flink和spark等流计算系统计算出高频恶意IP,用户等

然后就可以应用这些计算出的结果数据做限制,封禁等

第一层Waf当然有拦截,但是对于新IP他不会马上生效, 会有几分钟的时间才会拦截特别是恶意爬虫IP池一上,大量新IP就来了,第一层会放过来,如果只是一层,结果就是数据库慢查询告警叮叮叮

配合上二层三层一层一层拦截如果没有精力搞二层,那么第一层用买的,第二层不做,搞第三层

后置拦截的结果可以作为长期封禁使用这种多次拦截的策略和多级缓存的概念是不是很像多层次的拦截保障源站监控告警静悄悄

面向C端的产品被爬虫,被恶意访问的概率会大很多面向B端的网页也不是没有风险面向B端的API也有限流的需求