https://mp.weixin.qq.com/s/2XRgJr-ydxHA3JxAZ_5HeA
图算法在风控业务的实践
直播行业中有很多业务风控问题,比如说批量注册、刷热度、垃圾信息以及薅羊毛等。图兴起以来,目前用得很广泛的一个场景便是业务风控。
图视角进行业务风控的优势是:
-
图可以描述黑产团伙作案的聚集性和关联性。
-
图特征对新的攻击方式抗性较高,具有很强的鲁棒性。
-
图算法对数据的要求比较灵活,可以进行各种 机器学习任务。
-
使用图容易对大规模数据做并行化处理,计算效率高 。
图算法整体框架
在业务风控中,图算法的整体框架包括三个部分,首先是数据层,包括实体关系和属性(比如账户、设备、IP等等信息),还有行为数据(比如注册、登录、抽奖等信息)这些都是风控中非常有价值的数据。其次是算法层,算法有很多,包括像图嵌入的,高密子图挖掘等。最后就是将这些算法模型应用到实际的业务中去。
图的设计
异构图
同构图的特点:由异构关系转化得到,行为具有同步性,Embedding 向量的相似度,多个弱信息拼接。
图算法应用流程
主要分为四个流程:首先是图构建与分析,其过程包括节点和边的定义,Hubs的处理,基于标签的分析以及基于特征的分析。然后就是构建图算法,并基于业务规则进行相应的调整。训练模型之后要进行结果的评估和监控,包括效果指标监控,算法结果的优化以及可解释性。最后就是应用到业务中去。