文献:
Towards Balanced Defect Prediction with Better Information Propagation - AAAI 2021
1 背景
为发现的漏洞对软件安全和质量造成巨大影响,所以漏洞预测模型对软件生态具有重要意义。
2 动机
目前使用DL模型进行漏洞预测存在以下3个缺点:
- 标记数据少:已知漏洞代码数量较少,缺乏大量标记的代码样本;
- 数据不平衡:当前代码数据中漏洞样本占比较少;
-
消息传递机制不完善:各代码工件的标签对消息传递的影响未加入研究;
- 节点特征通过连接矩阵在节点之间进行信息传递,但是节点本身的标签信息在消息传递阶段却未被考虑;
本文的主要目标就是为解决上述3个缺点。
3 方法
step1:Graph construction & embedding
-
- Graph construction:利用CodeOntology
- Graph embedding:图表示学习
step2:消息传递矩阵优化
传统的消息传递矩阵仅仅考虑了图结构,而未考虑节点标签和节点属性,例如最常用的邻接矩阵和拉普拉斯矩阵都只代表了图的结构信息。
为了保证在消息传递时:
4 实验
5 讨论
Towards Balanced Defect Prediction with Better Information Propagation