阿里云图数据库GDB助力钉钉构建百亿量级知识图谱

合作概述
钉钉用户数目前已突破3亿,成长为中国领先的智能移动办公平台。借助阿里云图数据库GDB,钉钉可高效处理百亿量级人与人、人与企业、企业与企业间的复杂关联关系数据,并构建了工作场景下的知识图谱,具备深度关联关系的挖掘能力。在推荐加人,拉新促活等场景取得了良好效果。

客户简介
钉钉(DingTalk)是阿里巴巴集团专为中国企业打造的免费沟通和协同的多端平台,提供PC版,Web版和手机版,有考勤打卡、签到、审批、日志、公告、钉盘、钉邮等强大功能。钉钉因中国企业而生,帮助中国企业通过系统化的解决方案,全方位提升中国企业沟通和协同效率。

业务痛点
钉钉天然存在有人人、人企、企企间的复杂关系,形成庞大的用户、组织网络,使得基于网络的社区聚类、关系裂变传播等成为可能,进而用于大规模的拉新、用户促活、工作人脉沉淀等等。经过多年的建设,钉钉已经沉淀了各个数据域的数据资产,但仍存在如下问题:
 缺少统一的关系数据沉淀
例如我们需要查询一个人在多个组织下有多少个同事时,需要多次关联用户组织关系表才能获得。特别是在在线推荐服务场景,需要做大量的关系扩散计算,分散的关系数据已经很难支撑起算法的进一步发展。因此我们需要构建一个统一的关系数据服务,提供离线和在线的数据查询及多度图扩散。
 缺乏关系的深度认知和推断
目前钉钉的数仓建设主要围绕着客观数据,而在具体的业务场景中,往往需要对数据更深入地认知和推断。例如在推荐加人场景中,我们需要进行同企识别,推荐用户的潜在同事。

解决方案
钉钉团队经过多方调研论证,发现图数据库在处理海量关联关系数据方面具有查询效率高,模型直观,编程简便的独有优势,在知识图谱、社交推荐等领域有广泛应用,非常契合钉钉知识图谱应用场景。
而阿里云GDB是一款支持ACID事务,兼容Gremlin和Cyper两大主流查询语言,提供99.95%企业级高可用保障的全托管在线图数据库。并提供免费的专家服务,给客户提供建模指导和一对一的解决方案。
阿里云图数据库GDB助力钉钉构建百亿量级知识图谱
图数据库GDB支撑了钉钉百亿量级用户关系的存储和高效查询,为钉钉构建知识图谱,提供了深度关联关系的挖掘能力。在以下场景取得了良好效果:
 推荐加人
在钉钉上创建团队后,管理员需要从通讯录一个个选择,或者手动输入手机号码进行加入, 加人效率低。如果能为用户推荐一些潜在同事,帮助其实现一键添加,那么用户组建团队就会更加方便。推荐加人实际上属于职场社交推荐,我们基于DingTalk Graph实现了整个召回、排序链路。
阿里云图数据库GDB助力钉钉构建百亿量级知识图谱

 拉新促活
邀请好友是App产品常用的一种拉新、促活方式。通过激励用户邀请好友、创建组织,可以为钉钉带来新用户、曝光度、留存率、活跃度,甚至形成裂变。我们基于DingTalk Graph构建了一个邀请能力模型(Invitation ability Model)来建模一个人在其工作社交网络中的邀请能力。
阿里云图数据库GDB助力钉钉构建百亿量级知识图谱

客户价值
图数据库GDB支撑了钉钉百亿量级用户关系的存储和高效查询,为钉钉构建知识图谱,提供了深度关联关系的挖掘能力。在推荐加人、拉新促活等应用场景得到广泛应用。
•百亿点边存储和ms级查询能力:针对图结构数据的存取特点,在图计算层和图存储层均进行了高度优化,满足钉钉百亿量级点边海量数据的多度关系毫秒级查询需求。
•服务高可用:GDB采用主备高可用架构,提供99.95%企业级SLA保障。当主节点故障时,系统自动切换,保障钉钉的业务连续性。
•易用、易运维:云服务全托管,提供备份恢复、自动升级、监控告警、实例升降配等丰富功能,大幅降低钉钉使用和维护图数据库的难度,使钉钉可以专注于应用本身的开发。

上一篇:回到过去,找回遗失的珍宝 - TiDB 的历史读功能


下一篇:功能强大的图片截取修剪神器:Android SimpleCropView及其实例代码重用简析