数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

2021年1月28日,阿里云正式发布数据安全中心,在整合敏感数据保护(SDDP)等产品能力基础上,为客户提供全域一体标准化的云上数据安全防护服务。

数据安全中心防护能力涵盖非结构化、半结构化及结构化等不同类型数据,尤其在数据加密和脱敏领域,面向全体云上开发者,提供了便捷,灵活,标准化的能力支持。

数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

数据安全中心能力概述

2020年中发布的《个人信息保护法》草案中,对数据匿名化和去标识化提出了明确要求,但在落地过程中,由于应用开发与数据使用场景的复杂多样,通常很难形成标准化的脱敏防护体系。

阿里云数据安全中心通过多年的内部沉淀,为广大云上开发者提供了丰富的数据匿名化和去标识化算法,可以根据实际业务场景灵活选择,自定义参数,做到个性化数据脱敏。

数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

数据脱敏效果示例

小知识

· 动态脱敏
典型场景:主要用于直接访问生产数据的数据脱敏使用场景,例如前端页面展示或应用使用数据的过程中进行脱敏。
适合人员:应用与数据开发人员,通过开发和应用接口实现数据防护。
关于数据安全中心提供的动态脱敏能力,可以参考以下文档:
https://help.aliyun.com/document_detail/173158.html

· 静态脱敏
典型场景:主要用于将数据抽离生产环境并进行分发和共享的场景,例如生产环境向开发测试环境的数据脱敏导出。
适合人员:数据库与数据安全管理者,定期实现数据防护。
关于数据安全中心提供的静态脱敏能力,可以参考以下文档:
https://help.aliyun.com/document_detail/124295.html

数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

数据脱敏方式比较示例

数据安全中心提供了自定义脱敏模板:
企业应用开发人员可以通过自定义算法模板,以API形式调用云端脱敏接口,在应用层面实现敏感数据的自动化敏感度降级处理,大大提升应用可扩展性和算法的可维护性。
有关自适应脱敏模板的介绍,可以参考以下文档:
https://help.aliyun.com/document_detail/155870.html

企业开发人员可以通过自适应的脱敏模板,完成各类不同场景的数据脱敏分发,例如定期从生产环境向开发测试环境脱敏,不同数据类型(如OSS中的csv向RDS的数据表)之间的异构脱敏,数据库层面的原库/原表脱敏等等。

脱敏场景举例:在页面展示时进行个人身份证号和手机号的脱敏
描述:通过数据安全中心提供的SDK与API实现敏感数据的动态脱敏。

步骤1:明确需要脱敏的数据。

对于常规的页面展示服务,一般会通过【Web页面-应用-数据库】的访问形式进行数据流的传输,动态脱敏无需更改数据库底层数据,而是在应用中内嵌SDK,调用云端API,实现敏感数据的脱敏。
本例中需要脱敏的字段为身份证号码和手机号码,存放数据的数据表列名分别为:
【身份证号码】 - 列名【person id】
【手机号码】 - 列名【phone number】

步骤2:确定需要的脱敏算法。

一般对于敏感数据,都有相对比较通用的脱敏算法可供使用,本例中主要使用遮盖算法进行脱敏处理:
【身份证号码】:一般为18位数据,展示时一般仅展示最后6位,其余通过*进行遮盖。
例如:123456
算法选择:【遮盖脱敏】-【保留自x至y】-【x=13,y=18】

【手机号码】:国内一般为11位数字,通常会保留前三位和后四位,其余通过*进行遮盖。
例如:138**1234
算法选择:【遮盖脱敏】-【遮盖自x至y】-【x=4,y=7】

使用哪种脱敏算法,一般需要根据实际业务场景进行选择:
对于无需还原和二次处理的数据,一般使用匿名化方式,如遮盖、哈希、取整等;
对于需要二次处理的数据,一般使用混淆,随机替换,加密等方式进行处理。
阿里云数据安全中心目前提供了多达30种脱敏算法,供开发者在各种场合根据业务需要进行选择和使用。相关算法可以参考:
https://help.aliyun.com/document_detail/125498.html

步骤3:配置脱敏模板。

(前提:需要通过阿里云账号开通阿里云数据安全中心服务)
记录下应用连接数据库过程中数据表中存放敏感数据的表字段名称。
例如:身份证列名:【person id】;手机号:【phone number】

在数据安全中心控制台选择新建一个脱敏模板,匹配方式选择字段名称(敏感类型目前仅支持静态脱敏),在界面上分别填入列名和在步骤二中确定的脱敏算法,如下图:

数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

确认后记录下模板ID,在SDK中引用时能够使用。

数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

步骤4:在应用程序中引用SDK和脱敏函数,编写代码。

在应用中构造API Request,通过API请求的方式,获得脱敏结果。以Python代码举例:

数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

API调用示例,目前支持公共云的API请求,如果需要云内部请求,可以联系数据安全产品团队:

数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

关于数据安全中心提供的ExecDatamask脱敏接口,可以参考以下文档:
https://help.aliyun.com/document_detail/157173.html

注意:在client连接中使用的accessKeyId和accessSecret能够通过使用RAM Role进行更安全的授权,避免在应用中直接写入AK/SK,降低泄漏风险。

【输入参数】:

数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

TemplateId选择模板ID,上例中为步骤三中记录的303;
Data部分目前支持json的格式的输入,能够根据数据库结构构造:

数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

【输出结果】
json格式的脱敏结果:

数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

截止目前,阿里云数据安全中心已经累计为云上客户运行了数以万计的脱敏任务,实现了几百亿字段的脱敏。同时,数据安全中心累计帮助云上客户防范了上百起潜在的数据泄漏事件。

除了脱敏能力的升级,阿里云数据安全中心还在下列能力上进行了扩充,为企业安全管理员提供如下能力:

· 元数据视角更加精准的自动识别与分类分级

阿里云数据安全中心通过提供接口的方式,从元数据视角打通各类数据,赋能客户以更全局、更精准的视角,审视自身业务数据中存在的安全隐患,并针对性的落地防泄漏措施。

· 从静态检测到动态感知进化的全域数据审计

数据安全中心可以实现对云上各类数据源的安全审计,并在此基础上深耕防泄漏场景,帮助客户实现全域数据的风险感知。

通过上述三大核心能力,数据安全中心能够满足企业在数据安全防护的核心诉求:

1. 提升治理能力
2. 降低泄露风险
3. 保障安全合规

还在等待什么?快来免费试用阿里云数据安全中心吧!
https://www.aliyun.com/product/security/sddp

附上阿里云SDK下载链接:
https://next.api.aliyun.com/api-tools/sdk/Sddp?version=2019-01-03&language=python

上一篇:带你读懂2020阿里云上云采购季活动规则及主要云服务器配置、价格整理分享


下一篇:数据安全事件频发,数据脱敏技术发展趋势如何?