
神州数码TDMP数据脱敏解决方案
企业敏感数据的“易容大师”!!!!
神州数码集团
冷秋华

Part 1
背景引言
在大数据时代的“江湖”中,,,数据作为信息的重要载体,,,,潜藏着不可限量的商业价值,,,与此同时,,,数据在流动的过程中也面临着敏感信息一不小心就会被泄露的危险。。
在企业数字化转型的过程中,,,,公司的新业务系统正在研发,,,,系统要完成上线,,,必须提供如商业数据、、、、财务数据、、、、人力资源数据等一些包含敏感隐私数据给研发用于开发环境/测试环境的使用。。此时,,,,在企业战略升级必须提供数据却又不能展示敏感信息的矛盾中,,作为公司数据资产负责人的您,,,,会作何抉择??
在武侠的江湖里,,,,“大侠”为了在行走江湖行侠仗义的时不被认出来,,,,一般通过易容将自己的“敏感”信息——真实的面容隐藏起来。。。。在当今时代,,数据想要在流动的过程中发挥价值,,,,又必须隐藏自己不便为众人所知的“真实样子”又该如何做到呢????
数据脱敏技术应运而生。。。
Part 2
什么是数据脱敏????
数据脱敏(Data Masking),,,即屏蔽敏感数据。。在数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,,,,实现敏感隐私数据的可靠保护,,,,防止敏感数据直接在不可靠的环境下使用。。。。
通俗来说:就是通过技术手段给企业敏感数据进行“易容”,,,,“易容”后的敏感数据就够在各种“危险”环境中“来去自由”,,,实现他自身的“行侠仗义拯救江湖”的高阶价值。。。
数据脱敏一般分为静态数据脱敏和动态数据脱敏。。。静态数据脱敏,,是数据的“搬移并仿真替换”,,是将数据抽取进行脱敏处理后,,,,下发给下游环节,,随意取用和读写的,,脱敏后数据与生产环境相隔离,,,,满足业务需求的同时保障生产数据库的安全。。。。适用于将数据抽取出生产环境脱敏后分发至测试、、开发、、、培训、、数据分析等场景。。。。
动态数据脱敏,,,在访问敏感数据的同时实时进行脱敏处理,,,,可以为不同角色、、不同权限、、不同数据类型执行不同的脱敏方案,,,,从而确保返回的数据可用而安全。。。。动态数据脱敏一般用在生产环境,,,将敏感数据实时进行脱敏后用于应用访问等生产环境。。。
Part 3
数据“易容”的过程是怎么样的呢????
数据脱敏的业务流程包括:数据源管理、、敏感数据发现、、脱敏方案制定、、、脱敏任务定制与调度。。其中核心的2步是敏感数据发现和脱敏方案制定。。。。
1.数据“易容”之敏感数据发现
在进行数据脱敏之前,,我们首先要确认哪些数据作为脱敏的目标。。一般的敏感信息包括:身份标识、、、、生物识别信息、、、虚拟身份信息、、、个人隐私信息、、财产信息等。。。在更复杂的业务场景中,,,,还需要按照比如安全等级、、业务维度梳理敏感信息。。。。

2.数据“易容”之脱敏方案制定
确认了敏感数据字段后,,,,就是根据特定的场景对敏感数据制定脱敏方案。。。。常见的数据脱敏方式包括:替换、、、重排、、、、加密、、、截断、、、掩码、、、、日期偏移取整。。

在选择通过什么样的方式给敏感数据“易容”,,,需要基于不同的应用场景,,但都要遵循两个原则:
1)尽可能地为脱敏后的应用,,,保留脱敏前的有意义信息
2)最大程度上防止黑客进行破解
通俗来说,,在抹去数据中的敏感内容同时,,,,也需要保持原有的数据特征、、、、业务规则和数据关联性,,,保证我们在开发、、、、测试以及数据分析类业务不会受到脱敏的影响,,使脱敏前后的数据一致性和有效性。。。
Part 4
神州数码TDMP有哪些“易容”绝技??
脱敏的概念并不算标新立异,,,近年来,,,随着国家法律法规及行业信息化管理制度的完善、、数据使用场景愈加复杂、、、脱敏后数据仿真度要求提高,,专业的数据脱敏产品成为了大众普遍的选择。。。
神州数码TDMP数据脱敏平台是神州数码独立设计、、研发的一款开箱即用的敏感数据安全防护应用,,曾斩获工信部“鼎信杯”信创大赛优秀产品奖,,,,并通过了公安部的多项高标准、、、、高级别安全测试。。作为企业敏感数据的“易容大师”,,,TDMP具备以下五大绝技。。。。
绝技一:博——广泛的数据源支持
系统支持各种主流关系数据库、、国产数据库、、内存数据库、、、、分布式数据库、、、列式数据库、、、、分区数据库、、、、各种结构化文件、、、非结构化文件、、本地文件、、、、远程文件、、、、各种大数据平台等。。。
绝技二:准——精准的敏感信息识别
系统采用正则、、、、编码校验、、、、词法语法分析、、、、数据字典、、、智能记忆、、统计分析等多种组合扫描算法实现敏感信息的快速识别和精准识别。。。同时还提供在线修正与核实功能,,,以及csv文本批量导入与下载敏感信息功能。。。。
绝技三:妙——灵活的脱敏策略
系统内置各种基线策略,,,,包括个人基本信息、、、医疗卫生、、教育、、金融、、制造、、、政务等各种行业或类别的内置策略。。还可以设置策略种子、、策略是否可逆、、、策略适配度等。。。
绝技四:好——高效丰富的脱敏算法
系统内置80多种脱敏算法,,,,囊括了包括人基本信息、、医疗卫生、、、、教育、、、、金融、、制造、、政务等各种行业或类别的敏感信息的脱敏算法。。。算法有唯一仿真类算法、、、、随机类算法、、、、加密类算法、、、、切片类算法、、、、掩码类算法、、、、置换类算法、、组合类算法、、、自定义类算法等。。。。
绝技五:广——多样化业务场景支持
系统支持源库更新脱敏、、库到库异构脱敏、、、、库到库同构脱敏、、库到文件脱敏、、、文件到库脱敏、、、文件到文件脱敏、、、、大数据平台脱敏、、、大数据平台与文件&数据库互迁移脱敏。。。。
神州数码TDMP数据脱敏解决方案,,让您企业的数据以更安全的形式发挥最大的商业价值。。。

