本文将为您介绍如何通过 DBbrain 控制台添加数据脱敏任务。
DBbrain 数据脱敏功能内置多种高级脱敏算法,可智能化执行与管理脱敏任务:
支持定时任务、立刻执行任务两种执行方式,确保脱敏任务的灵活启动。
支持脱敏规则适配展现,向用户展示数据表每个字段的识别结果以及计划应用的脱敏算法,如发现适配存在问题也可以手动调整,确保脱敏任务按照用户的思路进行执行。
支持抽样脱敏,抽取数据表少量数据进行快速脱敏并在页面上展示,用户认可脱敏结果后再进行全量脱敏。
因此,数据脱敏在开始正式脱敏任务时,其数据识别准确率、脱敏后数据可用性都能得到有效保障。
步骤1:进入添加任务页面
1. 登录 DBbrain 控制台,在左侧导航选择数据库安全 > 数据脱敏,进入数据脱敏页面。
2. 在数据脱敏页面,单击添加任务,进入添加任务页面。
步骤2:设置源和目标数据库
在设置源和目标数据库页面,设置任务、源库、目标库,单击下一步。
任务设置:设置脱敏任务的执行信息,包括任务名称和执行方式,其中执行方式包括定时执行和立即执行,用户可根据自己的需要开启定时执行脱敏任务。
源库设置:设置连接脱敏任务的数据源,包括源库类型、实例 ID、账号、密码等,同时支持连通性测试用来检测是否成功连接源数据库。
目标库设置:设置连接脱敏任务的目标库,包括目标库类型、实例 ID、账号、密码等,同时支持连通性测试用来检测是否成功连接目标数据库。
步骤3:选择库表和规则
在选择库表和规则页面,选择需要脱敏的数据库表、脱敏规则、数据库编码和关联令牌,单击下一步。
选择库表:设置需要脱敏的数据库表,一次脱敏任务只能对一张数据表进行脱敏,支持按库名和表名对数据表进行搜索。
说明
如果检测到在本次脱敏任务中,目标实例中已存在重名库表,用户可以做出如下选择:一、删除重名目标表,将脱敏数据写入表,二、取消当前脱敏任务。
预定义规则:为脱敏任务添加脱敏规则,可以选择已创建的脱敏规则,也可单击规则管理创建新的脱敏规则。
设置数据库编码:设置源库和目标库的编码,默认为 UTF8,同时也支持 GBK、LATIN1、UTF8MB4。
关联令牌:非必填项,用于设置当前脱敏任务与其他脱敏任务的关联。如果当前任务填入了其它任务的令牌,则在两次脱敏任务的数据表中有相同字段及内容的情况下,令牌可保证该字段在两次脱敏任务中令牌化的结果相同。
步骤4:规则预览
任务基本参数配置完成后,数据脱敏功能将对被脱敏的数据表进行扫描,并对其字段进行各类规则的匹配。
在规则预览页面,系统将抽取一行数据,按照从数据库中获取的表组织信息进行脱敏,同时,页面会展示这行数据脱敏的字段名、抽样数据、主键非主键判断结果、敏感字段类型、脱敏算法等脱敏操作的依据。
注意
对于 text、varchar 等数据类型,单个单元格超过阈值长度(2083字符),将无法进行脱敏,该单元格数据将会全保留。
对于单个单元格数据大小超过10KB的数据,将会写入失败,该单元格数据将会截断保留。
如在该步骤中出现乱码状况,请至上一步选择库表和规则步骤中,设置正确的字符集。
如发现系统将某个字段匹配为未知类型,或为字段匹配了错误的脱敏算法,可在此步骤中进行修正。
步骤5:抽样脱敏
确认规则预览后,数据脱敏功能将开始对原始数据表进行抽样脱敏。在抽样脱敏页面,可详细了解脱敏后的效果:
如果对脱敏结果不满意,可单击上一步,返回规则预览进行规则修改。
如果确认无误,单击添加任务,即可创建脱敏任务。完成任务创建后,返回脱敏任务列表,即可看到刚创建的脱敏任务的详情及任务状态,待到执行时间后,将会启动脱敏任务。
注意
抽样脱敏是拉取的随机实时数据,为了防止给用户的数据库造成性能影响,脱敏任务在任务开始时拉取的是最新备份数据。