在上次推文主数据解析,深挖企业数据的核心价值中,我们深入了解了主数据及主数据管理一些基本概念。主数据管理的目的就是为了确保企业核心数据的准确性、一致性、稳定性,打破数据孤岛,帮助企业高效运转。然而在茫茫数据大海中识别出主数据是一项非常复杂的工程,它不仅要依靠专家的经验并结合行业特殊情况,同时要有一定的方法理论支撑。下面我们就来看一下到底如何识别主数据。
根据各行业项目经验总结出的主数据识别流程,主要包括数据识别类别梳理、数据实体类别梳理、主数据识别评分模板、建设主数据等,具体如下图。
(主数据识别流程)
一、数据实体类别梳理
从业务角度出发,在不同粒度和层次上系统地分析整个企业的业务流程,并将所有业务流程所涉及到的业务实体划分为主数据的识别对象。这一步是主数据识别的基础,需要确保参评业务实体无遗漏,从而保证最终主数据的识别结果无缺失。数据实体类别梳理过程中需要划分数据主题域并构建数据概念模型。
1、划分主题域
在建立概念模型之前,需要将已梳理的业务实体划分主题域,例如针对企业财务、供应链、人力三大主题域进行业务再细分,分析出核心业务类别。此时就需要借助项目实践经验和业界标准保证主题域属性划分符合规范。
2、建立概念模型
例如财务系统与供应链系统之间可能发生采购订单、收发货、付款等业务关联,而人力系统可能会与供应链系统及财务系统共享人员信息。这时就需要根据各业务系统之间的数据关联关系构建数据概念模型。
二、主数据识别评分模板
主数据识别评分模板由主数据评分指标和各指标权重组成。根据评分模板得出各业务实体的分值,由企业需要和专家意见确定阈值,大于阈值的业务实体数据即可确定为企业主数据。
1、主数据评分指标
主数据评分指标一般通过主数据识别标准的分析而获得。综合项目经验及业界研究成果,在确定主数据评分指标时,需要重点考虑以下几点:
基础性:主业务实体是基础的业务单元,它支持所有主要的业务行为和交易基础,一般不可再拆分。
共享性:主数据通常会被多个业务系统访问,作为共享数据存在。
业务价值:主数据描述了企业最核心的业务,是企业最有价值的资产。
周期性:主数据一般会在很长一段时间内被使用,具有较长的生命周期。
复杂性:主数据一般涉及多个业务系统,具有较高的复杂性。当业务实体的复杂性降低时,可以不再纳入主数据管理范畴。
流动性:主数据变化频率一般不高,小于交易数据的变化频率;但完全不变化的数据不应该判定为主数据。
多特征属性:主数据作为业务操作的主要对象,一般存在多个属性,用于区分不同的操作对象。
2、确定各指标权重
确定指标权重是主数据识别过程中非常关键的一部。常用的的权重确定方法包括主观赋权法和客观赋权法。
主观赋权法:根据决策者的意向和专家的建议确定各指标的权重系数,最终结果具有一定的主观性。常用德尔菲法、层次分析法。
客观赋权法:根据一定的数学公式或算法对各指标进行赋权,最终结果理论性较强,但不能反映决策者意向。常用主成分分析法、因子分析法。
现在也常将主观分析法与客观分析法结合使用。首先根据一定的理论得出各指标权重,之后再根据决策者和专家的依据对权重值进行适当修改,最终确定各指标权重值。
三、建立主数据管理平台
有了主数据识别指标和各指标权重后,就可以构建主数据识别模板,生成各业务系统分值;最后由分值高低确定某一业务数据是否可以纳入主数据管理范畴。确定主数据管理范畴之后,就可以建设企业主数据中心了。通过企业主数据中心,完成主数据的采集、分发、维护、质量管理、分析统计,确保主数据的准确性、唯一性、一致性,最终降低企业数据维护成本、促进业务经营发展、为未来IT建设打下基础。
小结:上述就是主数据识别的基本流程,但知之不难,行之惟艰。亿信华辰耕商业智能领域十多年,在丰富的行业经验基础上,研发的主数据管理平台,完美解决有关主数据的一切问题,实现主数据识别、抽取、审核、发布、生成、变更、失效的全生命周期管理。下期预告,《主数据管理第二步——体系构建》。
领取专属 10元无门槛券
私享最新 技术干货