首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

模型治理是数据治理的关键

近日,银监会发布了《银行业金融机构数据治理指引(征求意见稿)》,犹如一石激起千尺浪,几个圈内朋友纷纷来电,讨论这次新的契机以及国家下一步的动向。然而作为一个了解国外和国内数据治理状况的从业者,我却在冷静的思考着,我欣喜国家战略层面的推动,同时也担忧这会是又一次运动式的数据治理,热潮过后只是泛起一些尘埃。

我们国家的金融和电信业是数据治理的先驱,我现在读的几本数据治理书籍也是我国第一代数据治理精英撰写。那个时代的关系数据库和现在的大数据一样火热,那一代人都熟读数据库原理,用着Erwin/PowerDesigner工具,谦虚的学着国外的数据开发方法。后来互联网热潮了,我不知道从何时起,数据库再也不建主外键关系了,数据库设计都直接ORM了,甚至变成了程序的一部分了。再后来又大数据了,然后就焦虑了,焦虑自己都有些什么数据,大数据平台放什么,于是乎就开始风起云涌的治理了。

说起来挺有趣儿,突然觉得有点像工业与环境的关系,先污染才能发展,发展了再治理。好吧,也许这是社会发展的规律使然。那么说回来,我们过去的数据治理的问题是什么,如何让这次契机能够影响深远,真正促进国民企业走入数据化经营时代,这是每一个行业相关者应该思考的问题。

那么我先来抛砖引玉,说的偏颇,欢迎拍砖

首先,我要问一个问题,在企业数据的生命周期(调研,开发,生产,应用,分析)中,哪一个环节造成的数据问题最多? 毋庸置疑,作为一个十几年的开发者深信,大多都是开发阶段直接造成或间接埋下的,因为开发阶段,决定了未来数据的输入方式,形态,格式,甚至质量等。所以把开发环节控制好,就从根本上扼住了数据治理问题的源头。在开发环节上,数据模型是其中最最关键一环。说到此,我也不仅顿足,国内现在还有很多大型企业还在用Excel/Word来进行数据字典的管理,比起20年前感觉还退步了。一个数据字典仅有数据描述,数据关系统统漏掉,数据库又没有主外键。到进行数据分析时候,这都是致命伤啊,恢复关系是个成本很高的工作。

有时候,我在想这是我们在长线思维上的缺陷,还是这些建模工具太贵太不适合国人了。相比,我见过一些做的好的企业,系统而体系的使用模型工具,每天报表自动监控模型的修改,数据字典都是从模型导出。对于他们来说,数据治理真的是一项面向更高数据价值挖掘的工作,而不是诸如梳理数据字典,还原曾经是数据真相的主题,当然还有猜出来的数据关联,这些费力不讨好的活儿。

数据治理的方法论无疑是伟光正的,然而落地实施确实是多方掣肘的难题。大家都知道数据治理实施的核心三要素是政策流程、工具、监管,只有三管齐下,才能保证有效的执行,缺一不可。

如何做好数据治理?

这个三角中,我国的经济和企业体制下,最擅长的无疑“政策”这一环,英明的领导们开个动员会,发个红头文件,是最容易做的。不过从历史经验看,这些活动都属于运动式的治理活动,上层轰轰烈烈,下面的广大码农仍然在用自己的名字命名字段。数据的上下两张皮问题,没有从根本上解决。有一些企业制度了流程规范,但是对于开发者来说,这些规范都是有一些为了治理而治理的流程,执行起来是有抵触的,注定效果也是不好的。基于这一点,我们不能再怪领导没有决心,员工不太积极了,我们需要新的思维走出人治的陈旧方式。

正如前言,我认为国内企业在工具这一项上是最弱的,国外的工具还是偏贵的,免费版的东西,自己也不敢认真用,最终造成模型工具都是个人行为,而非企业统一的规范。这也造成了源头治理在我国大部分企业没有做好,处于一个治标不治本的状态。所以我认为高大上的政策需要有效的工具将其落实到正常工作环节中,尤其要轻流程,让大家付出尽可能少的成本,随手把工作做了最好。

监管这一块,强于政策,弱于工具,败于成本。国外有句名言,no measurement,no management (无法衡量,就无法管理),没有自动工具的辅助,沦为人治困境,劳民伤财,不可持续,结果可想而知。

文至此,提几条建议:

1. 从今天起,开发团队的发布和上线,必须有模型,取代Excel版本的数据字典,Excel数据字典应该是只读,不能作为维护元数据的工具。这个应该不难。

2. 自动监管起来,保证元数据的更新机制,模型和数据库的一致性。这个是对数据生产和管理的关键,没有自动工具,这个数据治理是失控的。

3. 如果老板有钱,给团队买个建模工具,成系统的推广使用,从习惯上培养数据治理文化和流程。人很多时候,对一件事情认不认真,就取决于花没花那个钱。

总结

目前大部分企业在数据治理上还是初级阶段,首先是解决存量数据的理解问题,这个是数据应用的关键。虽然全公司投入数据治理活动固然是难能可贵,但是要真的想长期解决问题,还是要更多的参与方形成操作共识,目前这个共识就是模型工具,作为国内首家模型工具提供商,我们集成了模型管理工具和数据目录平台,可以自动完成模型多人共享,和数据目录平台的监管集成。一站式数据治理,简单有效,让大家都轻松完善数据,让公司的数据逐渐沉淀出业务内涵,发掘数据价值就是水到渠成了。

———— / END / ————

感谢阅读本文章,欢迎留下评论及个人见解!

原创文章作者

朱金宝CTO

前ERwin总架构师,10年ERwin研发经验. 负责产品全生命周期的发布,丰富产品发布和架构设计经验,多个大数据建模专利所有者和技术文章作者

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180401G16VZ000?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券