我个人对中台的理解: 我理解的数据中台不只是把各个子系统集成起来,应该还有计算平台(离线和实时的),还有调度平台,指标,权限,集群监控等等的一个集合。 同步架构还是异步架构是一种计数手段,具体使用哪种取决于实际应用场景。 数据中台使用场景很丰富,所以两种架构应该都有使用。
* 数据中台 的使用场景 一种切分方式,就是分为数据处理/写入场景,还有就是数据服务场景。大数据处理计算量很大,需要与业务系统解耦,因此需要使用异步架构。 * 而数据服务场景,需要及时响应,因此一般使用同步架构。
目前,公司理财业务,数据早已达到 TB 规模。应用场景非常复杂,有做智能理财,智能看盘,实时监管,等等不同的复杂应用。 (正在筹备做数据中台建设中)
* 数据命名规范: 不同逻辑层次需要通过良好命名规范去标识,这个可以同过自动化/半自动化的 ETL 工具去实现以及自动化的工具去及时统计不良命名表以便及时纠正。 * 数据治理 :可以实现自动管理工具,及时发现没有使用良好压缩文件格式的数据表,以及小文件的比例,还有就是及时清理一些僵冷数据,提高存储空间利用率。 * 数据安全:要做好各类数据权限控制,对敏感数据要有不同的分级管控。