Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据源集市建设的初步思路和规划

数据源集市建设的初步思路和规划

作者头像
jeanron100
发布于 2021-01-28 02:55:49
发布于 2021-01-28 02:55:49
3740
举报

最近在对接数据流转的一些问题,发现越是了解,越是担心,因为有不少潜在的问题,所以我就在想规划和统一所谓的数据源集市,能够实现数据流转方向的一个基线标准。

目前发现的问题: 1.数据出口通道繁杂,管理混乱 2.MySQL流转服务单点难以扩展 3.任务状态不清晰,缺乏统一管理 4.数据交付质量难以保证,反馈不及时 5.近实时数据同步需求难以满足

对此提出的改进方案有: 1.数据出口通道统一交付 2.构建数据源集市服务组,水平扩展压力 3.任务配置平台化,任务日志指标可视化 4.数据交付提供交付标准和数据质量日志 5.提供近实时方案作为备选,预知问题

整个数据源集市在数据流转体系中的角色和位置如下:

当日这里是刻意把数据源集市的一些组件和服务列举出来,能够尽可能在这个层面实现数据质量的标准和度量,简而言之,数据如果不合理,我应该及时预警,不能将错就错的提供给中下游,数据源集市需要做好这一层的保障。

在数据流转方向上,我把数据表分为状态表,流水表和配置表,他们在流转体系中的定位和标准也大有不同。

当然这仅仅是数据流转体系内的冰山一角,而如果要把数据的认知和数据源要整合起来,形成统一的认知,这个工作量是极为巨大的。

我感觉对于数据的认知,一旦抛出这个话题,就好像打开了一扇窗,经过了更大范围的讨论,我感觉我本来想要的是一口井,没想到现在需要引一条河流,而且还要再河流上再搭一座桥,真让人头大。

各大平台都可以找到我

  • 微信公众号:杨建荣的学习笔记
  • Github:@jeanron100
  • CSDN:@jeanron100
  • 知乎:@jeanron100
  • 头条号:@杨建荣的学习笔记
  • 网易号:@杨建荣的数据库笔记
  • 大鱼号:@杨建荣的数据库笔记
  • 腾讯云+社区:@杨建荣的学习笔记
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 杨建荣的学习笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
从生命周期的角度来规划数据库运维体系
最近在和团队规划OKR目标的时候,我们讨论了很多问题,我先抛砖引玉,列举了一些现有的问题,打算按照推导的方式:
jeanron100
2021/01/13
1.2K0
我们为什么在MySQL中几乎不使用分区表
在Oracle中,使用分区表是一种很自然的事情,数据库容量基本都是500G起,大小在5T以上都是很常见的。
jeanron100
2021/03/16
1.8K0
MyCAT和MySQL服务能力的对比梳理
今天下午对比了下MyCAT,MySQL和其他数据库的能力项对比情况,梳理了一个列表,因为篇幅原因,主要包含如下的一些能力项。
jeanron100
2021/10/14
1.1K0
MyCAT和MySQL服务能力的对比梳理
数据库环境标准化管理的初步规划
一般来说,业务能够稳定运行,大家主要聚焦的是线上环境的管理,相反对于其他环境的管理不够重视,而现实情况是这些环境的管理更需要标准化,通过统筹管理减少一些潜在隐患,才能在一定程度上减少线上环境的隐患。
jeanron100
2021/06/09
4870
数据库年度规划工作的方法论
春天来了,也到了新的财季,新的年度规划也要开始了。我相信很多同学都会有一种茫然的感觉,一年到头有做不完的事情,同时也感觉规划和实际落地会有很大的差距。
jeanron100
2021/04/22
5580
数据库年度规划工作的方法论
MySQL数据实时克隆的初步设计
之前我们重点建设了数据克隆的一个服务,其实起这个名字也琢磨了好久,说逻辑备份恢复很多业务同学都不大能理解,GET到我们要解决的问题,而数据克隆的概念就比较清晰。
jeanron100
2021/03/16
6440
DBA得给自己敲响警钟了
最近两天也看到了一些文章,里面提到了关于DBA这个岗位的不务实,或者说这个岗位存在着一些危机,从我的视角来看,这是一件挺好的事情,算是给我们这个岗位敲响了警钟。
jeanron100
2023/02/28
5220
DBA得给自己敲响警钟了
使用Python可视化图表分析行程数据
最近一直在想怎么分析一下个人的行程数据,看看能够从行程数据里面分析出点什么来。最开始我的期望还是蛮高的,有如下的一些预期:
jeanron100
2021/10/14
9940
使用Python可视化图表分析行程数据
重新组织我的知识库
这是学习笔记的第 2432篇文章   首先来说下让人绝望的熵增定律, 引用混子哥的解读。   我们的生活和工作是如此,个人知识库和总结也是如此,最初是缺少一些素材,所以没有分类的烦恼,想怎么弄怎么弄,算是从0到1,而随着数量和质量的积累,会发现原来的玩法不行了,如果要搜索一些关键字,对于目录结构在脑子里得记个大概。我现在有近4000多的笔记和零零散散整理收集的内容,这个数量其实是比较庞大的,如何管理和归类这些内容就是摆在我面前的一个重要挑战,否则个人知识库就好像一潭死水一样,没有活力。     我也参
jeanron100
2022/08/29
4850
重新组织我的知识库
运维开发体系升级的思考
在大概4年前,我们算是从0到1的构建了现在的数据库运维开发体系,这个过程有较长的启动周期,从我个人主导到后来的成员独当一面,从零星的功能建设到现在有了相对体系化的建设,现在想想真是不易。
jeanron100
2021/09/02
6100
节假日处理数据库集群异常小记
这是学习笔记的第 2403篇文章   今天还在假期状态中,大概在10:30左右的时候,收到一条短信报警,提示一个数据库集群的中间件内存报警了,但是不到1分钟的时间,就提示报警恢复了,但是在11:00左右的时候,接到了研发同学的反馈,说这个数据库集群的只读服务貌似有些问题,想让我帮忙看一下到底有什么问题,整个集群的架构模式类似下面的形式,现在提示是黄色部分的只读数据库中间件有问题。   因为节前也做了巡检,而且这个只读服务已经运行了很长时间了,差不多有3年以上,所以我对于这个问题的初步印象是数据库中间件异
jeanron100
2022/03/03
6980
关于数据库服务质量的问卷调研设计
最近在做年度规划的时候,一直在思考一个问题,怎么才能能够得到业务侧对我们服务质量的想法和建议,或者换句话来说,我们的价值和表现如果自我评判,一般来说都会有失偏颇,而且相对容易乐观悲观两极化,所以对于评判的形式,经过评估觉得还是问卷的形式要好一点,最主要的一个原因是我们要想得到别人对我们的评价,我们最好能够自己把问题想明白,理清楚了。
jeanron100
2021/03/16
9150
从作者的角度去阅读一本书-一种全新的阅读体验
最近在尝试和探索的新的学习方法,总体的感觉效率还是蛮高的,至少能够在短时间内有比较多的思考和产出,最近几天在进行类似的尝试,就是快速去阅读一本书,我的角度相比比较特别,我来简单阐述一下。
jeanron100
2021/09/24
4000
居家办公的团队协作模式改进思考
这是学习笔记的第 2420篇文章   对我们大多数人来说,精力是一种稀缺的资源,因为精力有限,所以如何有效的进行时间管理是很长一段时间以来我一直在尝试和改进的,清单模式我们小团队践行了近1年多,今年疫情以来自己也在不断的调整,这个过程中我也摸索出一些想法来,说实话到现在为止也仅算是一个小学生。     最近打算入手Omnifocus,结果无意中找到一本书《小强升职记》,篇幅不长,是故事形式的描写,看起来很有画面感,所以果断入手了。    书里面提炼了一个方法论叫做:3+1清单视图,这个推导过程是很深刻和震
jeanron100
2022/05/25
5540
居家办公的团队协作模式改进思考
数据仓库和数据集市详解:ODS、DW、DWD、DWM、DWS、ADS「建议收藏」
Data warehouse(可简写为DW或者DWH)数据仓库,是在数据库已经大量存在的情况下,它是一整套包括了etl、调度、建模在内的完整的理论体系。
全栈程序员站长
2022/09/13
5.6K0
OneData建设探索之路:SaaS收银运营数仓建设
在现有大数据平台的基础上,借鉴业界成熟OneData方法论,构建合理的数据体系架构、数据规范、模型标准和开发模式,以保障数据快速支撑不断变化的业务并驱动业务的发展,最终形成我们自己的OneData理论体系与实践体系。
美团技术团队
2019/10/23
1.5K0
OneData建设探索之路:SaaS收银运营数仓建设
企业大数据平台仓库架构建设思路
本文作者主要从总体思路、模型设计、数据架构、数据治理四个方面介绍了如何利用大数据平台的特性,构建更贴合大数据应用的数据仓库。
大数据老哥
2021/11/19
3870
企业大数据平台仓库架构建设思路
数据仓库系列:如何优雅地规划数仓体系
数仓规划是数仓建设的蓝图,涵盖从需求分析开始到最终的数仓评估验收整个环境;数仓规划之所以重要,是因为它是描述了数据流动的概念性框架,为元数据管理奠定了基础,对数据加工过程的理解、数仓建设的交流分享、数据的使用和问题排查、数仓健康度的评估都提供了极大的帮助。
木东居士
2019/12/10
3.7K0
数据仓库系列:如何优雅地规划数仓体系
DataMan:美团旅行数据质量监管平台实践
背景 数据,已经成为互联网企业非常依赖的新型重要资产。数据质量的好坏直接关系到信息的精准度,也影响到企业的生存和竞争力。Michael Hammer(《Reengineering the Corporation》一书的作者)曾说过,看起来不起眼的数据质量问题,实际上是拆散业务流程的重要标志。 数据质量管理是测度、提高和验证质量,以及整合组织数据的方法等一套处理准则,而体量大、速度快和多样性的特点,决定了大数据质量所需的处理,有别于传统信息治理计划的质量管理方式。 本文基于美团点评大数据平台,通过对数据流转
美团技术团队
2018/03/29
2.7K0
DataMan:美团旅行数据质量监管平台实践
迁移至MySQL的数据流转流程优化
数据流转在很多公司都有实践和落地的场景,如果说关系型数据库/NoSQL是在分,则在数据仓库体系中就是在合,数据分分合合,各取所需。一般来说,数据消费主要有两种渠道,一种是通过报表等形式交付,数据精确度高,实时性要求相对不高,也就是我们常说的统计方向,另外一类是重在数据分析,通过分析过往历史的数据设计相应的模型,发挥数据更深层次的价值,这种一般都是数据工程类项目,基于大数据体系。如果两种体系并存彼此独立,那么就会是如下的数据通道.
jeanron100
2020/12/31
6060
迁移至MySQL的数据流转流程优化
相关推荐
从生命周期的角度来规划数据库运维体系
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档