Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >从生命周期的角度来规划数据库运维体系

从生命周期的角度来规划数据库运维体系

作者头像
jeanron100
发布于 2021-01-13 02:06:56
发布于 2021-01-13 02:06:56
1.2K0
举报

最近在和团队规划OKR目标的时候,我们讨论了很多问题,我先抛砖引玉,列举了一些现有的问题,打算按照推导的方式:

1)列举当前问题

2)问题归类和总结

3)梳理现有经验和现有方案

4)结合时间/性价比得到一定时期的预期目标。

整体来看,工作量还是蛮大的,再加上大家对于问题的理解角度不同,所以在容易在很多细节上讨论太多,难以聚焦。

所以我想了下,准备按照生命周期的维度来进行考虑,于是整理了一版设计图,整体是分为四个层面,也就是按照业务从申请资源和权限,到服务上线,服务优化,最后是相关的服务数据迁移和流转。

整体设计下来,我们会发现很多考虑中不足的地方和遗漏的角度。在多次提炼之后,我把这个设计图调整为如下的模式:

我来逐个解释下:

1)规范/选型/规划:这个阶段更强调整体,很多问题如果直接从基础运维入手,其实就已经晚了,有些服务质量差,交付时间长,本质上还是前期的基础建设不够扎实,所以这是一个互惠互利的关系,比如开发规范的设计和落地执行,架构设计(如分布式架构设计),技术选型(如MySQL 8.0适配的中间件技术调研,ClickHouse技术调研,TiDB技术选型,MyRocks存储引擎测试分析等),SQL审核(已有审核服务的升级和改进等),高可用(重中之重,涉及健康检查脚本,Consul服务快速切换,数据库高可用方案预研测试等),基础服务(如监控,报警和任务调度等相关服务),基础设置(如抛弃CentOS_6等低版本,磁盘配置统一为SATA-SSD等类似的方式)

2)基础运维:涉及资源交付(包括上下线,资源扩容等),权限交付(申请账号,账号权限变更,账号回收等),安装部署(如数据库软件安装部署,初始化),基础配置(基础配置,如ntp,crontab等),备份恢复(按照数据备份数据恢复的基础维度实现基本备份集,基于时间点的数据恢复)

3)运维优化:对象变更(需要演进为自动化上线模式),对于大表变更需要集成在线变更工具来实现,此外,重点是做一些相关的优化,如参数优化(如数据库优化参数,基础配置适配),对象优化(数据表优化,索引优化),SQL优化(执行计划优化,索引建议等),配置优化(系统配置,服务配置优化等)

这三个维度做好之后,其实会发现一些还是会恨吃力,那就涉及到数据迁移和数据流转,数据本身是在不同类型的环境间流转的,如何保证数据能够稳定,准确的流转也是重要的目标。

4)数据迁移和数据流转,数据迁移主要实现一键式数迁移,主要包括两个个方面:

(1)一键式数据库迁移,从1个服务器迁移到另外一个服务,一键实现

(2)数据库版本升级,如从MySQL 5.5升级到5.7,从5.7升级到8.0等,可以一键实现

此外,数据流转到数据仓库大数据,如何高效稳定的支持,如何实现实时的数据流转机制和多环境间的快速迁移/同步也是重点目标。

对于技术底座而言,首要的目标就是文档,文档可以从上面的四个维度拆分为多种文档,如规范设计文档,预研文档,方案设计文档,操作文档,案例文档等。

接下来的服务的交付都应该统一为API的模式,演进可以从脚本到工具,从工具到API的路径来演进。

底座的两大分支是云平台建设和服务建设,云平台建设覆盖面更大,提供的是产品化思维的服务交付,对于技术架构和开发效率的要求较高,这部分不能好高骛远,还是得结合自身情况来提供强大的动力,其中,元数据建设是核心目标,在这个层面元数据要集成,实现流程化管理。

而右侧的服务建设更贴近后端服务,从生命周期的角度来进行实例,数据库,表,字段,索引层面的周期性管理,而提供的辅助服务则是更加贴近运维实际的,比如慢日志优化,巡检服务和故障自愈,和业务侧是一种半透明的开放形式。

各大平台都可以找到我

  • 微信公众号:杨建荣的学习笔记
  • Github:@jeanron100
  • CSDN:@jeanron100
  • 知乎:@jeanron100
  • 头条号:@杨建荣的学习笔记
  • 网易号:@杨建荣的数据库笔记
  • 大鱼号:@杨建荣的数据库笔记
  • 腾讯云+社区:@杨建荣的学习笔记
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 杨建荣的学习笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
关于数据库服务质量的问卷调研设计
最近在做年度规划的时候,一直在思考一个问题,怎么才能能够得到业务侧对我们服务质量的想法和建议,或者换句话来说,我们的价值和表现如果自我评判,一般来说都会有失偏颇,而且相对容易乐观悲观两极化,所以对于评判的形式,经过评估觉得还是问卷的形式要好一点,最主要的一个原因是我们要想得到别人对我们的评价,我们最好能够自己把问题想明白,理清楚了。
jeanron100
2021/03/16
9060
运维开发体系升级的思考
在大概4年前,我们算是从0到1的构建了现在的数据库运维开发体系,这个过程有较长的启动周期,从我个人主导到后来的成员独当一面,从零星的功能建设到现在有了相对体系化的建设,现在想想真是不易。
jeanron100
2021/09/02
6070
数据库年度规划工作的方法论
春天来了,也到了新的财季,新的年度规划也要开始了。我相信很多同学都会有一种茫然的感觉,一年到头有做不完的事情,同时也感觉规划和实际落地会有很大的差距。
jeanron100
2021/04/22
5540
数据库年度规划工作的方法论
MyCAT和MySQL服务能力的对比梳理
今天下午对比了下MyCAT,MySQL和其他数据库的能力项对比情况,梳理了一个列表,因为篇幅原因,主要包含如下的一些能力项。
jeanron100
2021/10/14
1.1K0
MyCAT和MySQL服务能力的对比梳理
数据源集市建设的初步思路和规划
最近在对接数据流转的一些问题,发现越是了解,越是担心,因为有不少潜在的问题,所以我就在想规划和统一所谓的数据源集市,能够实现数据流转方向的一个基线标准。
jeanron100
2021/01/28
3730
移动端接入数据库故障自愈的初步实现
对于节假日,难得的假期,尤其是外出的时候碰上几个数据库报警,那些报警又属于不得不处理的时候,真是让人上火,所以也想了一些办法来尽可能杜绝和避免这种情况。
jeanron100
2021/04/02
4020
数据库环境标准化管理的初步规划
一般来说,业务能够稳定运行,大家主要聚焦的是线上环境的管理,相反对于其他环境的管理不够重视,而现实情况是这些环境的管理更需要标准化,通过统筹管理减少一些潜在隐患,才能在一定程度上减少线上环境的隐患。
jeanron100
2021/06/09
4860
我们为什么在MySQL中几乎不使用分区表
在Oracle中,使用分区表是一种很自然的事情,数据库容量基本都是500G起,大小在5T以上都是很常见的。
jeanron100
2021/03/16
1.8K0
MySQL数据实时克隆的初步设计
之前我们重点建设了数据克隆的一个服务,其实起这个名字也琢磨了好久,说逻辑备份恢复很多业务同学都不大能理解,GET到我们要解决的问题,而数据克隆的概念就比较清晰。
jeanron100
2021/03/16
6420
关于周期的思考和建议
今天脑海里蹦出了一个词“周期”,对的,周期。我觉得好像是一只无形的手,像是路口的红绿灯,路边的指示牌,能够通过这些规则的变化让交通秩序稳中有序。
jeanron100
2021/04/02
5140
梳理工作的一点小结-20220309
这是学习笔记的第 2407篇文章   最近在梳理工作的时候,做了一些小结。   首先是对于工作情况的量化,如果我们只是说自己做了什么什么事情,可能洋洋洒洒几十页ppt,也会让别人看得云里雾里,如果不是这个专业方向的人,基本都会有点晕菜,所以对于这个事情的抓手就是需要有一个参考基准,有了这个基准,你所做的事情都有一个对比,到底是多了还是少了,多了多少,少了多少,具体哪些多了,哪些少了都可以通过数字量化得到答案。     比如对于数据库服务能力的量化,我是选用了信通院开发的这个模型,通过评估惊人的发现我们做
jeanron100
2022/03/10
4880
DBA得给自己敲响警钟了
最近两天也看到了一些文章,里面提到了关于DBA这个岗位的不务实,或者说这个岗位存在着一些危机,从我的视角来看,这是一件挺好的事情,算是给我们这个岗位敲响了警钟。
jeanron100
2023/02/28
5190
DBA得给自己敲响警钟了
MySQL 8.0的预研清单和计划
最近在团队内聊了下关于MySQL 8.0的特性调研工作,其实线上已经稳定运行了近20%的业务,但是很多思维模式和习惯还是继承自5.7,所以需要与时俱进,在技能上能够引导开发同学,在后端的支持上能够做到游刃有余。
jeanron100
2021/04/22
6410
【干货整理】云数据库时代,DBA将走向何方?
伴随云计算的迅猛发展,数据库也进入了云时代。云数据库不断涌现,产品越来越成熟和智能,作为数据库管理员的DBA将面临哪些机遇和挑战?又应该具备什么能力,才能应对未来的不确定性?
jeanron100
2022/12/14
6690
【干货整理】云数据库时代,DBA将走向何方?
维护之夜,说点故事和经验
人内心的默契就是这样,今天要写的标题和几年前一模一样,干脆在原来的基础上做一些补充。
jeanron100
2021/04/23
4170
关于业务存储结构扩容的方案设计和思考
这是学习笔记的第 2417篇文章   今天和研发团队沟通一个数据存储方案的设计和改造,大体的背景是在数据库中有些id类数据,如果数据类型是int,则存在一定的溢出风险,在程序层面需要提前考虑修改为int64,在MySQL中可以简单理解为bigint.   我们假设这个id字段为uid,如果是用户业务,则很多业务逻辑都是和这个uid强相关的,那么就会存在大量的业务梳理和研发代码的接入,如果底层数据存储的压力和风险过大,则这个事情的改进周期和影响范围就会更难以评估和控制。      所以这个问题从长期来看是未
jeanron100
2022/05/12
6510
关于业务存储结构扩容的方案设计和思考
灵魂2问12答:DBA的核心价值和最重要的能力是什么?
记得自己在去年的时候私信问了一些朋友关于DBA核心价值和最重要的能力的问题,听到了很多不同角度的思考和反馈,今天整理了下,时隔半年,也算是完成了一件心头的事情。
jeanron100
2021/06/09
8590
数据库开发规范初版结构设计
数据库开发规范的部分自己也琢磨了一些时间,对于整个开发规范的内容设计自己也想了不少的改进点,这是目前设计的一个初版结构草图,得把整个结构弄清楚了,在这个基础上才能有稳定的内容设计,也欢迎大家拍砖。
jeanron100
2023/02/28
5060
数据库开发规范初版结构设计
居家办公的团队协作模式改进思考
这是学习笔记的第 2420篇文章   对我们大多数人来说,精力是一种稀缺的资源,因为精力有限,所以如何有效的进行时间管理是很长一段时间以来我一直在尝试和改进的,清单模式我们小团队践行了近1年多,今年疫情以来自己也在不断的调整,这个过程中我也摸索出一些想法来,说实话到现在为止也仅算是一个小学生。     最近打算入手Omnifocus,结果无意中找到一本书《小强升职记》,篇幅不长,是故事形式的描写,看起来很有画面感,所以果断入手了。    书里面提炼了一个方法论叫做:3+1清单视图,这个推导过程是很深刻和震
jeanron100
2022/05/25
5520
居家办公的团队协作模式改进思考
外卖骑手这个职业的思考和分析
这是学习笔记的第 2300篇文章   最近在听得到头条的时候,有一篇内容感觉很不错,是《怎样当好一名外卖骑手》,本来是的带着一丝的娱乐意味来听的,没想到确实让我有了新的认识。    我整理了下思路,打算和大家简单聊聊。 我会按照两个维度来聊关于外卖骑手这件事,分别是: 1)打破认知思维,重新看待外卖骑手 2)如何在长期,持续的跑单工作中提效。 首先是打破认知思维,重新看待外卖骑手,这里我没有职业歧视,偶尔会和外卖小哥聊一下,发现他们全年几乎无休,总是在争分夺秒。换了一个思路来看,外卖骑手这个职业只要勤劳
jeanron100
2022/03/16
8590
相关推荐
关于数据库服务质量的问卷调研设计
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档