分布式数据库具有高可用性、易于扩展性、低成本等优势,解决了海量数据存储、高并发处理难题,不仅能够支撑业务高效发展,而且满足了自主可控的要求,因此近年来在金融、党政、电信等领域得到落地应用,并逐步成为越来越多企业和组织的选择。
据IDC调研,目前约26.8%的企业级市场用户部署了分布式数据库,超过90%的企业认可分布式数据库部署后的效果。然而,数量众多的数据节点、高度复杂的集群结构,对已经习惯于集中式数据库的开发和运维人员来说,如何用好、维护好分布式数据库,更多的是挑战,是未知的不确定性。
针对“如何做好分布式数据库的运维管理?”这个问题,近日OceanBase 技术专家鲍磊、Oracle ACE 皇甫晓飞就给出了他们的答案。
分布式数据库,面临五大运维管理挑战
想要解决分布式数据库的运维管理难题,首先就需要了解分布式数据库运维管理目前面临哪些新挑战?据皇甫晓飞介绍,第一面临的是安全问题,只要能访问数据库的,以及数据库的特定操作,特别是一些特权操作,要能够进行审计,保证安全。
第二是可用性问题。当数据库出现故障的时候,要求能够快速恢复,满足行业和监管的要求。第三是数据库性能问题,最好是要有一套完整的故障处理流程和方法论,运维人员通过我们的知识库、用户手册以及借助我们的数据库运维工具,能够快速分析处理问题。
第四则是能够对性能以及容量进行评估,要保证客户项目的运营。第五,如何更好的满足,特别是金融行业,能够满足监管的要求和业务的变化。金融行业根据自身的特点,每年或者甚至每个季度都有一些业务的变化,而且要符合监管机构的要求,应对这个复杂多变的金融场景。
借助运维管理工具OCP,OceanBase逐一击破
OCP(OceanBase Database Proxy)作为OceanBase 设计开发的一款数据访问链路工具,能够提供白屏化的 OceanBase 运维监控能力,无论是让新手用户快速上手使用 OceanBase,还是在生产环境,作为 DBA 日常的运维工具都非常合适。
据鲍磊介绍,实际运维中,集群升级、租户扩容降配,容灾搭建、容灾切换等工作都是通过 OCP产品白屏交互方式来进行运维管理的,数据库管理人员对这些运维工作上手较传统数据库来说比较容易,排查问题也方便。
比如数据库备份恢复发生了错误,在多节点分布式数据库架构下 OCP会智能的给出对应报错日志所在节点及 traceid,引导 DBA 去基于traceid排查找到这个问题触发的上下文逻辑,进而找到问题根因。同时多节点数据库运行日志可以进行一键收集和基础分析。
并且实际应用中,机房搬迁海可以通过 OCP 白屏界面操作,可轻松实现在线搬迁(加 zone,减 zone),弹性大促执行 locality 变更(如3F->5F),地域级故障降级容灾(如 5F->3F) 。
此外,OCP 本身也开放了一些相应的运维接口,这些接口可以给相应的客户做一些定制化的编排。OCP 主要是把我们日常运维的在传统数据库上也遇到的问题,做一些流程化的交互式的管理。传统数据库 DBA 转型到分布式数据库 DBA 实际上成本是比较低的。
针对金融业的扩容难题,OceanBase会提前通过 OCP上的一些容量指标、监控指标,评估出扩容后的集群规模。就是以 zone 为单位,然后同等数量或者滚动的给每个 zone 去扩缩容,或者是给租户级别去进行一个租户规格的扩缩容,比如从三副本扩到五副本,或者给每个 zone 增加机器。
不难看出,OCP 能让运维管控更加简单,如果能灵活运用好这个代表性生态工具,定能帮助企业满足自身的多样化需求,同时高效解决分布式数据库OceanBase自身的数据管理难题。
领取专属 10元无门槛券
私享最新 技术干货