在业务的驱动下,美团点评DBA团队经历了从“人肉”运维到工具化、产品化、自助化、自动化的转型之旅,也开始了智能运维在数据库领域的思考和实践。...本文将介绍美团点评整个数据库平台的演进历史,以及我们当前的情况和面临的一些挑战,最后分享一下我们从自动化到智能化运维过渡时,所进行的思考、探索与实践。...换句话来说,智能运维不用报警,通过看报表就能知道可能要出事了,能够把故障消灭在“萌芽”阶段;第二,传统运维是被动接受,而智能运维是主动出击。...但主动出击不一定是通过DBA去做,可能是系统或者机器人操作;第三,传统运维是由DBA发起和解决的,而智能运维是系统发起、RD自助;第四,传统运维属于“人肉救火”,而智能运维属于“智能决策执行”;最后一点...w=1340&h=672&f=png&s=274797] 上图是传统运维和智能运维的特点分析,左边属于传统运维,右边属于智能运维。
实际上很多企业都有想做一套数据库运维平台的想法,主要基于以下的一些原因 1 ORACLE 的淘汰,导致更换其他数据库后,数据库的台数和数量等都有上升,管理手段和方式在使用纯手工的方式进行大批量的数据库的管理...2 固定种类数据库运维监控种类的平台建立,这样的平台也是见得不少,都有自己的特性和卖点,并且有些产品是固化与某一种数据库产品或自研数据库产品所推出的,这些平台包含,自动搭建数据库,自动巡检数据库,自动运维故障处理...3 基于业务的数据库运维的平台,这点可能是商业数据库平台的一个无法触及的地方,目前经济环节的问题会导致针对成本核算的重视,而数据库成本的计算,尤其与业务方面有关的方面这是一个空白,比如数据库为什么要扩充容量...自研平台可以针对各种数据库的原理结合自身的业务特性,做出适合企业特有的数据库运维与工作性能监控,任务自动一体化的平台,通过平台的搭建,搭建者会成为数据库技术及公司业务的精通者,并且对于DEVOPS 软件平台的规划和功能模块的划分也会有深入的了解...从某种角度,如果深入到业务甚至可以通过平台的方式节省在数据库上的投入,转变被动管理方式,为主动管理,让数据库运维从花钱的角色,变为省钱的角色,乃至一个“赚钱”的部门。
从 2009 年到 2021 年,从千万交易额到千亿交易额,双 11 已经开展了 12 年。如今,每年的双 11 以及一个月后的双 12,已经成为真正意义上的全民购物狂欢节。...是什么样的数据库撑起了 2021 年的双 11 双 12 的稳定进行?...《数据 Cool 谈》第三期,阿里巴巴大淘宝技术部双 12 队长朱成、阿里巴巴业务平台双 11 队长徐培德、阿里巴巴数据库双 11 队长陈锦赋与 InfoQ 主编王一鹏,一同揭秘了双 11 双 12 背后的数据库技术...“那这背后对于一个新的数据库产品类型的要求,实际上整个业界大家都是在探索阶段。” 写在最后 双 11 双 12 背后的数据库技术支持远不止于此。...双 11 双 12 丰富的运营活动和千亿交易额背后,数据库层面是包括 RDS、PolarDB、Tair、ADB(ADB3.0) 以及 Lindorm 等数据库产品提供的组合技。
数据库管控能力高,不仅能直接推动企业的数字化转型进程,也能够帮助企业降低运维成本、提升效率,保障数据安全可控。因此,数据库自主管控与智能运维能力十分重要。 数据库架构设计如何满足企业管控要求?...企业在数据库智能运维方面有哪些经验可以借鉴?本次 DBTalk 技术公开课,我们将聚焦金融行业的数据库运维能力,结合最佳实践案例,解答上述问题。...本次议题,将详细解读腾讯云 TDSQL 的分布式能力如何与金融行业运维体系对接,并分享在传统金融业务的核心系统快速构建企业级云数据库平台最佳实践。...业务创新与技术架构演进的同时,对底层基础软件平台的支撑能力也提出了更高的要求。而数据库运维逐步向标准化、自动化、集中化、智能化演进,则成为行业未来发展的必然趋势。...本次议题,将聚焦金融行业,分享数据库运维能力演进及落地经验。
远程运维是工业互联网重要组成部分,没有工业互联网核心技术,远程运维不可能实现目标,设备远程运维平台运用了各种新技术,物联网实现数据接入,云计算实现存储、大数据实现分析, 人工智能实现状态检修与预警预报。...01设备远程运维平台设备远程运维平台通过智能终端对设备进行在线监测,将各种数据上传到云平台,存储、整理、分析,通过智能应用系统实现在线监控、记录、查询、统计、分析、修改、报警等操作,实现远程智能化管理。...设备远程运维行业现状分析:01设备运行状况:设备分布广,无法远程监控设备运行情况、故障情况;02运维成本:出差维护成本高,好多无效出差,设备故障无法及时掌握;03设备运营服务:设备工作、故障、服务、客户使用...04设备远程运维系统优势1、一物一码,快速全面掌握设备信息系统给每台设备配置唯一的二维码标识,扫一扫即可快速查看设备详情、服务记录、备件更换记录、设备使用帮助、知识库以及设备的实时运行数据,更加有利于客户对产品使用...05设备远程运维应用价值
10月20日,腾讯织云 Metis 智能运维学件平台正式对外开源。...1、项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。...如 Metis 的智能咨询机器人、舆情监控、集群智能负载均衡、数据库参数调优、容量预测。...5、Metis 智能运维学件未来开源计划 Metis 将打造一个开放的学件平台,陆续开源时间序列指标预测、主机异常智能分析、MySQL 异常智能分析、硬盘生命周期预测等其它智能运维学件,集合广大用户在智能运维领域的建设经验和实践...腾讯织云 Metis 智能运维学件平台之无阈值智能监控学件正式开源 Github 开源地址: https://github.com/Tencent/Metis Metis国内镜像地址: https://
如企业业务发展很快,对容量管理这部分就很重要;再比如有类似双11的大促活动等,也需要此能力。但相对而言,这部分能力现有工具平台相对功能较弱。...数据库运维管理平台将逐渐向基于云的SaaS平台发展,实现跨地域、跨云平台的资源监控和管理。 智能化趋势:数据库运维管理平台将更加注重应用人工智能、机器学习等技术,实现数据库管理自动化和智能化。...安全智防趋势:随着数据库安全事件频繁发生,数据库运维管理平台将更加注重数据库安全的智能防护。例如对不合法的SQL操作,恶意登录,数据泄漏等安全事件进行实时监控,及时发现并处理异常情况。...自动化趋势:数据库运维管理平台将更加注重自动化运维的发展,推进各项操作的自动化实现,减少人工操作的参与,提高运维效率和管理质量。...综上所述,数据库运维管理平台将逐渐实现云化、智能化、多模式化、安全化和自动化的发展趋势。作为一个专门用于进行数据库管理和运维的平台,将实现更高效的数据库管理,更保障企业数据的可靠性和安全性。
为了使DBA的工作轻松,有效率很多年前各大公司就开始自动化运维平台建设,在这方面我们属于比较晚的了。 今天介绍下最近开发的一个平台,自助DML。什么是DML,就是平常执行的增删改查数据库操作。...有人有疑问这不是程序访问的操作,为什么还要做一个平台操作这些呢,其实这种操作主要是开发需要线下修复数据的一种操作,不只是增删改,还有建表,建索引,添加字段等,这些操作开发一般会提给DBA协助操作数据库。...虽说现在的公司实例少点,但每天的工作量还是很大,关键这种工比较重复,枯燥,没有技术含量,所以迫切需要一个自助的服务平台开放出去来提高工作效率,解放DBA。...: 1) 提交任务需要满足两个条件:(1) 元数据平台(请参考之前的元数据平台博客)集群归属部门信息不能为空 (2)提交任务的人所在部门要跟集群归属部门一致 2) 根据流程检查权限后,就会对提交的...10) 这个页面是DBA后台操作页面, 目前只有DML,其他平台正在开发中。 总结: 此系统目前已经开放给RD使用,目前日处理需求量50+,对工作效率,安全性,RD体验等方面有了显著的提升。
1 项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。...在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。...如 Metis 的智能咨询机器人、舆情监控、集群智能负载均衡、数据库参数调优、容量预测。...5 Metis 智能运维学件未来开源计划 Metis 将打造一个开放的学件平台,陆续开源时间序列指标预测、主机异常智能分析、MySQL 异常智能分析、硬盘生命周期预测等其它智能运维学件,集合广大用户在智能运维领域的建设经验和实践...腾讯织云 Metis 智能运维学件平台之无阈值智能监控学件正式开源 Github 开源地址: https://github.com/Tencent/Metis (点击文末阅读原文直接访问) 请给 Metis
1 项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。...在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。...如 Metis 的智能咨询机器人、舆情监控、集群智能负载均衡、数据库参数调优、容量预测。...5 Metis 智能运维学件未来开源计划 Metis 将打造一个开放的学件平台,陆续开源时间序列指标预测、主机异常智能分析、MySQL 异常智能分析、硬盘生命周期预测等其它智能运维学件,集合广大用户在智能运维领域的建设经验和实践...腾讯织云 Metis 智能运维学件平台之无阈值智能监控学件正式开源 Github 开源地址: https://github.com/Tencent/Metis 请给 Metis 一个 Star !
2019年5月8日-10日的DTCC2019年中国数据库大会上,腾讯云数据库专家工程师雷海林首受邀做了主题为《TDSQL智能运维平台-扁鹊架构与实践》的技术分享,以下为大会现场演讲实录。 ?...扁鹊的需求背景 TDSQL作为腾讯针对金融场景推出的高一致,分布式数据库集群的解决方案目前已覆盖了腾讯90%的支付业务场景,内部有大量团队使用;同时作为腾讯金融云的数据库产品,支持公有云和专有云两种云解决方案...之所以将这个模块命名为扁鹊,就是希望它能像古代的扁鹊神医为人诊断病因一样也可以为数据库“对症下药“,治疗/修复/预判数据库已知或潜在的风险。 2....三、智能诊断原理与实践 我们将客户经常咨询的DB问题大体分为三类,可用性问题、性能问题、可靠性问题。 下面我们具体看一下扁鹊是怎样针对这三类问题进行分析并解决的。 1....从我们自身的运维经验来看,由DB故障导致的切换并不常见,更多的情况是由于用户的SQL占用过多的系统资源引发的一些异常状况,主要可以分为慢查询并发和大事务两类,下面我们逐个分析两种行为触发切换的原因 由慢查询并发引起的主备切换
2019年5月8日-10日的DTCC2019年中国数据库大会上,腾讯云数据库专家工程师雷海林首受邀做了主题为《TDSQL智能运维平台-扁鹊架构与实践》的技术分享,以下为大会现场演讲实录。...image.png 关注“腾讯云数据库”官方微信,回复“智能运维”,即可下载本文PPT。...image.png 三、智能诊断原理与实践 我们将客户经常咨询的DB问题大体分为三类,可用性问题、性能问题、可靠性问题。 下面我们具体看一下扁鹊是怎样针对这三类问题进行分析并解决的。...image.png 从我们自身的运维经验来看,由DB故障导致的切换并不常见,更多的情况是由于用户的SQL占用过多的系统资源引发的一些异常状况,主要可以分为慢查询并发和大事务两类,下面我们逐个分析两种行为触发切换的原因...关注“腾讯云数据库”官方微信,回复“智能运维”,即可下载本文PPT。 image.png
2019年5月8日-10日的DTCC2019年中国数据库大会上,腾讯云数据库专家工程师雷海林首受邀做了主题为《TDSQL智能运维平台-扁鹊架构与实践》的技术分享,以下为大会现场演讲实录。...之所以将这个模块命名为扁鹊,就是希望它能像古代的扁鹊神医为人诊断病因一样也可以为数据库“对症下药“,治疗/修复/预判数据库已知或潜在的风险。 2....三、智能诊断原理与实践 我们将客户经常咨询的DB问题大体分为三类,可用性问题、性能问题、可靠性问题。 下面我们具体看一下扁鹊是怎样针对这三类问题进行分析并解决的。 1....从我们自身的运维经验来看,由DB故障导致的切换并不常见,更多的情况是由于用户的SQL占用过多的系统资源引发的一些异常状况,主要可以分为慢查询并发和大事务两类,下面我们逐个分析两种行为触发切换的原因 由慢查询并发引起的主备切换...受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。
为此,博睿数据近日正式推出了一体化智能可观测平台ONE,该平台旨在建立一体化、智能化、面向业务与用户体验的统一运维平台,助力企业提高数字化体验,降低运维成本,提升工作效率,为数字化转型赋能升级。...同时,这也是业界第一个将所有运维监控需求“All in ONE”的统一平台。 博睿数据COO吴静涛直言:“一体化智能可观测ONE平台在IT运维市场具有里程碑意义。...作为一个集告警收敛、异常检测、根因定位、智能见解,聚焦业务与用户体验的运维体系,打破运维孤岛,避免重复建设,赋能企业数字化的一体化、智能化、面向业务与用户的开箱即用的一体化可观测平台,ONE平台实现监控到可观测...从孤立的工具走向统一的能力平台,传统工具化的运维体系竖井林立,已不再适合企业对位运维监控的需求。 从人工的分析走向智能的见解。...大部分运维产品只是提供简单的信息,而ONE平台提供智能见解,告诉用户系统发生了什么,以及运维人员应该做什么以解决这些问题。
11月15日,腾讯数据中心与重庆电信在渝正式签署战略合作协议。此次双方将在数据中心智慧运营领域展开合作,这也是继互联网带宽、机柜出租和大型数据中心定制服务等多领域合作后的再度携手。...作为腾讯20年数据中心运维经验的结晶,腾讯智维平台将以水土机房为起点,逐步在重庆电信机房部署落地。此次合作,正是腾讯数据中心为行业升级提供解决方案的一次尝试,也代表着腾讯拥抱产业互联网的决心。...图4 腾讯重庆云计算数据中心 腾讯智维由服务内部的星云平台升级而来,是腾讯自研的数据中心技术设施管理软件平台。...通过智维平台,可以实现数据中心的智能告警、智能巡检、智能容量分析和透明化的客户体验,为全局把控、精细化管理、优化运营成本提供基础,同时也为技术专家实时、异地处理告警,数据中心无人值守创造可能。...图5 腾讯智维平台优势介绍 接入腾讯智维平台后,重庆电信数据中心将在运营方面更加智能化和可视化,如同多了一双可以掌控数据中心运营全局的“眼睛”。
图片 依托于大数据分析技术,为各行业运维管理提供信息化支撑。通过对管理平台进行智能化改造,构建基于云平台的用监控的统一管理平台。...实现“监、管、控”为一体的先进管理目标,为企业业务运维管理积累运行数据。 目前企业在运维管理的过程中仍然经常碰到一些难点,本文华汇数据将为您整理一些运维管理的难点及解决办法。...智能运维管理系统1、设备没有联网,动态数据缺失巡检靠经验,无法实时查看动态数据。被动运维,故障预测无从谈起。...IT综合运营管理平台(ITOM)包含运维监控系统(IM)、用户体验 (UE)、IT管理平台(ITOA)、IT系统后评价平台(PPE)四大系统,帮助府、企业、行业用户解决IT运维问题,提高运维效率,提升服务质量...,降低运维成本。
batch_ops是一个用Python实现的跨平台批量运维小工具。通过它可以执行远程命令/上传下载文件。...特点: 完善的命令行提示,比较优雅的输出 基于yaml的配置文件,实现灵活的对主机或主机组的操作 支持多线程并发执行 批量执行支持忽略某个(些)节点的错误 传输文件实现了类似rsync的机制 跨平台,支持...本文作者 ❈ jkklee,6年运维老司机一枚,擅长高并发及复杂场景下的故障排查和性能优化。目前比较侧重于将自己的运维积累转化成通用易用的各种工具,希望能帮到更多的运维同胞。
内容来源:2018 年 11 月 10 日,SOUG联合创始人周亮在“2018 SOUG年度数据库技术峰会”进行《Oracle AI 性能优化指南探讨》的演讲分享。...将脚本打包成工具使用,比如说自动化运维平台、性能优化平台、监控平台,简单来说就是将所用的脚本归档集中起来。...所谓的不够标准化,指的是我们的机房环境错综复杂,自动化运维很难部署下去。 最后是智能化运维,这是也本次要讲的一个比较重要的主题。...所谓的智能化运维就是让机器去干人的事情,让机器学习人的思想,再通过人工智能的一些手段实现出来。...而智能化运维甚至还在起步阶段,或者说在概念的阶段。 AI性能运维需求 作为一个非甲方公司,我们考虑的智能化性能,必须要兼容所有的数据,这是一个大的前提。不同的数据库的类型,智能化运维需求是不一样的。
领取专属 10元无门槛券
手把手带您无忧上云