本文是腾讯云专家工程师陈政产老师在腾讯云开发者社区技术沙龙深圳站的分享整理,为大家详细介绍腾讯云网络运维平台的建设。 点击视频查看完整分享回放 一、腾讯云网络介绍 ?...二、腾讯云网络运维平台建设 1. 混沌工程 依上文所述,我们因为想要在网络故障前解决网络隐患,从而引入了混沌工程。那么混沌工程是怎么做的,它又是怎么在腾讯云网络上落地的呢?...此外演习对于运维人员也是一个考验,对大家的应急反应能力要求很高。另一个主要区别在于输入,测试一般是来做一些功能印证,输入和输出通常都是可以预知的,而混沌工程更多是一种意外事件的引入。...三、腾讯云网络运维平台未来思考 如上文所述,在网络排障方面,我们针对网络隐患采用了混沌工程的实验;对于网络变更,我们引入了变更体检;在网络监控方面我们已经比较全面和准确的覆盖了现网问题。...比如这个应用没有做好灾备就故障了,事后我要去排查为什么会故障,要去解决这个问题,但是我又想把这个场景复现一下,需要运维团队协助吗?
腾讯云数据库运维已进入了智能时代,当下的关键词是业务价值,云数据库和智能诊断工具会使DBA对业务价值的贡献凸显得更加纯粹。...据林晓斌介绍,历经数十年发展,数据库运维已经度过石器时代、工具时代、专家时代,随着工具的日趋成熟,低价值的工作量得以解放,DBA价值不断提升,数据库运维进入了智能时代。...此前,腾讯云发布的数据库智能管家 DBbrain,这是腾讯云结合前沿人工智能技术推出的一款数据库智能诊断和优化产品。...除了7*24小时的实时诊断优化,DBbrain还具有安全威胁识别、混合云管理数据库和掌上数据库运维等功能。...另外,腾讯云还联合微信团队将DBbrain的监控、异常诊断、优化建议以及数据库管理功能集中在了移动端,运维通过手机便可直接完成。
游戏运维的两极化(高星级/长尾级)、差异化、数量多、变化快等特点决定了任何一、两个平台都不可能承担起所有的运维工作。目前运维同学已经通过iJobs实现了所有运维操作的作业一键化,但这还远远不够。...【对蓝鲸App开发者而言】 蓝鲸提供了开放的开发平台,它允许业务运维人员设计自己或客户最需要的app,并借助蓝鲸为app开发者提供的一系列配套设施,多快好省的产出app服务。...【优秀案例】游戏云App 游戏云是一个实现标准化发布、开区、扩容、缩容、迁移等场景的一站式体验的通用App。全流程打通,一站式完成,提供最佳体验和效率。...二、【运维数据类App】 数据查询、修改类的app相比专业的数据类平台,具备速度更快、使用更简单、体验更好的优点,特别适合于对特定信息的、非常频繁获取和变更的场景,甚至可以是不需要任何查询条件的、进入即所得的体验...还有一种视图分析类app,如DNF掉线智能分析端等,产品人员可以自助的获取掉线分析信息,而之前每次收到这类询问时,运维都要折腾一个钟头。
11月9日,腾讯云开发者社区技术沙龙“高效智能运维”圆满落幕。...本期沙龙围绕运维展开了一场技术盛宴,从AIOps、Serverless DevOps、蓝鲸PaaS平台、K8S等分享关于业务运维的技术实践干货,同时带来腾讯海量业务自研上云实践,推动传统运维向云运维转型...讲师介绍:张戎,腾讯云高级研究员,新加坡国立大学数学博士,毕业后加入腾讯从事机器学习相关工作。目前主要致力于智能运维方向的研究,包括时间序列异常检测,时间序列预测,根因分析,告警收敛等方向。...幻灯片3.PNG 今天讲的内容主要是智能运维方面的一些应用和实践。主要包括智能运维场景描述、单维时间序列分析、多维时间系列分析、近期工作和未来的研究方向。...这样过程中,我们整个智能运维就是将机器学习运用到运维领域,提升整个运维的质量、效率、成本三方面。 智能运维这一块一般来说会形成一个智能运维的学件库。
作者介绍:鲁越,腾讯云数据库架构师团队负责人,主要负责腾讯云数据库MySQL、Redis、Oracle等数据库售前架构、运维、调优等工作,曾就职于网易和尼比鲁。...腾讯云数据库海量运维的经验,主要分为以下三部分: 1.数据库架构师团队的组建 2.自动化运维平台的建设 3.智能海量运维的实践 数据库架构师团队的组建 1组建缘由 由于数据库产品的特殊性和复杂性,我们在平时服务客户的过程中常遇到一些问题...自动化运维平台的建设 要更好地服务客户、提高服务质量,光有数据库架构师团队和售后服务体系是不够的,我们还要有一个非常稳定的自动化运维平台来支持环境。...智能海量运维的实践 经过实践和思考,发现在海量数据运维中,我们的自动化运维平台还不能解决以下这些问题: ·定制化服务。...腾讯云数据库海量运维之道-鲁越(1).pptx 更多前沿数据库技术和案例分享,请关注我们的微信号:腾讯云数据库CDB 腾讯云数据库公众号文章版.jpg
10月20日,腾讯织云 Metis 智能运维学件平台正式对外开源。...1、项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。...在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。...如 Metis 的智能咨询机器人、舆情监控、集群智能负载均衡、数据库参数调优、容量预测。...腾讯织云 Metis 智能运维学件平台之无阈值智能监控学件正式开源 Github 开源地址: https://github.com/Tencent/Metis Metis国内镜像地址: https://
为了更好地推进运维领域技术交流发展,并且让更多的企业能够完成向云计算的转变,腾讯云和织云联合举办“腾讯云运维干货” 系列沙龙。...每期沙龙将会邀请腾讯运维领域专家,分享云计算时代运维的思考和实践,并且为参加沙龙活动的人员提供一定金额的腾讯云代金券,帮助大家0门槛体验腾讯云上各类云产品,而针对企业用户,腾讯云“云+创业”计划更是能给出高达百万的云资扶持...沙龙出品人腾讯运维技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ运维负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深运维专家周小军出席沙龙,并带来精彩的技术分享。...[图片] (腾讯运维技术总监梁定安) 出品人大梁宣布了腾讯云与织云的“6+6运维技术沙龙...《手机QQ 移动网络接入优化之路》技术分享,以手Q运维的故障案例,引出移动互联网时代手Q业务面临的挑战与运维的优化之路,包括业务架构部署优化、海量用户的全局智能调度和运维对移动网络的优化经验,每个技术点
摘要 跨 SDDC 和多云环境从应用到基础架构的智能 IT 运维管理。...其中有三大块内容,一个是自动化部署的vRA,一个是做智能运维的vR Ops,以及做成本分析的vRB,这三块共同支撑起了云管平台。 这期我们重点来介绍vR Ops。...这就需要一个高智能的软件,这个软件就是vR Ops。 通过vR Ops可以对大规模云平台里的机器进行智能的性能分析。...vRealize Operations——云运维智能化 在整个平台中,vRealize Operations实现了性能的管理、容量管理、成本管理、配置管理以及合规性管理。...使用vRA,利用运维分析优化工作负载的初始部署位置。 应用案例及常用使用场景 云平台特点 负载动态变迁,运行环境不固定,状态难以跟踪。 配置变化更快,资产生命周期短,统计分析难。
1 项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。...在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。...如 Metis 的智能咨询机器人、舆情监控、集群智能负载均衡、数据库参数调优、容量预测。...5 Metis 智能运维学件未来开源计划 Metis 将打造一个开放的学件平台,陆续开源时间序列指标预测、主机异常智能分析、MySQL 异常智能分析、硬盘生命周期预测等其它智能运维学件,集合广大用户在智能运维领域的建设经验和实践...腾讯织云 Metis 智能运维学件平台之无阈值智能监控学件正式开源 Github 开源地址: https://github.com/Tencent/Metis (点击文末阅读原文直接访问) 请给 Metis
1 项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。...在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。...织云 Metis 是聚焦在智能运维的应用实践集合,它基于腾讯已有的运维数据,将机器学习领域的分类、聚类、回归、降维等算法和运维场景相结合,旨在通过一系列基于机器学习的算法,对运维数据进行分析、决策,从而实现自动化运维的更高阶段...5 Metis 智能运维学件未来开源计划 Metis 将打造一个开放的学件平台,陆续开源时间序列指标预测、主机异常智能分析、MySQL 异常智能分析、硬盘生命周期预测等其它智能运维学件,集合广大用户在智能运维领域的建设经验和实践...腾讯织云 Metis 智能运维学件平台之无阈值智能监控学件正式开源 Github 开源地址: https://github.com/Tencent/Metis 请给 Metis 一个 Star !
2019年5月8日-10日的DTCC2019年中国数据库大会上,腾讯云数据库专家工程师雷海林首受邀做了主题为《TDSQL智能运维平台-扁鹊架构与实践》的技术分享,以下为大会现场演讲实录。 ?...一、扁鹊的基本介绍 扁鹊系统是TDSQL面向云市场推出的一款针对数据库性能/故障等问题的自动化分析并为用户提供优化/解决方案的产品。 1....扁鹊的需求背景 TDSQL作为腾讯针对金融场景推出的高一致,分布式数据库集群的解决方案目前已覆盖了腾讯90%的支付业务场景,内部有大量团队使用;同时作为腾讯金融云的数据库产品,支持公有云和专有云两种云解决方案...三、智能诊断原理与实践 我们将客户经常咨询的DB问题大体分为三类,可用性问题、性能问题、可靠性问题。 下面我们具体看一下扁鹊是怎样针对这三类问题进行分析并解决的。 1....从我们自身的运维经验来看,由DB故障导致的切换并不常见,更多的情况是由于用户的SQL占用过多的系统资源引发的一些异常状况,主要可以分为慢查询并发和大事务两类,下面我们逐个分析两种行为触发切换的原因 由慢查询并发引起的主备切换
2019年5月8日-10日的DTCC2019年中国数据库大会上,腾讯云数据库专家工程师雷海林首受邀做了主题为《TDSQL智能运维平台-扁鹊架构与实践》的技术分享,以下为大会现场演讲实录。...image.png 关注“腾讯云数据库”官方微信,回复“智能运维”,即可下载本文PPT。...扁鹊的需求背景 TDSQL作为腾讯针对金融场景推出的高一致,分布式数据库集群的解决方案目前已覆盖了腾讯90%的支付业务场景,内部有大量团队使用;同时作为腾讯金融云的数据库产品,支持公有云和专有云两种云解决方案...搜索关注腾讯云数据库官方微信,获取更多数据库技术干货分享,体验移动端一键管理数据库。...关注“腾讯云数据库”官方微信,回复“智能运维”,即可下载本文PPT。 image.png
作者丨周小军,腾讯SNG资深运维工程师,负责社交产品分布式存储的运维及团队管理工作。对互联网网站架构、数据中心、云计算及自动化运维等领域有深入研究和理解。...我今天所分享的主题就是深入百亿次红包大活动的背后,解析腾讯运维的方法体系,了解织云平台如何帮助运维实现大活动高效运维,如何减少运维人海战术。...3.2.2 一键扩容 [图片] 在我们强大的织云自动化运维平台支撑下,我们的业务模块都是一键式扩容模式,也称一键上云。一个模块下的上百台设备,整个扩容流程跑完只消耗5分钟时间。...织云高效的实践是,它是以运维标准化为基石,以 CMDB 为核心的自动化运维平台。通过 Web 界面的一键式上云,基于业务原子任务和流程引擎,形成一个完整的运维流程,最后并行执行。...相关文章 腾讯云运维干货沙龙-海量运维实践大曝光 (一) 腾讯云运维干货沙龙-海量运维实践大曝光 (二) 沙龙PPT下载地址: https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3
【腾讯】蓝鲸智云运维平台单机版本部署实践 【蓝鲸智云社区版】是腾讯对外开放的一套支持私有化部署、永久免费的运维解决方案。...该版本包含CMDB管理、作业脚本执行、流程编排、日志检索、监控告警、 故障自愈、微服务容器管理以及持续集成(CI)等能力,助力企业技术人员快速构建一体化运维支撑以及研发效能提升的能力,推动企业数字化转型
作者丨郭智文:腾讯高级工程师,手机QQ运维负责人。...12月16日,首期沙龙“海量运维实践大曝光”在腾讯大厦圆满举行。...沙龙出品人腾讯运维技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ运维负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深运维专家周小军出席沙龙,并带来精彩的技术分享。...业务运维同事通过腾讯网络中心联系到重庆联通网络负责人,经过多轮沟之后,确认确实是运营商在凌晨时段割接网络引起,运营商与厂商经过两次调整最后故障才得以解决。...总结 相关文章 腾讯云运维干货沙龙-海量运维实践大曝光 (二) 腾讯云运维干货沙龙-海量运维实践大曝光 (三) 沙龙PPT下载地址: https://share.weiyun.com
2019年5月8日-10日的DTCC2019年中国数据库大会上,腾讯云数据库专家工程师雷海林首受邀做了主题为《TDSQL智能运维平台-扁鹊架构与实践》的技术分享,以下为大会现场演讲实录。...雷海林在大会现场 一、扁鹊的基本介绍 扁鹊系统是TDSQL面向云市场推出的一款针对数据库性能/故障等问题的自动化分析并为用户提供优化/解决方案的产品。 1....扁鹊的需求背景 TDSQL作为腾讯针对金融场景推出的高一致,分布式数据库集群的解决方案目前已覆盖了腾讯90%的支付业务场景,内部有大量团队使用;同时作为腾讯金融云的数据库产品,支持公有云和专有云两种云解决方案...从我们自身的运维经验来看,由DB故障导致的切换并不常见,更多的情况是由于用户的SQL占用过多的系统资源引发的一些异常状况,主要可以分为慢查询并发和大事务两类,下面我们逐个分析两种行为触发切换的原因 由慢查询并发引起的主备切换...受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。
作者丨魏旸:腾讯高级工程师,具有15年运维经验的专家。负责QQ空间、微云、QQ空间相册等的运维工作。 12月16日,首期沙龙“海量运维实践大曝光”在腾讯大厦圆满举行。...沙龙出品人腾讯运维技术总监、复旦大学客座讲师、DevOps专家梁定安,讲师腾讯手机QQ运维负责人郭智文,腾讯高级工程师魏旸,腾讯SNG资深运维专家周小军出席沙龙,并带来精彩的技术分享。...您也可以在腾讯织云公众号下载本次演讲PPT。 背景 腾讯社交业务包括QQ、QQ空间、QQ相册等核心业务。核心业务按深圳、天津和上海三地分布,各支撑华南、华中、华东、华北、西北、西南等大区的用户访问。...拿前一段时间腾讯深圳某个机房光纤被挖断的案例来讲,业务碰到的问题: 机房爆炸了,会影响多少用户? 是否需要调度? 怎么调度? 天津机房覆盖范围的用户调度到哪里?调多少? 怎么调度?...[图片] [图片] 相关文章 腾讯云运维干货沙龙-海量运维实践大曝光 (一) 腾讯云运维干货沙龙-海量运维实践大曝光 (三) 沙龙PPT下载地址: https://share.weiyun.com/5c406a57164ed4cf7e248160aebf74c3
本篇将主要描述在腾讯云平台如何构建Ansible自动化运维管理工具平台/环境,如何批量管理云上服务器,批量分发配置等设置,同时这里将引入某客户真实的案例进行整体的阐述。...主流自动化运维管理工具Puppet:基于Ruby开发,采用C/S架构,扩展性强,基于SSL认证SaltStack:基于Python开发,采用C/S架构,相对于puppet更轻量级,配置语法采用YMAL,...Ansible环境部署这里为了更直观看到效果,采用3台centos7.6 + 1台ubuntu进行自动运维环境的构建,如果需要覆盖更多被管主机,则通过下面的方法扩展即可。2.1....案例说明近期某客户基于腾讯云镜(主机安全)进行等保安全基线扫描,发现有上百台云服务器的安全基线不符合客户安全部门的安全需求,需要进行整改,涉及的机器量也比较大,而客户侧人员较少,日常运维常用采用简单脚本方式进行云上运维管理...一开始比较倾向云上的产品进行批量或自动修复,发现比较难找到合适的产品完全吻合,因此这里推荐采用Ansible自动化运维的方式进行批量修复云服务器的安全隐患问题,这里简单列举几项高危风险示例: 序号风险项威胁等级描述处理建议
活动信息 收获多多 收获与腾讯、行业技术大咖面对面交流机会 收获机器学习算法在运维领域的应用经验 收获腾讯数字化转型中,海量业务上云实践经验 收获研发运维技术PaaS体系实践 收获云运维方向技术趋势解读...活动指南 时间 2019年11月09日(周六) 13:30-18:00 地点 腾讯大厦2楼多功能厅 (广东省深圳市南山区深南大道10000号) 公共交通 1,乘坐地铁1号线,深大地铁站下车,步行约1.3...公里 2,乘坐19/21/36/42/70/79/113/369等,在深大北门2公交站下车,步行约500米 技术交流 扫描上方二维码添加小助手微信,回复“运维” 可提前进群与讲师及参会嘉宾互动交流... 关注「云加社区」公众号,回复“运维”,立刻报名!...-------------- END -------------- 关注云加社区,回复 3 加读者群 点在看,让更多人看到!
领取专属 10元无门槛券
手把手带您无忧上云