引言 DevOps是开发、运维和质量保证三个团队之间的沟通、协作和集成所采用的流程、方法和体系的一个集合,一个方法论。 在织云对外产品化过程中,我们结合自身的现状,痛点,迈出了"织云 DevOps"能力建设的第一步.这里主要从开发,测试,运维经常协同的阶段:持续集成(CI),持续运营两个维度来分享我们的经历及对DevOps的思考及实践。 织云DevOps介绍 织云 DevOps, 是织云协同开发,测试,运维,运营的一个平台和能力, 将协同的过程明确化,自助化,自动化, 提升版本的迭代效率与质量。织
织云 Lite 是一款轻量型服务管理平台,提供标准化的应用打包操作,可连接持续集成系统,完成线上程序分发,轻松实现进程管理。
腾讯内部一些基础服务比如统一鉴权登录、社交关系链、支付被内部很多其他业务调用,调用方往往横跨几个事业群,几十个部门,有数百个模块,上万台设备。
织云 Lite V1.2 正式发布 新增批量命令功能 兼容 SaltStack 连接方式 来吧,加入织云 Lite 让运维变得简单 ▼▼▼▼▼ 立即下载 扫码进入 织云 Lite V1.2 新特性
高可用系统的挑战 高可用系统是运维界老生常谈的话题之一。现在很多企业都要求平均无故障时间每年五个 9 的服务可用性。 一方面系统单点是高可用最大的天敌,这不得不在系统设计时增加“冗余”,容易造成资源浪
随着业务发展,设备越来越多,各业务机器运行各自的功能程序,团队成员也在持续增加,开发、测试、运维等不同团队的同事各司其职。多团队合作模式带来的问题就是运营事故的发生几率提高。
织云Lite 是一款轻量型服务管理平台,聚焦织云核心能力包管理,提供标准化的应用打包操作,可连接持续集成系统,完成线上程序分发,轻松实现进程管理。
背景 当下,业界越来越多公司在项目架构设计时,会采用微服务架构。微服务架构,可以让我们的产品有更好的扩展性,更好的伸缩性;但同时也会带来微服务的一系列问题,比如微服务接口怎样规范管理?怎样在多团队协作
随着云计算的不断发展,从最初的互联网初创企业,到现在的政府机关、金融和证券等行业,都在往云上迁移。在建设运维平台的过程中,大部分企业对于自动化运维能力非常重视,期望平台能管理好运维的批量作业以及日常运
别焦虑,为了让广大运维同仁能够尽快步入 AIOps 的技术殿堂,降低实施 AIOps 的技术门槛,腾讯织云团队即将开源运维学件!( ps: 学件由南京大学周志华教授提出,运维学件由腾讯 SNG 赵建春先生提出并率先开源,云计算开源产业联盟和高效运维社区荣誉共同推广。)
10月20日,腾讯织云 Metis 智能运维学件平台正式对外开源。Metis 是 AIOps(Algorithmic IT Operations),即智能运维领域的首个开源产品,它是聚焦在智能运维的应用实践集合,基于腾讯已有的运维数据,将机器学习领域的分类、聚类、回归、降维等算法和运维场景相结合,旨在通过一系列基于机器学习的算法,对运维数据进行分析、决策,从而实现自动化运维的更高阶段。
“Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。 学件 = 模型 + 规约,具有可重用、可演进、可了解的特性。在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。 随着互联网业务的急剧膨胀和服务类型的多样化发展,人为指定规则的不足之处逐渐凸显,促使近两年来智能运维领域的高速发展。智能运维主张通过算法从海量运维数据中学习摸索规则,逐步降低对人指定规则的依赖,进而减少人为失误。 织云 Metis 是聚焦在智能运维的应用实践集合,它基于腾讯已有的运维数据,将机器学习领域的分类、聚类、回归、降维等算法和运维场景相结合,旨在通过一系列基于机器学习的算法,对运维数据进行分析、决策,从而实现自动化运维的更高阶段。
1 项目描述 “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。 学件 = 模型 + 规约,具有可重用、可演进、可了解的特性。在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。 随着互联网业务的急剧膨胀和服务类型的多样化发展,人为指定规则的不足之处逐渐凸显,促使近两年来智能运维领域的高速发展。智能
10月20日,腾讯织云 Metis 智能运维学件平台在 OSCAR 开源先锋日上宣布,正式对外开源。Metis 是AIOps(Algorithmic IT Operations),即智能运维领域的首个开源产品。智能运维主张通过算法从海量运维数据中学习摸索规则,逐步降低对人指定规则的依赖,进而减少人为失误。
对,没错,织云又要发布新产品。 作为企业智能运维门户,业界早已关注织云的智能运维体系。我们很荣幸地宣布织云 Metis 智能运维体系正式发布。自此,织云家族已发布:织云企业版,织云社区版(Lite),
织云 Lite V 1.1 发布 4 月14 日,织云社区版(Lite)在GOPS全球运维大会上正式发布第一版:织云 V 1.0。在过去的一个多月,我们在论坛收到了来自不同用户许多反馈,同时,织云Lite 本着精益求精的原则,致力给大家带来一款轻量、简单、体验好的运维工具,发布了 V1.1 版本。本次版本更新在 V 1.0 的基础上,带来如下特性。(点击了解织云 Lite。以及 织云 Lite 核心能力:包管理 ) 新版本特性 1. 新增多私钥管理功能,针对不同分组的设备,可绑定不同的 private
作为企业智能运维门户,业界早已关注织云的智能运维体系。我们很荣幸地宣布织云 Metis 智能运维体系正式发布。
ASR 作为机器学习的基础应用之一,已成为众多业务支撑的基础能力,在录音质检、音频字幕、会议转写、语音输入等场景中发挥越来越大的作用。腾讯云 ASR 作为业界领先的语音识别服务提供商,为开发者提供语音转文字服务的最佳体验,具备识别准确率高、接入便捷、性能稳定等特点。 基于腾讯的多个 AI 实验室的模型赋能,腾讯云 ASR 团队接入和开发了多种类型识别服务,如一句话识别、录音识别、实时语音识别等,业务覆盖通用、金融、医疗、游戏等多种场景。此外,工程方面,团队在整体系统的复用性、接口性能、服务稳定性上也做了大量
团队简介: 腾讯SNG社交平台业务运维团队,负责Qzone、微云、QQ相册、天天P图、优图等产品的技术运营工作。致力于服务质量优化、服务保障、自动化运维体系建设等工作。经历过农牧场、红包、"军装"P图等多次活动保障。 前言 壹 近几天人民日报+腾讯云联合运营“军装照”活动,想必已经刷爆了各位的朋友圈。在这场营销盛宴的背后,伴随了又一次海量运维能力的showtime:4000台设备,峰值24G带宽,5次运维自动扩容。 这类利用社交关系引爆的运营事件对腾讯SNG的运维团队早已不是什么新鲜事,从
小明所在公司业务发展迅速,设备数量从十多台增加到几十上百台,业务架构也从原先简单的前端、后台,发展出十几个逻辑分支。
ASR 作为机器学习的基础应用之一,已成为众多业务支撑的基础能力,在录音质检、音频字幕、会议转写、语音输入等场景中发挥越来越大的作用。腾讯云 ASR 作为业界领先的语音识别服务提供商,为开发者提供语音转文字服务的最佳体验,具备识别准确率高、接入便捷、性能稳定等特点。
本文介绍了如何通过自动化运维平台实现IaaS层资源的统一管理,并针对金融云场景提供了详细的解决方案。
9月14-15日,GOPS全球运维大会上海站圆满举行,为期两天的运维盛宴,为各位运维人带来了相互交流和学习的绝佳平台。腾讯运维双雄专场也不例外,腾讯社交网络运营部致力于为行业分享前沿运维经验,9月15日现场干货满满,人满为患。下面就让开心到飞起的小编领大家一起去看现场盛况。
当我们有了能可靠地对大数据进行采集、处理和存储的能力后,我们可以将这些能力用于哪些实际业务场景,并让数据产生价值呢?
腾讯织云通过对长久以来的运维工作总结,以及根据对不同客户提出的多样化需求场景整理,在容器功能方面,经过不断的锤炼打造,现提供三套产品方案,以应对不同的业务场景使用需求。 Merge版 通过镜像发布更新
某天下午TIM官网突然无法访问(502错误),官网是纯静态页面,挂在nginx服务器下,我们下午也没有做发布。那么,问题出现在什么地方呢?下面就讲讲我定位、解决问题的思路及步骤,具体如下:
平时一本正经,突然画风清奇 织云值此全民剁手狂欢佳节之际 特地为攻城狮们送上一份通过采访 精心挑选的书单 敬请笑纳 《代码的未来》 “站在摩尔定律的尽头,重新理解编程的本质”。 Ruby 之父松本行弘结合当下时代背景和计算机领域的发展情况,对多种编程语言的进行深入分析和展望。不论你现在用的是什么语言或者做的是什么业务的开发,相信这本书都能帮你拓宽视野,带来新的启发。 -- 腾讯高级工程师 织云作业平台负责人:陈镇杭 《The Practice of Programming》 (程序设计实践
本文将介绍织云是如何建设和使用命令通道解决混合云的服务器管理问题。
6月29日,DevOps国际峰会在北京盛大开幕。在腾讯DevOps专场,多位腾讯专家以腾讯工蜂、腾讯Hub、腾讯织云等产品为例,分别从研发管理、持续集成、部署运维三个角度介绍了腾讯DevOps全链路解
▼织云Lite致力于打造持续交付理念落地的最佳实践,让运维变得简单。目前 V1.3 正式发布,欢迎大家文末下载。新版本最新特性: 1. 新增LDAP登录认证,可通过配置文件切换认证方式。 2. 设备管
作者:梁定安,腾讯织云负责人,目前就职于腾讯社交网络运营部,任运维技术总监,开放运维联盟委员,腾讯云布道师,腾讯课堂运维讲师,EXIN DevOps Master讲师,凤凰项目沙盘教练,复旦大学客座讲师。 导语:8月23日,腾讯 云+未来峰会在北京盛大开幕。在开发者专场,腾讯织云负责人梁定安为大家解读了腾讯DevOps流水线的系统组成,以及如何在平台的实践中实现持续部署能力,帮助企业创造更大的价值。 前言 国家的“互联网+”战略开启了一个企业业务与互联网相结合的新业务形态,有越来越多的企业将自己的业务以
前言 腾讯是新兴互联网企业的代表,其研发技术栈非常多样性。在海量用户的前提下,腾讯是如何保持研发的高效敏捷,将研发,集成发布,以及持续运维三者相结合,形成DevOps全链路的解决方案。上周末在腾讯滨海大厦举行的 DevOps 技术实践沙龙就由各位专家和大家一起分享了其中的经验。 腾讯工蜂 以Git为基础,是腾讯集团新一代研发管理平台,不仅支持先进的研发理念,还适应了大型企业环境,支撑了如微信等腾讯大量关键业务的研发活动。 Tencent Hub,是腾讯云使用新一代容器思想打造的,基于云的持续集成和
6月29日,DevOps国际峰会在北京盛大开幕。在腾讯DevOps专场,多位腾讯专家以腾讯工蜂、腾讯Hub、腾讯织云等产品为例,分别从研发管理、持续集成、部署运维三个角度介绍了腾讯DevOps全链路解决方案,帮助大型企业DevOps在全链路上提升效率,创造更大价值。 1 腾讯是新兴互联网企业的代表,它的研发技术栈,具有多种类型、风格迥异等多样性特点:从项目的规模上看,腾讯同时具备大中小各种规模的产品;从项目周期来看,同时拥有长中短周期的业务单元;从组织结构上看,腾讯的研发管理同时具有扁平和去中心化和严格管理
DevOps可以让人工智能(AI)、大数据(Bigdata)、云计算(Cloud)更加高效地落地,越来越多的企业和团队在践行DevOps。腾讯云DevOps产品总监秦俊表示,腾讯云将陆续开放TAPD(腾讯敏捷研发平台)、TGit(腾讯Git源代码管理)、CCI(持续集成服务)、SODA(游戏持续集成)、织云(云端运维)等DevOps相关产品套件,帮助开发者提升开发时间价值。 [1503559463218_2119_1503559463422.jpg] 腾讯云DevOps产品总监秦俊 TAPD是长期服务于腾讯
本文主要介绍了如何基于监控告警实现业务闭环,从四个大方面进行了展开:1)基于业务影响的监控告警,2)基于故障收敛的监控告警,3)基于运维流程的监控告警,4)基于质量度量的监控告警。在本文中,作者还介绍了在腾讯云平台上如何利用监控数据实现故障定位和故障恢复,以及如何通过自动化流程实现故障收敛和故障自愈。
前言 近年,人工智能和机器学习不断发展,传统的IT运维,也从自动化运维逐渐升级到未来的智能化运维时代。得益于此,AIOps应运而生,也就是基于算法的IT运维(Algorithmic IT Operations),帮助大量运用人脑决策和手工操作的运维向着智能运维的方向前进,并且持续为企业带来更加先进的业务能力。那么 AI 技术到底如何应用到企业的实际运维当中呢? 此次沙龙旨在分享 AIOps 理念与实践经验,促进 AIOps 爱好者们相互交流和学习。希望让对 AIOps 感兴趣的人们有机会相互交流和共同成长。
持续交付是DevOps的核心工程实践,持续交付流水线驱动着DevOps的落地,昨天在云+峰会的开发者专场,腾讯跟大家揭开了DevOps流水线平台的神秘面纱。同时也让我们看看织云如何在其中高标准地实现持
作者丨李春晓:腾讯高级工程师,目前为腾讯SNG社交网络运营部社交平台业务运维组员工。 海量业务的挑战 互联网业务讲究“极致、口碑、快”,经历过长时间的演进,腾讯SNG社交平台产品用户访问量已经达到亿级、十亿级, 我们的业务监控、业务分析等数据也显示:业务前、后端成功率都已经达到99%, 99.9%以上。 但随之带来的挑战也是显而易见的,例如: 1. 长时间历史的发展,导致后端架构复杂,功能模块众多、监控系统多、告警量大,如何简化,让告警简单、有效? 2. 关键业务成功率, 0.01%的指标告警都可能引起成
作者丨李春晓:腾讯高级工程师,目前为腾讯SNG社交网络运营部社交平台业务运维组员工。 海量业务的挑战 互联网业务讲究“极致、口碑、快”,经历过长时间的演进,腾讯SNG社交平台产品用户访问量已经达到亿级、十亿级, 我们的业务监控、业务分析等数据也显示:业务前、后端成功率都已经达到99%, 99.9%以上。 但随之带来的挑战也是显而易见的,例如: 1.长时间历史的发展,导致后端架构复杂,功能模块众多、监控系统多、告警量大,如何简化,让告警简单、有效? 2.关键业务成功率, 0.01%的指标告警都可能引起成千、上
在海量运营方法论的指导下,运维团队构建了体系化的运维能力,为众多产品保驾护航。
导言 很高兴参与DevOps时代社区的拆书联盟第一季活动,有幸能与几位DevOps大牛一起解读《DevOps Handbook》一书,这本书作者牛,内容也很牛,就连著名的培训机构把这本书作为DevOp
作者简介:梁定安,腾讯织云负责人,目前就职于腾讯社交网络运营部,开放运维联盟委员,腾讯云布道师,腾讯课堂运维讲师,EXIN DevOps Master讲师,凤凰项目沙盘教练,复旦大学客座讲师。* 请原
本文介绍了AI浪潮下的高效运维思考及实践,作者从AI与运维的结合点、面临的挑战、如何解决问题、腾讯SNG的智能化运维实践以及未来展望五个方面进行了详细阐述。
听说4月14日腾讯社交网络运营部八位大咖倾巢出动,齐聚深圳圣淘沙酒店。所谓何事? 当然是GOPS全球运维大会--腾讯运维体系专场了,几位老师给大家带来了一场思想盛宴。活动圆满结束!~ 下面跟着小编来去看看活动现场盛况,感受几位讲师的风(yan)采(zhi)吧。 首先,让我们隆重地请出本次专场活动的出品人兼主持人--腾讯运维总监聂鑫,从开发到运维,伴随社交网络运营部成长的十年,负责过腾讯社交产品所有业务运维工作,见证了整个SNG运维体系的建立,发展和成熟过程。有这么重量级的大咖加持,咱们的专场能不诚
领取专属 10元无门槛券
手把手带您无忧上云