作者:何金胜&张加浪,腾讯云云监控高级工程师 前言 知名游戏公司云资源使用了腾讯云、AWS 和自研 IDC,业务覆盖了国内和海外。云上资源包括了计算资源服务器、存储类的包括 MySQL、Redis、S3 等、大数据处理(EMR)以及网络资源等。业务服务主要通过 Golang与 PHP 语言开发,服务使用微服务框架,由多个游戏工作室共同开发完成。如此大的业务,如何实现高可用的一体化监控并降低云原生 Prometheus 的监控成本呢? 客户现状和痛点 经内部规划后,该游戏公司决定基于自建的 Prometh
谢莹莹 腾讯云监控产品经理,硕士毕业于哈尔滨工业大学。目前主要负责腾讯云 Prometheus 监控服务和 Grafana 可视化服务的产品工作,对 to B 商业化产品领域有着丰富的经验。 背景 随着云原生的快速发展,Prometheus 已成为越来越多企业监控的首选解决方案,然而自建 Prometheus 对企业的运维人力要求高,也容易因为性能问题出现后期维护困难的情况。在此背景下,使用云上托管 Prometheus 已成为大多数企业的最优选择。 腾讯云 Prometheus 监控服务(TMP),
腾讯云云监控 x Grafana 腾讯云于 4 月 20 日宣布与开源数据可视化平台 Grafana 的 Grafana Labs 合作,为全球云用户提供腾讯云 Grafana 云监控应用程序插件。用户可通过此插件,在简单易用的平台上快速监控与整合指标和数据。 腾讯云平台将整合 Grafana 系统,让用户可通过腾讯云 API Key,自定义仪表板访问与监控数据,并可安全地共享访问权限。同时,客户也可选择在 Grafana 开源工具和企业用 Grafana Enterprise 中,在客户的 Gra
腾讯云监控,可以覆盖1,2场景, 我们只需根据业务需求配置告警策略即可。场景3-Saas层监控可以分为服务状态监控、异常日志监控和接口监控。
背景 随着 2015 年由谷歌牵头成立 CNCF (云原生计算基金会),云原生的概念逐步深入人心。云原生应用的三大特征:容器化封装,动态管理,面向微服务。 以一个典型的电商服务关键路径(登录 -> 浏览详情页 -> 下单)为例: 图中所有的服务和组件都运行在腾讯云上。 1. 下单关键路径上 3 个服务均为容器化服务,且通过微服务架构实现。 2. 服务均运行在 TKE (腾讯云容器服务) 上。 针对图中的云原生服务,CNCF (云原生计算基金会) 推荐的监控治理方案是可观测性建设。其三大支柱为:指标,
Kubernetes 作为容器编排领域的霸主,越来越多开发者选择大规模使用 Kubernetes 来部署、管理服务,腾讯云容器服务TKE一直以来是腾讯云上的明星产品。在用户购买TKE 服务之后,监控所购买的K8s产品性能成为了必须,而 Prometheus 因其强大的指标采集能力、活跃的生态和灵活的 PromSQL 成为了不少研发和运维人员监控 K8s 的第一选择。 随着业务增长,开源Prometheus往往会出现扩展性以及性能的瓶颈,因此腾讯云 Prometheus 托管服务成为了不少用户的选择。腾讯云
作者:张加浪 腾讯云监控高级工程师 背景 十年一次的人口普查是涉及全国十几亿人的重大事情,每次人口普查都是对国人的一次梳理,国家和人民都十分重视。随着技术的不断创新,人口普查的普查方式也在不断升级,从人工加算盘到人工加老式计算机,再到卫星传感。 在第七次全国人口普查 (以下简称 “七人普”) 的到来之际,国家决定通过 “电子化方式普查登记,腾讯提供技术支持” 更快更准的普查方式,即实行云端普查登记。 七人普主要通过小程序方式进行制证、普查员注册、人口普查等,700 万的普查员,十几亿的普查对象,服务必
手里有虚拟主机和云服务器的站长们,为了保证时刻了解服务器运行状态,使用实时监控服务器软件可以做到这一点,也就不需要我们自己 24 小时监控了。因为魏艾斯博客就放在腾讯云的缘故,所以今天来说一下腾讯云云监控实时监控服务器稳定性和运行状态。 服务器运行监控方面可供选择的工具软件有很多,不过第三方服务商提供的监控工具功能比较简单。如今阿里云、腾讯云等主流的云主机商也都提供免费的云监控服务。 以下是介绍过的第三方服务器安全监控工具: 云锁服务器端及客户端安装及简单使用体验教程 Linux 安全软件-悬镜管家安装教程
背景 腾讯云容器服务TKE从2016年提供服务至今,已服务成千上万企业构建其容器化平台, 一方面,腾讯云容器团队在提供容器服务时积累并完善了一套万级K8s集群的etcd管理平台,用于支撑腾讯云容器产品稳定运行,该平台同时也支撑了腾讯内部业务如云监控,api网关,欢乐游戏等,另一方面,我们积极参与etcd社区,将我们大规模实践过程中遇到的问题和解决方案,反馈和贡献给社区,是社区2020年最活跃的贡献团队之一。 容器团队在多次客户访谈中了解到,很多客户不想自己运维etcd,期望能够使用腾讯云容器服务内部et
包括:新增支持从告警消息中链接跳转到对应实例、优化告警消息中告警对象的显示、支持告警内容换行、优化 Grafana 告警通道的交互和校验(提高客户配置成功率)、新增支持更多云产品监控等。
杨濡溪,腾讯云后台开发工程师,目前主要负责腾讯云 Prometheus 监控服务、TKE集群巡检等技术研发工作。 杨鹏,腾讯云后台开发工程师,曾负责腾讯云专有云后台技术研发工作,目前主要负责腾讯云 Prometheus 监控服务、TKE集群后台技术研发工作。 引言 Prometheus 作为云原生时代最流行的监控组件,已然成为社区监控事实上的标准,但是在多集群,大集群等场景下,只使用 Prometheus 是远远不够的;单集群场景下我们一般主要关注指标采集、存储、告警、可视化等基础监控能力,随着集群规模的
简介 前言感谢各位用户在云监控用户交流群中的积极发言,踊跃提问,感谢大家的支持,在此把 Grafana 插件和 Prometheus 监控服务相关的一些问题整理如下。 Grafana 插件 腾讯云于 4 月 20 日宣布与开源数据可视化平台 Grafana 的 Grafana Labs 合作,为全球云用户提供腾讯云 Grafana 云监控应用程序插件。用户可通过此插件,在简单易用的平台上快速监控与整合指标和数据。目前已经支持 30+ 款腾讯云基础产品的接入展示。点击此处了解 Grafana 插件 Q:se
谢莹莹 腾讯云监控产品经理,硕士毕业于哈尔滨工业大学。目前主要负责腾讯云 Prometheus 监控服务和 Grafana 可视化服务的产品工作,对 to B 商业化产品领域有着丰富的经验。 前言 如今,以 Kubernetes 为代表的云原生技术正在吞噬世界。随着 Kubernetes 成为容器编排领域的事实标准,Prometheus 也击败了度量领域以 Zabbix 为代表的众多前辈,成为云原生时代容器监控的事实标准。 众所周知,Prometheus 是容器场景的最佳监控工具,但自建 Prometheu
在云计算领域,容器和函数计算技术的迅猛发展正引领着企业架构的新变革。尤其是在2023年,随着技术的成熟和应用场景的拓展,腾讯云发布的《2023腾讯云容器和函数计算技术实践精选集》为我们提供了一窗口,深入了解这一领域的最新进展和最佳实践。本文旨在深度解读该文档,探讨其中的核心技术价值、实用性案例以及对未来技术趋势的启示。
腾讯云容器服务(Tencent Kubernetes Engine,TKE)是高度可扩展的高性能容器管理服务,您可以在托管的云服务器实例集群上轻松运行应用程序。使用该服务,您将无需安装、运维、扩展您的集群管理基础设施,只需进行简单的 API 调用,便可启动和停止 Docker 应用程序,查询集群的完整状态,以及使用各种云服务。您可以根据资源需求和可用性要求在集群中安排容器的置放,满足业务或应用程序的特定要求。
本文旨在通过使用腾讯云的“自定义监控”服务来自行实现对 GPU 服务器的 GPU 使用率的监控。
2020年11月 VOL:07 腾小云告诉你最前线的产品新特性, 总有一款让你心动~ 云说新品 容器产品新特性 11月上新 腾讯云边缘服务TKE@Edge 从中心云管理边缘云资源的容器系统 边缘容器服务(Tencent Kubernetes Engine for Edge,简称 TKE Edge)是腾讯云容器服务推出的用于从中心云管理边缘云资源的容器系统。 1. 上线边缘 DNS 方案,该方案将不再占用节点 53 端口。 2. 节点安装脚本支持以下两个功能参数:
前言 近日,Dashboard 发布了新版本,本次发布的均为超超超实用的功能,是习惯通过标签管理 CVM 实例、喜欢通过升 / 降序查看某图表 Top 部分绑定实例的 曲线、以及使用腾讯云容器服务用户的福音。为什么是福音?这次发布前,这几大场景的使用感有多一言难尽,看看 Dashboard 产品经理面对我们原始需求池瑟瑟发抖的样子就知道了。但是云监控团队真的有把用户的鞭笞刻在心里,这次终于可以跟用户说:我们做到啦!~ What's New 前言部分提到的本次上新的三大亮点: 01 支持标签功能 Das
腾讯云服务网格Tencent Cloud Mesh,是一致、可靠、透明的云原生服务通信网络管控基础平台。基于Istio,TCM与腾讯云基础设施原生集成,提供云原生服务发现、流量管控和端到端可观测管理环境,全面覆盖应用程序的南北向与东西向通信连接,支撑业务轻松打造灵活的分布式高可用架构,高效便捷的变更发布能力和安全可控的服务通信网络。
本文给大家带来 Pulsar 在可观测性方向的重要能力——支持接入 Prometheus 监控。
2021年8月 VOL:16 腾小云告诉你最前线的产品新特性 总有一款让你心动~ 云说新品 容器产品新特性 8月上新 腾讯云边缘服务TKE@Edge 从中心云管理边缘云资源的容器系统 边缘容器服务(Tencent Kubernetes Engine for Edge,简称 TKE Edge)是腾讯云容器服务推出的用于从中心云管理边缘云资源的容器系统。 ServiceGroup功能增强:DeploymentGrid 支持查看和管理实例,支持对分布在不同地域的应用
5 月 18 日,腾讯云举办了 Techo Day 腾讯技术开放日,以「开箱吧!腾讯云」为栏目,对外发布和升级了腾讯自研的一系列云原生产品和工具。其中,腾讯云开发者产品中心总经理刘毅围绕“开发敏捷高效”这一话题,分享了关于“云原生应用开发与运维新范式”的主题演讲。本次演讲将为大家分享,腾讯云是如何通过云上开发运维协作能力,支持多职能团队流畅协作,助力企业加速数字化敏捷转型,提升云原生架构的运维效率,受益云原生。
2020年10月 VOL:06 腾小云诚邀各位用户反馈 您的心声,我们在倾听~ 用户调研 腾讯云容器团队最新产品弹性容器服务 EKS 已全量开放,为广大客户提供安全、稳定、弹性、经济的无服务器 Kubernetes 服务,进一步降低客户将业务容器上云的门槛。 容器团队始终在持续优化产品功能特性,全方面支持客户拥抱云原生,希望为客户提供强大完善的产品功能和简单易用的使用体验,以及丰富的最佳实践及解决方案指导,诚邀各位客户反馈容器上云过程中遇到的问题,产品侧将认真倾听
应用性能观测 1. 腾讯云应用性能观测(APM)与数据库智能管家(DBbrain)深度融合。 腾讯云应用性能观测(APM)联合数据库智能管家(DBbrain),对数据库和链路监控进行深度碰撞和融合,在国内云厂商中,首个提供了数据库自治云服务与应用性能服务关联分析能力。实现了从应用到数据库内部的全面洞察,应用运行情况与数据库运行情况的关联,帮助用户更高效地进行故障排查。 2. 应用详情页-JVM 监控,支持了更丰富的线程数量展示。 使用 Skywalking 及 Opentelementry 探针上报的用户
腾讯云云原生监控服务(Tencent Prometheus Service)是分布式的监控部署方案,提供更加易用的的监控配置流程和适配大规模监控场景的高性能架构。
腾讯云监控,作为云产品的监控手段,不知道有多少开发者没有设置,然后突然有一天发现自己的 redis 满了,或者是 kafka 的堆积的数量过多的时候,造成事故。再来补救。
因为系统数据量持续性增大,腾讯云的MySQL已经达到瓶颈,无法进行升级操作,如果自己搭建一个分库分表系统,速度和可靠性上面都会很差,综合各方面考虑,最后决定采用阿里云的PolarDB-X分布式数据库。
腾讯云容器服务支持节点升级,提供将一批集群的节点从较低版本升级到高版本的功能。通过节点滚动重装升级,能够帮助用户快速批量升级集群的节点。 【适用场景】:适用于升级 kubernetes版本过低、 集群内的节点未做相关自定义配置的集群, 节点滚动重装升级后自定义的配置将会不生效。 【解决痛点】:提供产品化升级集群的kubernetes版本的基本功能。
腾讯云运维工程师认证的考试经验分享来啦!腾讯云运维工程师认证(TCA)适用于从事运维腾讯云产品和服务的人员,负责在云上部署业务的技术人员,保障云上业务正常稳定运行的维护人员。通过该门认证可以很好的证明自己的云产品使用和运维能力。本篇考试攻略将为您介绍一下,云运维TCA认证需要学习和掌握的内容。
腾讯互动娱乐事业群(IEG)下的腾讯游戏是全球领先的游戏开发和运营机构,也是国内最大的网络游戏社区。在游戏上云的道路上,腾讯互娱一直在不断探索、不断突破。2021 年 3 月腾讯互娱对国际业务推出了在线游戏开发平台 PGOS,PGOS 提供:
云监控(Cloud Monitor,CM),收集并通过图表展示腾讯云云产品自助上报的各项监控指标和用户自定义配置上报的监控指标,以及针对指标设置告警。为您提供立体化云产品数据监控、智能化数据分析、实时化异常告警和个性化数据报表配置,让您实时、精准掌控业务和各个云产品健康状况。
领导凌晨3点才看到这通知,表示很慌,给我发微信,我没有回,他觉得完了,我“死”了,然后他大概给我打了20多个电话吧,终于在他决定报警之前,把我给叫醒了,开口第一句话居然是“大半夜的,你怎么还睡觉了呢”
| 导语 :你是否也曾被“快点儿吧,等到花都谢了”洗脑,为又爱又恨的欢乐豆决战到天亮,为何欢乐斗地主能风靡全国,经久不衰,还一直能平稳流畅运行?其背后究竟有哪些运维小妙招?可让整体研运效率显著提升,节省30%+人力成本?..... 作者简介:Leehom,腾讯游戏专家开发工程师,负责腾讯欢乐游戏大规模分布式服务器架构。有十余年微服务架构经验,擅长分布式系统领域,有丰富的高性能高可用实践经验,目前正带领团队完成云原生技术栈的全面转型。 背景 基本信息: 客户名称:腾讯欢乐斗地主 行业:IT服务/软件 游戏行业
“到2023年,世界上3/4的数据库都会跑在云上。重复造轮子的企业不会走得太远,腾讯愿意做让企业站在自己肩膀上的巨人”
目前腾讯云 CDN 提供的防刷手段包括 IP 限频、IP 黑白名单、带宽或流量封顶等等,但除此之外,监控报警也是防刷中的重要一环,监控可以帮助用户迅速发现流量异常情况,并及时告警提醒用户对异常流量进行处理,以免产生高额账单或达量封顶后暂停服务影响正常业务。
云湖社交是一款基于即时通讯功能的效率工具、兴趣软件。用户可以通过丰富的机器人来提升用户的生活和工作效率。云湖中,推荐有三大玩法:打造自己的网站的用户全员群、作为自己私有网站的监控平台、搭建属于自己的自动回复机器人。
作者简介:胥耀,腾讯云监控产品经理,具有六年云产品工作经验,目前主要负责腾讯云前端性能监控和云监控相关的产品策划工作,对监控和运维领域具有深刻理解。
2021年9月 VOL:17 腾小云告诉你最前线的产品新特性, 总有一款让你心动~ 云说新品 容器产品新特性 9月上新 腾讯云边缘服务TKE@Edge 从中心云管理边缘云资源的容器系统 边缘容器服务(Tencent Kubernetes Engine for Edge,简称 TKE Edge)是腾讯云容器服务推出的用于从中心云管理边缘云资源的容器系统。 SuperEdge 0.6.0 版本9 月底发布,包含特性如下: 集成TopoLVM,支持边缘本地持久化存
导语丨为了解决用户在业务查询及监控等方面的痛点,带来更极致的开发体验。腾讯云Serverless Framework发布了Serverless Dashboard新特性,支持应用级别的监控页面,实现”0“配置的监控指标展示。同时,越来越多的客户对 SSR的支持有着较强烈的诉求,腾讯云Serverless为用户提供了一系列基于 SSR框架开发的组件,用户可以通过Serverless Framework直接完成SSR项目在云端的部署,实现SEO友好,加快首屏加载速度。 直播预告 5月22日(星期五)15:00
前言 根据《 Flexera 2020云状况报告》显示,多云环境正在成为企业的标准,93%的企业正在使用这种方式。 在部署架构方面,Kubernetes (K8s)是一种灵活的编排工具,它可以运行在本地、公共云和多个公共云。在这样的环境下,我们需要一套针对云原生环境、完善并且能实现多云监控的监控平台。自建 Prometheus,繁琐的集群关联步骤,让很多开发运维同学从入门到放弃。于是支持快速接入的托管 Prometheus 成为了大家的首选。 上期我们介绍了自建的 K8s 如何接入 Prometheus 监
腾讯云 CVM 提供了在云中的可扩展的虚拟计算资源,允许您选择多种操作系统来启动 CVM 实例,并加载到您自定义的应用环境。后续随着业务量的变化,您还可以随时调整您的 CVM 规格。
领取专属 10元无门槛券
手把手带您无忧上云