Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【私有化质量实践2】最“年轻”的云原生数据服务

【私有化质量实践2】最“年轻”的云原生数据服务

原创
作者头像
010101011001
修改于 2021-02-09 06:57:02
修改于 2021-02-09 06:57:02
1.8K0
举报

春节快乐,干货来袭。QAPM(移动监控)在TMF中交付已经走过两个年头,两年的时间,我们也在不断成长。下面我们就来说说,在私有化交付的四个环节中,我们踩过的坑与解决方案。前言

随着云架构的不断普及,“未来的软件一定生长于云上”的理念被越来越多的人所接受。云提供了一种面向企业应用实现按需进行资源分配的模型,以一种全新的、高效的方式来部署应用。企业纷纷开始云化转型,希望将传统应用迁移到云端。基于云化架构的特点,定义一条能够让应用最大程度利用云的能力、发挥云的价值的最佳路径成为行业迫切的需求,“云原生”应运而生。云原生可以有效地缩短应用交付的周期,让需求更快地变成代码,代码更快地变成线上的应用,最终为用户服务,通过缩短“time to market”带来切实的业务价值。

而我们团队早在2016年后台应用就开始吃云原生容器化的硬壳螃蟹;大数据也在2018年实施容器化(Spark on k8s),并且还开源出来了,这些尝试早于很多团队。作为技术人,我们做这些尝试当然不仅仅是为了追求新技术,而是判断云原生势在必行,并且希望TKE(K8S)作为统一的底座,为私有化面对的各种兼容性问题做一层防护层。基于TKE,让我们的兼容性风险更为可控。

但是说实话,当时我们这个选择也让“年轻”的云原生数据服务的稳定性倍受挑战,QAPM在参与私有化项目TMF进行部署时,初期面临着严重的人力紧张的难题,在经过大半年的实践进行方案调整后,成功简化了部署流程,统一了公有/私有云的架构体系,节省了人力物力成本,达成了可观的优化成果。下面我们就来说说”年轻“的云原生数据服务在私有化交付上遇到的困难和我们的解决方案。

我们的实践

一般来说私有化部署有四个环节,它们分别是 构建制品->部署-> 验证->运维,我们一起来看一下在这四个环节QAPM是怎么做的呢。

1)制品产出

自动化一切,我们团队人非常少,告诉别人说我们做APM产品,仅投入了10个人不到,大家都用惊奇的眼光看着我们。别的不说,大家确实是拼着老命来做这个产品,还存活,我觉得是因为自动化一切的理念也贯穿始终。现在,QAPM能实现自动化镜像管理,自动拉取公有云线上稳定镜像,自动化推送到私有云环境的仓库中。也就是说,我们的镜像构建按照 开始-准备构建-构建安装包和文档-打包镜像-上传物料到cos-同步到TMF管理-发布-结束构建有序进行。你没有看错,我们连文档都是构建出来的,pydoc+简单的配置代码,再配合数据库文档生成工具tbls,我们可以自动化输出公有云与私有云的完整的文档.(附件也共享我们的一个小例子"docx自动化替换案例.zip")

压缩镜像镜像大小出了决定构建快慢,还决定了在那个封闭的私有化环境下传镜像到生产环境的耗时。之前去交银部署,足足要耗费一天一夜上传镜像。因此,在镜像包的产出上,我们采用分阶段打包镜像,即使在增加ceph和kudu的情况下,我们的镜像包的大小依旧从32G减少到25G,使得传输和部署镜像的速度更快。

交付完整的文档,在文档的产出上,我们私有云文档共有33篇,文档版本迭代3次,培训3+次,按照内容的区别,文档可分为SDK、TBDS、产品、产品报告、运维、部署、验收等内容。(满满的干货,地址如下:(https://git.code.oa.com/tencent_cloud_mobile_tools/sop_doc/tree/master/%25E7%25A7%2581%25E6%259C%2589%25E4%25BA%2591)。

2)部署

软件运行在 SaaS 环境和私有化部署环境是截然不同的,SaaS 环境包含了所有租户的数据,SaaS 平台需要提供一种能力来隔离不同租户的数据。而私有化部署仅仅考虑自己就行了。这种差异导致系统设计之初就应该提早的考虑这些问题,同时保证运行在平台上的应用在开发的时候尽量关注业务逻辑并忽略这些差异。

传统部署方式操作流程复杂,费时费力,一到部署时开发同学们总是大敌将至般紧张,记得QAPM刚加入金融云服务产业互联网项目(TMF)进行私有化部署时,每次交付都需要开发同学去到银行总部现场部署,由于银行的安全隔离,镜像都不能直接部署,而是需要通过跳板机上传。记得我们在交通银行部署的时候,通常是早上的飞机过去,第二天才开始部署,那是因为光是传镜像包就要传一天一夜。面对着较落后的银行设备环境及不定因素影响,优化部署成为开发们迫切需要完成的内容。

基于云原生helm,构建一键部署

而我们的解决方案,就是通过一键部署,减少部署步骤,节省时间与人力资源,具体步骤如下:

以前部署需要21步,现在只需2步,即可实现私有云的一键部署,记得当时我们的产品落地到 TMF 之后,TMF 整体节约了 30% 的计算资源,而我们负责的产品在腾讯云和私有部署均为云原生架构,减少割裂,可以说是真正的 “双赢”。

3)验证

QAPM部署完成后的验证工作包括大数据指标类的验收、性能个例的验收以及报表看板的验收。整个流程按照

代码语言:txt
AI代码解释
复制
脚本的配置和调试->运行脚本->触发指标计算->页面检查(包括Android功能巡查、iOS功能巡查)->小程序功能巡查->移动分析->监控页面检查等步骤进行。

在验收过程中,我们需要在每一个步骤填写验收测试的CheckList,最后再填写项目测试验收报告。在一系列有序的流程过后,我们便完成了对QAPM部署的快速验证。可以看到,验收测试CheckList的验收点能基本覆盖我们部署的方方面面,确保部署验证的工作质量。

checklist1.PNG
checklist1.PNG

未来规划,私有化验证这个部分,虽然我们有jmeter的自动化接口测试,但是端到端依旧需要人工验证。实在是不符合一切自动化的理念,未来我们会串联客户端自动化与后台自动化,打造一体化全自动的验证体系,减轻我们区技同学的工作量。

4)运维

公有云与私有云的运维是巨大的,任务越繁杂,大半年来团队没有休整喘息的机会,人力紧张到令人窒息。破局势在必行。

混沌工程,前置发现运维陷阱

使用chaosmesh,我们对于我们的测试环节进行充分的故障模拟和问题修复。尽力做到滴水不漏。

可观察,运维力持续提升

整体的可观察,我们分为三部分,分别是资源、组件、业务。基于TKE的导出,我们可以获取pod的资源使用。针对Kafka、web、hdfs等特定组件,借助普罗米修斯也配置了监控。最后业务上,我们从功能,产品,版本三个维度来观察数据处理的链路是否有问题。

写在最后

在云原生技术不断成熟和普及、国内开源文化和社区逐渐兴起、去IOE和自主可控的时代背景下,QAPM作为“年轻”的云原生数据服务平台,也在不断进行探索,构建发现、定位、解决、验证的闭环,助力客户高效率突破 App 的性能瓶颈,打造顺畅体验的产品口碑。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
从0到1,QAPM在私有化实践过程中的质量保障
QAPM(移动监控)在TMF中交付已经走过两个年头,两年的时间,我们也在不断成长。截止到2020年12月,QAPM私有化工单数量收敛,安灯工单数48单下降到8单,同时,公有云工单也同步下降,从122单下降到42单,产品包含有前端、后台、SDK,还包括大数据,在公有云中涉及的组件就超过10个。回想起来,当年收到TMF的邀请,承载巨大的压力,如何快速实现私有化,并保障质量,这里多多少少有一些实践,一些坑。在我们写这篇文章的时候,我们另外一个产品“移动分析“也在走一样的路径,好的实践还是要继承下来。
010101011001
2021/02/09
2K0
初探云原生私有化容器云平台
本文的主要目的是分享一些企业在私有化场景下关于容器化改造方面的经验,这也是我们站在平台提供者的角度和业务方交流沟通后的一些思考,希望能够对大家有所启发。
腾讯云原生
2020/02/14
5.8K0
小时级部署安装,腾讯云遨驰推出私有化交付利器
伴随着私有云和混合云的蓬勃发展,各类应用和服务的私有化交付需求也持续增长。如何快速、高效地实现私有化交付,成为云厂商和SaaS厂商的一大难题。 2022年1月11日,腾讯云面向行业正式推出TCS(Tencent Cloud-native Suite)解决方案。作为腾讯云云原生操作系统遨驰在私有化领域的交付方案,TCS为各类产品提供高效、快捷的私有化交付工具,帮助厂商提升交付效率、降低人力成本。 行业数据显示,未来几年内,中国的私有云市场会保持22%的年增速,最终和公有云市场形成一个相对稳定的市场平衡。腾讯云
云头条
2022/03/18
1.6K0
SaaS遇上私有化部署,如何实现高效、快捷交付?
近年来,SaaS 伴随着公有云的落地而逐渐兴起并稳步前进。随着 SaaS 产品的发展完善,市场催生出一种新的需求——能否将 SaaS 产品进行私有化部署?表面上 SaaS 专为网络交付而设计,与私有化部署似乎格格不入,然而,从市场状况来看,SaaS 产品的私有化部署却具备长期存在的价值。 SaaS 遇上私有化部署,挑战重重 调查数据显示,未来几年内,中国的私有云市场会保持 22% 的年增速,最终和公有云市场形成一个相对稳定的市场平衡。对于私有云用户来说,SaaS 产品的私有化部署能够满足其个性化定制的需求
腾讯SaaS加速器
2022/02/17
4.5K0
腾讯云遨驰宣布升级,推出私有化云原生交付利器TCS
伴随着私有云和混合云的蓬勃发展,各类应用和服务的私有化交付需求也持续增长。如何快速、高效地实现私有化交付,成为云厂商和SaaS厂商的一大难题。
腾讯专有云
2022/06/24
1.4K0
腾讯云遨驰宣布升级,推出私有化云原生交付利器TCS
【私有化质量实践3】“千奇百怪”的Web
经过我们的“千锤百炼”,总结出来在私有化交付中Web的难点无非有两方面:一是用户环境复杂,导致了许许多多的兼容性问题;其次,可能是完全没有共性的用户需求,可以这么说,做公有云,是20%的需求来满足80%的用户,而私有化呢?是99%的需求满足1%的用户,这些需求主要集中在前端。所谓的99%的需求,我们可以理解为这些其实面向的是行业的复杂性。那么,面对这种“千奇百怪”的用户环境,我们该如何提前做好准备,随时应对呢?
010101011001
2021/02/09
5020
公有云和私有云的对比和转换
虾变成螃蟹的过程,被称为“蟹化”。部分螃蟹退化掉腹部又后悔了,又重新长出虾仁,这被称为“去蟹化”。
iginkgo18
2022/01/14
4.3K0
如何优雅兼容公有云和私有化?腾讯低代码混合云「可分可合」架构值得借鉴
「架构设计」没有放之四海而皆准的方法。“软件架构不像桥梁和房屋的架构。桥梁建成后就很难改变,但软件不一样。软件一旦运行起来,我们就可以更深入地了解我们的工作负载,然后再选择一个可演进的架构,在不影响客户体验的情况下进行更改。并且我们没有强制要求特定的架构风格。我想重申,没有一种架构模式可以满足所有的情况,单体没有消亡(恰恰相反),可演进的架构也在不断变化的技术格局中扮演着越来越重要的角色。
腾讯技术工程官方号
2023/11/01
7840
如何优雅兼容公有云和私有化?腾讯低代码混合云「可分可合」架构值得借鉴
银行定制私有云之DCOS诞生记
说到银行,需要先提一下金融云,传统的金融机构主要分为保险、证券和银行三大类(P2P、消费金融等Fintech类的,监管要求没那么高,目前算在通用云范畴)。这三类都有很高的监管要求,分别受保监会、证监会和银监会的合规管理,所以业界真正的金融云,其实主要特指这三类机构的解决方案。
腾讯专有云
2022/06/24
2K0
银行定制私有云之DCOS诞生记
寒意之下,青云私有云为何逆势上扬?
青云科技财报显示,企业云平台在2022年上半年营收同比增长43%,前三季度营收同比增长58.61%,表现强劲。
科技云报道
2023/02/14
3480
DCOS :私有云的物理基础架构管理引擎
该文介绍了DC/OS是一款基于Docker容器的开源集群管理系统,适用于所有云环境。它通过将基础设施作为代码(IaC)进行管理,简化了管理和开发流程。它还提供了丰富的监控、日志、审计、通知等功能,可以实时了解集群状态,并快速定位和解决问题。此外,DC/OS还支持云原生应用,提供了统一的应用编排和发布平台,并支持容器、虚拟机和主机等多种环境。DC/OS的发布,将进一步推动开源云原生技术在行业中的应用,为更多企业带来敏捷、高效、安全、可靠的价值。
TEG云端专业号
2017/08/01
9.4K1
DCOS :私有云的物理基础架构管理引擎
私有存储云如何构建?
构建内部的云存储必须考虑到弹性、选择正确的平台、支持工作流,以及批量部署和跟公有云的集成。 随着时间的推移,存储即服务的交付进展惊人。如今,公有云,如Amazon Web Services和Micro
静一
2018/03/27
26.2K0
腾讯云:公有云如何「专有化」
机器之心原创 作者:旗舰 经过几天的通宵奋战,孙其琛和他的团队刚刚完成了一家大型金融机构的专有云部署项目。迎着第一缕阳光走出机房的他们,倒头便睡在了会议室的沙发上。 熬夜加班后在会议室补觉的景象,在互联网公司十分常见,但在金融和政府客户的工作氛围中,这样的场景显得反差感很大。 「金融行业比较传统,员工日常都是西装革履,上下班也是朝九晚五。整体跟我们的工作模式差别挺大的。」习惯了短裤 + 文化衫的孙其琛是个典型的 IT 男,但是作为腾讯云的专有云中心技术总监,近几年他一直在与「高大上」的政府、金融行业领导
机器之心
2023/03/29
8.3K0
腾讯云:公有云如何「专有化」
数栈技术大牛分享:云原生大数据系统架构的实践和思考
大家好,我是来自袋鼠云的浣熊,感谢这次会议的讲师们给我们带来了云原生技术应用的分享,感觉又打开了几个新脉门,解锁了新的武魂。在接下来的分享中,希望大家跟着我们的实践案例做一些探索性的思考。
袋鼠云数栈
2021/05/14
7120
数栈技术大牛分享:云原生大数据系统架构的实践和思考
谈谈公有云、专属云和私有云
来源 / 阿朱说 (ID:azhushuo ) 作者 / 吕建伟 · 编辑 / 吴暄
ToB行业头条
2020/07/21
20.4K0
云原生时代的"应用级"多云管理
当前云计算有多种形态公有云、私有云、边缘云、虚拟机等,如何高效管理多云是当前面临的问题,在云原生时代,又该如何利用云原生技术实现多云管理?本文将讲解通过 Rainbond实现“应用级”多云管理。
Rainbond开源
2021/12/06
7690
云原生时代的"应用级"多云管理
云原生背景下的运维价值思考与实践
作者:刘天斯,腾讯游戏高级工程师 前言 随着公司自研上云战略如火如荼地进行,IEG-增值服务部作为较早一批响应的团队,截止目前自研上云已完成1/3的流量切换,日PV超百亿。切云的服务大量采用了云原生的应用与技术架构,作为公司第一批面临云原生环境的业务运维,深切感受到云原生给运维工作带来的机遇与挑战,运维模式的转型已经迫在眉睫,此篇文章最大的价值在于将我们的转型思路、方法与实践,提供给后面更多面临同样挑战的团队借鉴与参考。下面我将从业务场景、运维转型之道、云端收益等几个方面来跟大家一起来探讨。 一、业务服
腾讯技术工程官方号
2020/11/27
2K0
叮咚!您有一份安全易用的私有云解决方案待查收
TStack是腾讯云基于自身强大技术能力和海量运营经验推出的私有云平台,提供集IaaS、PaaS和SaaS为一体的综合云服务解决方案;大量私有化部署经验,具备混合云管理能力,具有高稳定性、统一管理、可视化运营等特点,助力政府、企业构建稳定安全的云环境和健康的云生态。 客户价值 Customer Value 架构开放兼容 基于开源的技术架构,具备多平台兼容能力和标准的API服务,支持第三方定制开发 产品形态多样 接入大量腾讯内部成熟的PaaS和SaaS服务,便于客户根据需求完善应用服务体系 海量
腾讯云TStack
2018/09/05
1.6K0
叮咚!您有一份安全易用的私有云解决方案待查收
程辉:私有云建设的过去、现在和未来
程辉认为,私有云软件系统复杂、厂商和企业客户缺乏对软件价值的认知,导致目前私有云行业的商业模式不可持续。私有云采用OpenStack、Ceph和Kubernetes分而治之的产品结构,重视服务水平,是未来能够匹敌公有云体验的关键。
SammyLiu
2019/06/28
2.5K0
程辉:私有云建设的过去、现在和未来
灵雀云陈恺:2020 云原生走向何处?|CNBPS2020演讲实录
大家好,我是灵雀云的陈恺。今天我们用这种比较特殊的方式来交流,很多人可能已经习惯这种新的工作和生活方式。疫情在带来很大挑战的同时,也在倒逼着我们去进步,就像几个月前微软CEO 萨提亚·纳德拉说的,很多企业把原本需要花两年时间来做的数字化转型,在短短两个月内一口气全都搞定了。
灵雀云
2020/12/29
4440
灵雀云陈恺:2020 云原生走向何处?|CNBPS2020演讲实录
推荐阅读
相关推荐
从0到1,QAPM在私有化实践过程中的质量保障
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档