00:00
各位网友大家好,欢迎观看原动力云原生正发生降本增效大讲堂系列技术直播。本次大讲堂是由中国信通院、腾讯云非要产业标准工作组联合策划,目的是与开发者一同交流提升资源利用率、降本增效的方法与优秀实践。今年大讲堂将分为三期共实讲,那第一期呢,聚焦在优秀实践方法论资源与弹性架构设计,那第二期聚焦全场景,在离线分布Co GPU资源、效率提升Co资源托普感知调度主题,第三期将邀请四家业界知名企业,分享各企业云原生降本增效的技术实践,从而给开发者带来更多样化的业务下的、场景下的干货。那金秋11月,那我们又到了一个周四的技术分享时刻,那今天呢,是该大讲堂的最后一讲,直播主题是noia云原生资源编排优化。
01:02
啊,那我们今天请到了腾讯在云计算平台负责人魏微来为我们分享。IA云原生资源编排优化带来基于历史模型的预测值。Credits代替requests,如何根据多维度资源进行复杂装箱、策略求解、优化调度代价匹配算法实施编排方案等技术内容。小伙伴们在直播观看过程当中呢,如果说有技术问题呢,可以随时在我们的弹幕区或者说在我们的交流群内进行提问,那我们的技术大咖呢,也会为你们进行详细的解答。那接下来让我们有请魏薇老师。各位线上的观众们、老师们、各位专家们,大家好,我是来自腾讯crosss体系的微微,今天很荣幸能够参加有中国信通院腾讯云和sing o产业标准工作组举办的云原生正发生系列大讲堂。
02:02
我目前主要工作是负责云计算平台的架构设计与研发,接下来我将为大家分享我们在上云过程中对于资源优化的一些思考与实践。我今天想要分享的主题是诺亚原生资源编排优化。呃,这里我想简单解释一下,诺IA这个词呢,是我们从希腊的神话中取了一个名字,她是管理秩序的一个女生。我觉得它的跟我们项目的背景非常吻合,所以就取了这样一个名字。呃,我今天要分的内容主要分三块,首先我想一我们资源优化的背,比如什么要做这事,然后呃,结合我们的生产实践,讲一下我们诺密亚这个项目的一些实践,呃。最后我们会给大家分享一下我们的成果。首先来看一下云上资源优化的背景。
03:02
呃,我们可以看到从传统的IDC部署的方式变到现在的容器化部署方式,嗯,它的最多的变化。是我们在物理层、操作系统层之上加了一层容器运行时,那么我们现在在云上。部所有的这些业务,你。库容。然后我们今天所要讲的这个项目,所谓的这个米变排器,它的作用范围就是在。这样一层账。在整个的这个上云的过程中。我觉得啊,这个其实并没有新技术的。产生,然后再一个就是我们上云之后,它的核心收益应该是资源利用率的上升,成本的大幅下降。利资源。
04:12
上云的过程中啊,资源浪费啊,原因还是挺常见的啊,这里我简单的罗列了一下,比如说第一个我们应用资源设置不合理。呃,在上之前我们一般要求用啊磁。啊,这个就要求他在在正式上线之前做到预估资源的需求。线上的资源的需求,其实你可以通过压测来分,但是难免呃,它和实际的运营的情况是有些出入的啊,再一个就是如果这些应用它上线之后,它的资源利用率不可能一成不变,对它的业务在变迁,它的策略啊在变迁,会发生动态的改变,呃,所以通过这种方式就是我们的资源很明显它。
05:08
呃,它不能很好的反映到实际的资源需求,呃,就会造成一些浪费,然后第二个是我们同类的这个泡沫有各项资源的差异,在我们的实际过程中,我们发现即使是相同的业务就相同的炮弹。它的这个CPU,内存、磁盘,还有网络等等,这些监控指标会有很大的差异,比如说极端情况下,呃,会差60%,有时候我们会遇到比如比如说同样一个业务,它的它的大部分po的的利用率CPU都很低,但个别却高达90%以上。这时候我们。运维同学常见的操作就直接扩。呃,扩了之后可以整体的幅度会有一个下降。这样,但是这样的操作也会有一些资源的浪费。啊,这个地方我们会重点重点后面。
06:00
啊,第三个就是多维度的空,空闲资源的碎片化比较严重,呃,当我们的集群运行一段时间之后,随着节点它不断的上架下架。那个泡的不断的扩容缩容,我们会有越来越多的空闲资源分散在整个基度,并且这样的空闲,闲散的资源是存在多个维的不同的浪费,如节C。这维资浪费。集中下架散同。这样也会造成。浪费。然后有了资源,除了浪费之,我们不想浪费它,那我们在使用的过程中也有一些痛点,比如说流量个会导致资源足。呃,像我们是主要是做安全业务的,那我们在,呃,正常是有明显的周期性,这个没有问题,周期即使有峰值的变化,那一般比。
07:03
啊,后半夜流量会比较低,但是在某些突发的情况下。比如说像突发性的热点啊,还有一些大型的节假日服务的请求量会在短时间内急剧的上涨,这样就会造成我们资源的不足,影响服务的。正常运行对同时产生,然后一个就是我们维限,比如原生的调度C存磁盘这三个维度进行判断,就是资源是否充足。然而实际情况并不是这样,比如说我们的磁盘的IO,比如说你某个业务它的在疯的读写磁盘。的拟的相关的资源,也会造成我们因为维度的问题。因为维度的匮乏,造成我们的业务啊不能正常的运行。
08:03
那么为了解决这些问题,其实我们啊业界是有很多方案的,比如说这里我列举了PA啊,VPACA啊,就这样一些啊,动态的啊。变变迁容量的方式啊,还有一个超卖的动力。像可能这个是语音的一些厂商都做一些做比较多的一些动作,然还有反和性啊,像在线离线混者合部署,这个前面的我看很多讲师也提到过。然后还有比如这是定期的去节点的资源部情况,那么我们通过驱逐这个。让整个负能够降dynamic schedule,比如我基于实际的啊,这个方案其实跟案就非常接近了啊,进行一调度后低位线。意思就是说扩容的时候优先调度到负载处于水平线之间的节点,然后缩的时候优先部署。
09:07
水平节。呃,讲完了这些方案,我们来看一下我们。普罗米亚想要大家?就提供了怎样的思和方式。呃,我们呃主要分了三大模块,首先是对于业务。进行预测。因为像游戏安全的这些实时计算的业务,它的资源使用率是往往具备比较明显的周期性,并且周期之间的变动它不会太大,所以呢,有这么样一个基础,所以我们就可以对它进行一定的预测。然后预测了之后,我们会得到一个一个一个比较确定的,然后这时候我们剩下的问题就比较简单了,就我们就把这得到了这些D啊。未来会是怎样的一个把它,把它填到我们现有所有的节,然后我们就把个节点。
10:03
一个箱子。问题实际上转成。啊,然后有了呃,装箱问题,中间的这个求解器会为我们。求解一个优部方调器。我们的调度会根据这个部署方案,再结合业务的调度性,还有的部状那我们也用了。对对这个现有的进行进行实时的这个离线的,或者实时的这么一些调度策略啊,总的来说我们就是分了三大块儿。那么我们的工作流大概是这样。就首先我们在K8S集群里面,呃,会对它的各项数据的。那个监控进行采集啊,采集到了之后,我们的预测器啊,就会对这些采集到的资源数据进行预测。预测了之后,我们的编排器就在这一步。我们。
11:02
根据所有的这个。耗的类型,呃,资源的这个方就耗用的这个维度,呃,计算出一个整体的比较优的方案,然后我们会把这个方案输出我们的调度器啊,然后我们的调度器在这个环节拿到这个方案之后,我们有两件事情要做。首先是我们的驱逐,就是我们会把这个方案中不同的这个节点。上面的这个驱逐掉。然后把pod驱逐了之后啊,再会集中的啊,按照我们求解出来的这个最优方案,把这个pod一个一个的调度到相应的节点上啊。最终我们呃会挤压出一些空间节点,有这个节点。然后我们可以呃,采用的方式或者人工的方式来定期的执行,就把这些机器进行退库,这样的话能实现我们成本的。好,OK,那就第一个我们来介绍一下我们是怎么做预测模型的,在你做预测之前。
12:06
啊,你需要找到就你的模型是什么。你的是长什么样?呃,对于我们来说啊,呃,因为我们是一个实时的在线支撑业务,那么它的这个,呃,我们的很大的一个成本是跟C相关的,所以我这里只是列举CP的一些测试和一些数据的验证,那如果说你的这个业务不一样的维度不一样,可能你需要找到自己的。这个预测的模型,OK,那我们回过头来,我们的C根据C5值C5啊,那么我们首先想到,那就很简单,我们把所有的pod的植物峰值把它那拿出来之后啊,对它进行集中的部署。然后我们就上了去检验,呃,从这个中我们可以看到,就是我们以为我们这样做了之后的目标C可以达到十。
13:19
所以他们的峰值。嗯。那么基于这个原因,那很简单,那我们就去找到了。时间模型,比如说我就不能按那个日峰值或者是中峰值来算是吧,那我们就直接拉,就是取了这个小时的峰值,把它填进来。进行计算,那么小时的峰值我们可以看到,诶,对于是有一定的改善的,大概在56%左右,呃,但是它还是有差异是吧,因为他可能小时我们当时觉得太粗了,就是他还是有一定的。错峰的风险。呃,那我们就进一步提高了时间的精度,我们是大概用十分钟的这样一个精度,呃,来部署它,大家可以从头明显的能够感觉到。
14:11
那个各个的重叠。域是越明显中间重叠的。然后这个时候的总机的CPU。来到63%,那么下图中我们就是我们这个红的这个线。然分之十。下来。想了一下。呃,因为我们不太可能去把它取一分钟的差距,或者是半分钟的差距,因为你这样对于线上业务计算来说,那那它的这个计算量就太大。实际上十分钟的力度也已经太细了,就不太可能在生产环境中啊,所以我们就回过来仔细的观察了一下,就为什么我们已经如此的。
15:09
啊,取值了,但是仍然不能达到理想值。那这个图是我们找了一个业务看了它,呃,大概20个不同的套它的这个曲线。从图中我们可以看到。在细度的时间。虽然同一个。但是你可以看到它的这个CPU。根本没有相关性,也没有任何的看起来也没有任何的那个。不同的不同的实就是有差异,这时可能有人会得很,为什么不同实有差异呢?啊这我请大家注意,我这个说的是细吧,你可能个你这个业务中可能有个逻辑。那它每一秒钟,它处理的逻辑不可能一模一样,这就造成了它每一个在时间里面CPU的就是不一样。
16:07
啊,再有一个就比如说我泡泡的相同的处理的逻辑可能在某个时间点也是相同的,但是母机的工况不一定一样。这就导致了这个泡的它的表现也不一样,这就是我们之前说的那有些泡的。都已经高达90%了,但是有些报的它只有百分之二三十的CPU。这样来啊,有基于这样一种线上的实际情况,我们发现你想要精确的控制这个这种CPU的这。常见的模型啊,对行,而是应该一。
17:00
的曲线模型,那这时候。啊,立即就想到了采位数的方式。进行这种高精度时间序列对他进行测算。整机的利用率大概能跑到77%左右,而且从图中能够明显的感觉到中间有一一条线非常的明亮,明亮的原因是因为不同的在同一间点。同时达到了峰值。呃,然后。可以看在在下面来来看这个橙色的线是我们弄的色的,黄色的线是位数啊,那色和色的线几乎是。非常接近的区域啊。到达峰值也是在同一时间能够到达。
18:00
那么呃,经过这样一些简单的实验,我们能够对于我们的业务。那这种方式能够获比较准。那有了pod之后,接下来的事情就需要对它进行预测,因为我们的调度,我们的资源优化是对未来的优化,对吧,也是需要来某个时间点排部署更加合理。所以我们去找这个预测的方式,呃,预测的方式我这里简单列举了一些。像直接使用月数据啊,就因为我们很强嘛。直是可以用的,然后可以直接使用周期因子,那么它的优点是逻辑很简单。可解释性也很好啊,也可以使用profit profit这个是Facebook直接已经开源了,这个项目大家可以直接拿来用。我觉得。它可能更多的是能够对我们的趋势项啊,啊周期啊,节假日项。
19:04
也考虑进来对他进行综合预测,呃,那么它的一个小缺点,比如说我们的预测结果存在波动。而且再一个就是可能计算速度稍微有点慢。各位可以根据自己的。集群的规模。合理的控制。实计算明显周期。对于周期性的预测比较值。把这几种方法都一。呃,可以感觉到吧,因为因为我们都是周期性的嘛,所以周期因子法还有profit。都能得到比较好的。就预测结果,那么这个图中我们的黑色的线就是实际呃运行情况啊,然后嗯,大家可以看到最接近的其实就是绿色的,其次就是周。
20:10
大概的差值也都在10%几左右。就它的那个跟实际的曲线的非常好。OK。呃,由于你预测完了之后,我们实际上这个已经得到了一个一个不同的啊,那我们手里拿到了这么一个,那剩下的问题。看起来就很简单了,对吧,那就是把这样一些的啊,把它装填到。我们手中的这个集群中就是中,这个时候我们发现就是我们会把一些业务的调度的需求就转化成了约束条件了。成了装箱约束条件。
21:00
那些业务可能反有需求,那自定义,比如说我像有有它有很多点,他对自己的的连续数,它有要求多了,达到某一个值之后,就就必须不能再调度,必须要缩减。啊,还有一些业务可能提出来小核心大核心。的部署啊,亲和性啊,非亲和性啊,还有一些反亲和性。还有损和无损的业务,他可能觉得说我们这个业务的非常高,然后他希望进行无损的部署。等等等,就是诸诸如此类的这样一条件,都可以把它理解一的。那么我们只要解决好这个问题就可以了。那OK,那我们就仔细想一想,这个装箱问题是一个什么问题,呃,装箱问题。
22:00
可能了解的同学都知道他是一个N啊,那我这里就简单的算了一。比如说啊,假如我们有。呃,这边业务比较典型的一种一种现状,呃,然后我们就开始,比如说我把这其中的一个箱子进行装填啊,那么我们可以得到比如CN1加CN2加一加CN啊其实就是一个组合对吧,就是对这个箱子进行装填,得到一个组合啊,那OK,那那我们看一下这个组合大概要多长时间。呃,由于我们有M箱子,2000M乘以二。这么一个数啊,假设我用一个4G的CPU。来运算。这样一个组合。呃,假设我只算最简单的加法。不考虑其他的这个挪移啊,策略啊,迁移啊这些方式啊,去把它假想成最简单的一个加法,呃,那么大约需要。
23:10
这么多。二的9997。这个,呃,这数看起来还挺大的,嗯,那到底有多大呢?我又去找了一个数。跟这个数做一个比较。我查到比如说科学家现在预测啊,就是我们这个宇宙大冰动的时间,宇宙毁灭的时间吧,啊是十个六次方一年啊,换算过来就大约有二的50次幂。增长。呃,这个我觉得这个测算的过程中肯定不是那么严,只是一个大概是我省略了很多。啊,但是简简单单的,呃,一个测算,大家应该能够感受到这个问题,呃,在理论上其实是没有办法求得全局自由解的,对吧?
24:01
就比如说你我,你可能觉得我只用了一个CU来计算,但我觉得你就算你把全世界的CPU找来,其实我也不知道有多少。可能他去对于求解这个问题的帮助并不是太大。所以我们在生产实践的过程中啊,我们其实转而求其次了,就是我们想要求的一些自由。或者是局部的。呃,有于这个问题复杂度。也是在总公司,我们提了一个开源共建的项目。看看大家对这个问题。有一些研究的小伙伴跟我一起来。探索一下,是不是能够把这个问题在实践中做一个解决啊。这里我们也。罗列了一些我们想到过的一些方法,或者我们了解的方法。呃。子群啊,搜索模拟配啊等这样一些比较现代的提出来的一些方式啊,都可以在解决这个组化问题的时候。
25:08
给拿来用。OK,那这里。提一下我们。用到的个算法就是同,就是这个,就是把一个目标的问题的一个可行解,我们把它抽象成一个染色体,就是有点像生物学中的那个概念。就这个地方,我简单说一下。大体的理念就是模拟的这个生物进化。比如说就是这个,就是地球上的生物是如何演化进化到我们现在的这种比较的生存方式的,其实基于这个来做的,所以它里面呢有一些概念。大家听起来就就很耳熟,比如说种群啊的初始化,然后它的染色体。
26:03
之间的那个交叉啊,染色体发生变异。最终呃,基于优胜劣汰,就跟生物学生一样,就这个解,它优质的解。劣质的循环。来优化整个群。然后这个染色体的方案。有几种吧,这里我只列个我们用到的啊,那么我们其实这个染色体编码的方案呢啊,是一个二维的,可以看得到,就比就是一,其中第一维是这个箱子的序列,比如我的第一个染合体就是一号箱子,二号箱子,三号箱子,四号箱子对吧,然后它。每一个箱子里就装填了不同的不同的下面这个。A箱子B号箱子箱子。那他装成了。方式这来更,那么就基于这样一种编码方式。
27:14
对不同的染色体进行交叉变。对他进行求解。OK,然后我们,呃,适应度函数,呃,这里其实也比较简单,其实就是把它加起来,就把第一个箱子。整体了多少啊?第一装。啊,这个K呢是一个,就你是取1.5也行,二也行,2.5也行,它举一当然也可以取一,其实就是很简单对吧,它就是把这整个箱子的装填率加起来就可以啊,比如说哈,我举个例子,比如说我第一个箱子装了90%,那它就是0.9。
28:01
第二个第二箱子可能0.8,但如果我们给他一个K,比如K是二,那这个K越大,就表示我们倾向于填充满的箱子,这是啥意思?比如说我在一个。解决方案中。如果他的第一个箱子装到了90%。当然是很好,对吧。但是对于我们整个解决方案。他不一定是最优的,由于因为有可能抢占了一个比较好的基因。抢占了之后,别的箱子就没有办法用。这个机。导致别的箱子的装填率,比如说大家都只能填到60%,而你一个人装填到90%。那对于整体来说,这并不一定是最优的方法。我这样解释,应该大家都能明白这个意思。啊,所以我们在实践中,你需要根据自己的情况来设置这个。
29:00
啊,这里我就没有再进一步的去详细解释这个这个算法,这个我们。就。呃,简单的罗列一下我们的一些测试的结果吧,就是我们选了,因为我之前也测算过,就是如果你的规模过于庞大,呃,它的计算。计算的代价是量的,所以我们大概选了。节点个数。然后变异的概率设到66等等。对他进行一个。进行演化计算。经完全满需分吧。
30:00
因为你在实际过程中,你也不可能把这个机器。100%,这样也合理。其实有了百分之八九十已经非常非常好。OK。啊,那就是我们第二步啊,求解器所要做的一些工作,就是我们会把这个问题。小部分。数据,然后对进行计算,你用断我们团的一样也可以求解出较。你得到了这个。比较好的部署方案之后。剩下的工作就是需要在实践中把现有的集群。调度迁移到这个比较的调度方案上来。那么对于调度器来说,它也有。呃,几个工作要做。
31:00
首计算映射关系前的节部方案节点映射。然后再对现有的做无驱逐。比如将节点上符合部的方案。这我们要把它。然后第三步是我们进行再调度,比如说我们对于新创建的这些,按照我们理想的调度方案,把它一个一个。安置点。那么这个地方就呃需要提到这么样一个工作,就是算关系,这工的标就是当前集的节点和部署方案中的节点一一对应小,那使得对于业务的影响最小。因为部署方案中的节点不一定是按照顺序部署进行匹配。然后再一个就是我们这个地方啊。做的这个事情,就比如说你现有的这个部署方式。
32:01
和我的理想中的这个。这个部署方案它可能是千差万别吧,你肯定不可能,呃,把它一一对应过来,就就是强势的。直接迁移过来,你可能要找一个最小的。部署方案来做。那么这时候我们发现。其实呃,可以抽象成一个二分图,这个图的。就是这系解。呃,大家可以看到,如果我们简单的直接用这个和来求。那我们就。就是迁移调度的成本大概是50,但如果说我用这个K这样。算了,这个最佳的匹配。的全职总和,我们可以看到,其实我们用21的代价就可以完成这个。
33:02
叫做。那我们计算好了,呃,整个迁移调度就你的映射映射的关系之后啊,接下来就要开始实施啊。真正的工作,那么首先你需要做无损的驱逐,对吧,因为你的调度较尽可能的不要影响线上的这些啊业务线上这些服务啊,那么那么我们在做无损驱逐的时候啊,我们是把服务分了三类,第一类是无状态的服务,那这类是最简单的。那就是pod,如果立即停止,它对当前的业务它没有影响啊,这个时候其实你要做的事情就比较简单,首先这个业务它要能够支持灰度就可以了。然后再一个就是我们在调度的时候,要保证它只要有部分的pod是正常运行。有一部分在处于调度过程中。这个这个整个过程就可以完成。
34:02
然后第二类的会呃,复杂一点啊,第二类的就是弱状态的。那么这一类的它的立即。对于当前的业务啊,是有一定的影响,但是可能那这个情况下,除了要做到。刚才谈到有个业务,他要支持灰度。业务它在这个我们在调度的时候,保证这个正常运行。啊,再一个就是我们提出了在低峰期进行调度的一个一个逻辑,比如说我们这里举例啊,就是我在那个晚上三点到六点是低峰期,我们进行调度。然后那个有可能。调度。然后呢,到了第二天又到了,这个叫做低空消。再再接着把他的这个业务进行调度,调度完成。
35:03
然后来看我们的第三类是比较复杂一点,就是状态的服务。那这种服务我们的定义是立即停止,对于当前的业务,它是有影响,并且是致命的。那这个时候可能做到前面的无状态或者弱状态。不满足需求。那这时候我们会有一些,嗯。这可能会稍微复杂一些吧,跟业务做一些联动,那这里我画出了几个关键的那个时间节点。比如说我们调度每容的时候。然后告诉业务你即将被调度吧,然后这时候你可执行一些。自定义的退出的辑,比如说你存一些数据就紧把它就出,不要再收新数进来进行处理。
36:02
然后在真正的调度的时候,会再给你发一个信号,这时候就真正的你需要立即退出吧。然后我们的那个转化规则,就路由层面就也不会给你进行新的那个路由啊,路由数据啊,那这个时候如果说我们的业务框架,我们的平台是接管了。路由和数据的治理。我们的路由层面的。那个工作跟我们的调度是紧密配合的。这时候我们。在发出回调之前,我们的啊路由器就路由调度可以提前把它摘掉,或就告诉些我们可以只可以处理现有不能处理。新的逻辑。当然你们的业务如果说没有这一层,会去依赖流量管理可以。啊,那讲完了无损驱逐之后啊,就是接下来应该就是最终的一步了,就是再调度,那再调度的这个目标,其实就是想把我们刚才驱逐掉的,就它就变成新建的炮弹。
37:08
然后把的部方调度最理点。1.18以后的。的调度器已经支持插件模式,所以这个地方是不需要我们完全重新开始工作,你只需要增加自己的插件或者是修改现有的插件就可以了啊,我们是直接修改了它的过滤的插件和评分的插件。比如说过滤的插件,我们就基于资源。我过滤就资源不足的可能就过滤掉,然后再第二呢,我们就基于自己的部署吧,就是我们在第二模块算出来的这个最优的部署方案,然后我们把它过滤掉,不符合这个方案的节点把它过滤掉。啊,然后在评分阶段,就score这个打分的阶段,我们会优先部署方案内的节点。
38:03
因为因为这个你有时候在这个调度和部署的过程中,就整个可能时间会很长。所以有时候能加入进来节部署案节。把它出来,它打个分进行调度。然后他的情况就原件。呃,然后最后呃,想给大家分享一下我们的。整个方案实施,呃,之后有一一些成果吧,然后我们是在一个集群上面做了我们之前刚才说的整套的方案。那么我们这个集群在优化之前,CPU大概是在28%左右,嗯,那么优化完了之后。
39:05
然后节点数是从之前的13,现在降落到了23左右。然后优化有一些告警。比如说我们优化前,我们一周可计80多个告警,优化完了之后,那就只有三个。然后他的。呃,节点的CPU的利用率,呃,可以看得到,就是这是TOP10的。还是非常均衡的,大概都能跑到80%几左右。看起来也也很均衡。然后这个图呢,是我们,呃,就是业务部署的,就就每一个色块,比如红色块,它是一个业务,就红色块,因为它是一个比较大的业务,它的实力数也比较多啊,所以我们可以看到它是分布的部署在很多个机器上。啊,像有些业务像右下角这里是因为它有些业务它本身也只有两个实例啊,或者三个实例,它不可能分布在二三十台机器上。
40:04
所以他就他就只有一个一个色块。然后这个维度是从节点的维度来看,节点的维度来看就感觉是比较。你看,像我们大的节点能够承十个业务吧,节点业务都能够。所以从这个图中可以能感受到我们的这个机器的。情况。还是比较比较满的。也也看起来还是比较优化的。啊OK啊,那以上就是我。今天想要分享的所有的内容,谢谢大家的聆听和观看。再见。好,感谢魏薇老师的精彩分享。魏老师首先从云上资源优化背景开始,讲到传统的IDC部署方式,便签到容器化部署方式演变,例举了三个上云过程当中常见资源浪费原因、痛点、难点以及常见解决方案,着重讲解了诺IA的实践经验。
41:16
从预测模型、求解器、调度器三大模块技术展开深入的探讨。那最后分享的方案实施后的成果展示,那本次直播结束后呢,我们也会生成的回放视频,那错过直播的可以点击我们同链接进行一个观看的回放学习,那有的小伙伴说错过了之前的直播怎么办?那不用担心,我们每一场直播呢,都会有直播回放,那回放呢,就是我们的当前的直播地址。也可以查看活动页面,观看我们的回放视频,那截止目前呢,大讲堂进入直播分享已经接近了尾声,在此期间我们也进行了十讲的技术直播分享。那在6月23号,6月30号,还有7月7号呢,我们进行了第一期的三期直播,那直播主题分别是云原生降本增效优秀实践案例分享。
42:12
云上资源的分析与优化。Cor集群利用率提升时间,那在7月28号,8月4号,还有8月11号呢,我们进行了第二期的直播,那我们主题呢,分别是kas全场景载力线分布,通过云约生管理CGPU资源。资源托扑感知调度。那在9月1号,9月15号,还有9月22号呢,以及我们今晚的直播,我们已经进行了第三期的直播,那直播的主题分别是作业帮云原生降本增效实践之路,游戏平台上云是花钱还是省钱?京东云原生大规模实践之路。诺米原生资源编排优化,欢迎大家观看回放,点击我们当前直播间下方的往期直播,或者进入活地活动专题页面,那即可观看我们的回放跟学习。那本次大讲堂在三期直播当中呢,有11位技术大咖啊来给我们带来了云原生降本增效的探索与分享。
43:16
掌握降本增效的关键技能,再次感谢直播间的小伙伴们的持续关注跟支持,希望大家在本次大讲堂有所收获。好了,我们今天的直播到这里就结束了,我们再见。
我来说两句