前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >外卖订单量预测异常报警模型实践

外卖订单量预测异常报警模型实践

作者头像
美团技术团队
发布于 2018-03-12 12:11:22
发布于 2018-03-12 12:11:22
3.2K1
举报
文章被收录于专栏:美团技术团队美团技术团队

前言

外卖业务的快速发展对系统稳定性提出了更高的要求,每一次订单量大盘的异常波动,都需要做出及时的应对,以保证系统的整体稳定性。如何做出较为准确的波动预警,显得尤为重要。

从时间上看,外卖订单量时间序列有两个明显的特征(如下图所示):

  • 周期性。每天订单量的变化趋势都大致相同,午高峰和晚高峰订单量集中。
  • 实时性。当天的订单量可能会受天气等因素影响,呈现整体的上涨或下降。

订单量波动预警,初期外卖订单中心使用的是当前时刻和前一时刻订单量比较,超过一定阈值就报警的方式,误报率和漏报率都比较大。后期将业务数据上传到美团点评的服务治理平台,使用该平台下的基线报警模型进行监控报警。基线数据模型考虑到了订单量时间序列的周期性特征,但是忽略了实时性特征,在实际使用中误报率依然很高,大量的误报漏报导致RD对于报警已经麻木,出现问题时不能及时响应,因此,急需一种新的异常检测模型,提高报警的准确率。

图1.1 外卖订单大盘趋势图

异常检测的定义

异常,意为“异于正常”。异常检测,就是从一组数据中寻找那些和期望数据不同的数据。监控数据都是和时间相关的,每一个监控指标只有和时间组合一起才有其具体的含义。按照时间顺序,将监控指标组成一个序列,我们就得到了监控指标的时间序列。

基于预测的异常检测模型如下图所示,xt是真实数据,通过预测器得到预测数据,然后xt和pt分别作为比较器的输入,最终得到输出yt。yt是一个二元值,可以用+1(+1表示输入数据正常),-1(-1表示输入数据异常)表示。

图2.1 异常检测模型

异常检测主要有两种策略:

  • 异常驱动的异常检测(敏感性):宁愿误报,也不能错过任何一个异常,这适用于非常重要的检测。简单概括,就是“宁可错杀一千,不能放过一个”。
  • 预算驱动的异常检测(准确性):这种策略的异常检测,从字面理解就是只有定量的一些预算去处理这些报警,那么只能当一定是某种问题时,才能将报警发送出来。

这两种策略不可兼容的。对于检测模型的改善,可以从两个方面入手,一是预测器的优化,二是比较器的优化。我们从这两个方面描述模型的改善。

预测器设计

预测器,就是用一批历史数据预测当前的数据。使用的历史数据集大小,以及使用的预测算法都会影响最终的预测效果。

外卖订单量具有明显的周期性,同时相邻时刻的订单量数据也有很强的相关性,我们的目标,就是使用上面说的相关数据预测出当前的订单量。下面,我们分析几种常用的预测器实现。

同比环比预测器

同比环比是比较常用的异常检测方式,它是将当前时刻数据和前一时刻数据(环比)或者前一天同一时刻数据(同比)比较,超过一定阈值即认为该点异常。如果用图2.1模型来表示,那么预测器就可以表示为用当前时刻前一时刻或者前一天同一时刻数据作为当前时刻的预测数据。

如果将不同日期、时刻的监控数据以矩阵方式存储,每一行表示一天内不同时刻的监控数据,每一列表示同一时刻不同日期的监控数据,那么存储矩阵如下图所示:

图3.1 同比环比

假如需要预测图中黄色数据,那么环比使用图中的蓝色数据作为预测黄点的源数据,同比使用图中红色数据作为预测黄点的源数据。

基线预测器

同比环比使用历史上的单点数据来预测当前数据,误差比较大。t时刻的监控数据,与t-1,t-2,...时刻的监控数据存在相关性。同时,与t-k,t-2k,...时刻的数据也存在相关性(k为周期),如果能利用上这些相关数据对t时刻进行预测,预测结果的误差将会更小。

比较常用的方式是对历史数据求平均,然后过滤噪声,可以得到一个平滑的曲线(基线),使用基线数据来预测当前时刻的数据。该方法预测t时刻数据(图中黄色数据)使用到的历史数据如下图所示(图中红色数据):

图3.2 历史数据求平均

基线数据预测器广泛应用在业务大盘监控中,预测效果如图3.3所示。从图中可以看出,基线比较平滑,在低峰期预测效果比较好,但是在外卖的午高峰和晚高峰预测误差比较大。

图3.3 基线数据预测

Holt-Winters预测器

同比环比预测到基线数据预测,使用的相关数据变多,预测的效果也较好。但是基线数据预测器只使用了周期相关的历史数据,没有使用上同周期相邻时刻的历史数据,相邻时刻的历史数据对于当前时刻的预测影响是比较大的。如外卖订单量,某天天气不好,很多用户不愿意出门,那么当天的外卖的订单量就会呈现整体的上涨,这种整体上涨趋势只能从同一周期相邻时刻的历史数据中预测出来。如图3.4所示,预测图中黄色数据,如果使用上图中所有的红色数据,那么预测效果会更好。

图3.4 Holt-Winters预测

本文使用了Holt-Winters来实现这一目标。

Holt-Winters是三次指数滑动平均算法,它将时间序列数据分为三部分:残差数据a(t),趋势性数据b(t),季节性数据s(t)。使用Holt-Winters预测t时刻数据,需要t时刻前包含多个周期的历史数据。相关链接:Exponential smoothingHolt-Winters seasonal method

各部分的迭代计算公式(周期为k):

如图3.5所示,(a)显示了某一段时间内外卖订单的原始提单监控数据(分钟统计量,周期为1天),图(b)显示了其Holt-Winters的分解图(四幅图分别对应原始数据、残差数据分量、趋势数据分量、周期数据分量)。将订单量时间序列分解为残差数据a(t),趋势数据b(t),周期数据s(t)后,就可以使用下面的公式预测未来不同时刻时刻的订单量,其中h表示未来时刻距离当前时刻的跨度。

外卖订单量,是按分钟统计的离散时间序列,所以如果需要预测下一分钟的订单量,令h=1。

(a)

(b)图3.5 某一段时间的外卖提单数据和Holt-Winters算法分解图

外卖报警模型中的预测器

在外卖订单量异常检测中,使用Holt-Winters预测器实时预测下一分钟订单量,每次需要至少5天以上的订单量数据才能有较好的预测效果,数据量要求比较大。

在实际的异常检测模型中,我们对Holt-Winters预测器进行了简化。预测器的趋势数据表示的是时间序列的总体变化趋势,如果以天为周期看待外卖的订单量时间序列,是没有明显的趋势性的,图3.5(b)的分解图也证明了这一点。因此,我们可以去掉其中的趋势数据部分。

各部分的迭代公式简化为(3-1):

预测值:

h越大,预测值Yhat[t+h] 的误差也就越大。实时的订单流监控,令h=1,每当有新的监控数据时,更新输入序列,然后预测下一分钟数据。

Holt-Winters每一次预测都需要大量的输入数据序列。从上面模型的简化公式可以看出,对残差数据a(t)的预测是对序列(a(t-m),a(t-m+1),...a(t-2),a(t-1))的一次指数滑动平均,对周期数据s(t)的预测是对序列(s(t-mk) ,s(t-(m-1)k),...s(t-k))的一次滑动平均,大量的输入数据是用于周期数据s(t)的计算。

a(t)和s(t)是互相关联的迭代计算过程,如果从周期性角度看公式(3-1),可以发现:计算当前周期内的a(t)时,使用的是上一周期计算出来的s(t-k),当前周期计算出的s(t)是用于下一周期a(t+k)的计算。为了将算法应用到线上的实时预测,我们可以将Holt-Winters算法拆分为两个独立的计算过程:

  1. 定时任务计算序列的周期数s(t)。
  2. 对残差序列做实时预测。

下面就分别从这两个步骤介绍外卖报警模型中的预测器实现。

计算序列的周期性数据

时间序列的周期性数据不需要实时计算,按周期性更新即可,如外卖订单大盘监控,s(t)只需要每天更新一次即可。对于s(t)的计算,可以有多种方法,可以使用上面提到的Holt-Winters按公式(3-1)计算出时间序列的周期性数据(如图3.5b所示),或直接使用前一天的监控数据作为当天的周期数据(这两种方式都需要对输入序列进行预处理,保证算法的输入序列不含有异常数据)。也可以用上面3.2节提到的,将历史数据做平均求出基线作为序列的周期性数据。

目前外卖订单中心报警模型采用的是Holt-Winters计算周期数据的方式。在将该模型推广到外卖其他业务线监控时,使用了计算基线数据作为周期数据的方式,这里简单对比一下两种方式的优劣。

使用Holt-Winters算法计算周期数据
  • 优点:如果序列中含有周期性的陡增陡降点,Holt-Winters计算出的周期数据中会保留这些陡增陡降趋势,因此可以准确的预测出这些趋势,不会产生误报。比如外卖订单的提单数据,在每天的某个时刻都有一个定期陡降,使用该方式可以正确的预测出下降的趋势。如图3.6所示,蓝色线是真实数据,棕色线是预测数据,在该时刻,棕色线准确的预测出了下降点。
  • 缺点:需要对输入数据进行预处理,去除异常数据。如果输入序列中含有异常数据,使用Holt-Winters时可能会把这些异常数据计算到周期数据中,影响下一周期的预测从而产生误报(Holt-Winters理论上也只是滑动平均的过程,因此如果输入数据中含有比较大的异常数据时,存在这种可能性,实际应用中订单的报警模型也出现过这种误报)。

图3.6 Holt-Winters周期数据预测

历史数据平均求基线
  • 优点:计算出的周期数据比较平滑,不需要对输入序列进行预处理,计算过程中可以自动屏蔽掉异常数据的影响,计算过程简单,如图3.3所示的基线数据。
  • 缺点:周期数据比较平滑,不会出现陡增陡降点,因此对于周期性出现的陡增陡降不能很好的预测,出现误报。比如外卖活动的大盘(如图3.7所示,红线是真实数据,黑线是预测数据),提前下单优惠在每天某个时刻会出现周期性陡降,使用该方式会出现误报。

图3.7 基线周期数据预测

两种求周期数据的方式各有优劣,可以根据各自的监控数据特点选择合适的计算方式。如果监控数据中含有大量的周期性的陡增陡降点,那么推荐使用方式1,可以避免在这些时间点的误报。如果监控数据比较平滑,陡增陡降点很少,那么推荐方式2,计算简单的同时,也能避免因输入数据预处理不好而造成的意料之外的误报。

残差数据实时预测

计算出周期数据后,下一个目标就是对残差数据的预测。使用下面的公式,实际监控数据与周期数据相减得到残差数据,对残差数据做一次滑动平均,预测出下一刻的残差,将该时刻的残差、周期数据相加即可得到该时刻的预测数据。残差序列的长度设为60,即可以得到比较准确的预测效果。

对于实时预测,使用的是当天的周期数据和前60分钟数据。最终的预测结果如图3.8(a)(b)所示,其中蓝色线是真实数据,红色线是预测数据。

(a)

(b)图3.8 预测结果曲线

比较器设计

预测器预测出当前时刻订单量的预测值后,还需要与真实值比较来判断当前时刻订单量是否异常。一般的比较器都是通过阈值法,比如实际值超过预测值的一定比例就认为该点出现异常,进行报警。这种方式错误率比较大。在订单模型的报警检测中没有使用这种方式,而是使用了两个串联的Filter(如图4.1所示),只有当两个Fliter都认为该点异常时,才进行报警,下面简单介绍一下两个Filter的实现。

图4.1 比较器模型

  • 离散度Filter:根据预测误差曲线离散程度过滤出可能的异常点。一个序列的方差表示该序列离散的程度,方差越大,表明该序列波动越大。如果一个预测误差序列方差比较大,那么我们认为预测误差的报警阈值相对大一些才比较合理。离散度Filter利用了这一特性,取连续15分钟的预测误差序列,分为首尾两个序列(e1,e2),如果两个序列的均值差大于e1序列方差的某个倍数,我们就认为该点可能是异常点。
  • 阈值Filter:根据误差绝对值是否超过某个阈值过滤出可能的异常点。利用离散度Filter进行过滤时,报警阈值随着误差序列波动程度变大而变大,但是在输入数据比较小时,误差序列方差比较小,报警阈值也很小,容易出现误报。所以设计了根据误差绝对值进行过滤的阈值Filter。阈值Filter设计了一个分段阈值函数y=f(x),对于实际值x和预测值p,只有当|x-p|>f(x)时报警。实际使用中,可以寻找一个对数函数替换分段阈值函数,更易于参数调优。

图4.2 分段阈值Filter

报警模型最终效果

最终的外卖订单异常报警模型结构图如图5.1所示,每天会有定时Job从ETL中统计出最近10天的历史订单量,经过预处理模块,去除异常数据,经过周期数据计算模块得到周期性数据。对当前时刻预测时,取60分钟的真实数据和周期性数据,经过实时预测模块,预测出当前订单量。将连续15分钟的预测值和真实值通过比较器,判断当前时刻是否异常。

图5.1 报警模型结构图

新的报警模型上线后,外卖订单量的异常检测的漏报率和误报率都有显著的提升,上线半年以来,对于每一次的异常都能准确的检测出来,漏报率近乎为0。误报率在通常情况下限制在了每周0~3次误报。

报警模型目前应用在外卖订单量的异常检测中,同时推广到了外卖业务的其他各种大盘监控中,取得了不错的效果。在报警模型上线后,我们发现并解决了一些系统隐患点,如:

  • 点评侧外卖提单量在每天定时有一个下降尖刺,经过排查是因为客户端冷启动短时间内大量的请求,导致SLB性能达到瓶颈,从而导致接口成功率下降。
  • 点评侧外卖订单取消量经常会有尖刺,经过排查发现是由于在支付时,需要进行跨机房的账号转换,专线网络抖动时造成接口超时。
  • 外卖订单量在每天某些时刻都有陡降趋势,经过排查,是因为这些点大量商家开始休息导致的。

总结

机器学习中的预测算法运用到外卖订单的异常检测中,极大的提高了异常检测的准确性和敏感性,提升了系统稳定运维的效率。该报警模型也有很广泛的应用场景,美团点评的各个业务线的监控数据,绝大多数都是含有明显周期性的时间序列,本文提出的模型都能运用到这些监控数据的异常检测中。

当然,模型还有进一步完善的空间,如:

  • 历史数据的预处理优化。在进行周期数据计算时,对于输入序列的预处理,如果能够排除绝大部分的异常数据,那么最终检测的误报率将会进一步的降低。
  • 在不会产生持续误报的情况下替换有异常的实时数据。对于当前数据的预测,利用的都是前60分钟的真实数据,但是这些数据可能本身就存在异常数据,那么就存在一种情况,当出现异常时,真实数据开始下跌,预测数据紧接着也会下跌(如图3.8b所示)。这种情况有时候可能满足需求(比如只在异常开始的时候进行报警,异常持续时间内不再报警,防止报警太多造成的信息轰炸),有时候可能不满足需求(比如要求预测数据不跟随异常变化而变化,这种情况可以应用在故障期间的损失统计中)。如果需要预测值不随异常变化而变化,一种可能的方法是,当检测到当前数据是异常数据时,将预测数据替换当前的真实数据,作为下一时刻预测器的输入,这样可以防止异常数据对于下一时刻预测值的影响。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-04-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 美团点评技术团队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
取连续15分钟的预测误差序列,分为首尾两个序列(e1,e2),如果两个序列的均值差大于e1序列方差的某个倍数...请问这里的首尾两个序列指的是什么?是将当前时刻的前十五分钟的预测误差序列分为两个序列吗?
取连续15分钟的预测误差序列,分为首尾两个序列(e1,e2),如果两个序列的均值差大于e1序列方差的某个倍数...请问这里的首尾两个序列指的是什么?是将当前时刻的前十五分钟的预测误差序列分为两个序列吗?
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
[业界方案] 智能运维AIOps-学习笔记
目的是对于所学习的技术,大致知道其应用领域,技术特点和未来方向,看看目前工作中是否可以用到,或者以后选型时能够做到心里有数,顺便也可以梳理清楚自己的知识体系。
罗西的思考
2020/09/07
3.4K0
干货 | 故障召回率提升34%,携程智能异常检测实践
携程作为在线旅游公司,对外提供机票、酒店、火车票、度假等丰富的旅游产品,其系统稳定性关乎用户是否具有顺滑的出行体验。然而,流量激增、代码发布、运维变更等都会给系统稳定性带来挑战。
携程技术
2023/09/06
9940
干货 | 故障召回率提升34%,携程智能异常检测实践
【时间序列】时间序列的智能异常检测方案
时间序列异常检测是学术界和工业界一直研究的热点和难点问题。比如腾讯内部开源的Metis项目,其实现思路是基于统计判决、无监督和有监督学习对时序数据进行联合检测。通过统计判决、无监督算法进行首层判决,输出疑似异常,其次进行有监督模型判决,得到最终检测结果。检测模型是经大量样本训练生成,可根据样本持续训练更新。Metis实现的时间序列异常检测学件在织云企业版本中已覆盖 20w+ 服务器,承载了 240w+ 业务指标的异常检测。经过了海量监控数据打磨,该学件在异常检测和运维监控领域具有广泛的应用性。
roganhuang
2020/07/29
23.3K2
【时间序列】时间序列的智能异常检测方案
从零开始构建业务异常检测系统,FreeWheel面临过的问题和解决方案
作者 | 钟雨 背   景 在公司运行过程中,尤其是对于偏重数据的互联网公司,业务异常检测是一个非常重要但又很容易被轻视的工作。一旦因为业务发生异常并且没有被及时发现,一定会对公司和客户产生某种程度的损失,从而影响业务正常发展。很多公司都构建了基于规则的报警平台,并将其应用于业务的异常检测。但由于数据模式的快速变化,并且数据中存在着大量噪音,基于规则的异常检测误报率较高。基于机器学习和人工智能的业务异常检测可以获得比传统规则系统更高的准确率和扩展性,但由于面临诸如异常的定义较为模糊、缺少数据标签等诸多
深度学习与Python
2023/03/29
5670
从零开始构建业务异常检测系统,FreeWheel面临过的问题和解决方案
美团外卖自动化业务运维系统——Alfred
背景 美团外卖业务在互联网行业是非常独特的,不仅流程复杂——从用户下单、商家接单到配送员接单、交付,而且压力和流量在午、晚高峰时段非常集中。同时,外卖业务的增长非常迅猛,自2013年11月上线到最近峰
美团技术团队
2018/03/13
1.9K0
美团外卖自动化业务运维系统——Alfred
探索可观测性:AIOps中的时序数据应用
随着科技的发展,时序数据在我们的认知中占据越来越多的位置,小到电子元件在每个时刻的状态,大到世界每天的新冠治愈人数,一切可观测,可度量,可统计的数据只要带上了时间这个重要的因素就会成为时序数据。在运维领域,时序数据的范围则缩小到软件系统及其关联事物上面。随着数字化,物联网,人工智能等新技术的蓬勃发展,时序数据在运维领域也产生了爆发的增长,那么,究竟什么是时序数据,时序数据在智能运维(AIOps)领域又能为人们带来哪些价值呢?本文将会围绕这两点进行阐述,并拓展介绍一些具体应用时序数据的算法。
嘉为蓝鲸
2022/12/01
1.3K0
探索可观测性:AIOps中的时序数据应用
数据分析中应该了解的几种常用预测方法
如上图所示,假如现在我们要想估算主体B的属性③的数值(橙色标记目标数据),那么我们可以找到和B类似(AB在属性②、④上相似)且同时具有属性③的主体A,如果主体A的属性③是已知的,那么该数值可以当做主体B属性③的估算值,如果可以匹配的已知相似属性更多,得到的值一般更精确。
1480
2019/07/30
2.4K0
干货 | 携程火车票异常检测和根因定位实践
携程火车票包含1000+的业务指标,人工监测指标的异常情况耗时费力,而由于业务差异,基于规则和简单统计学的检测方案只能覆盖到单个指标或者单类指标,并且不能随着新业务上线或者功能变动灵活动态的调整相应的规则,并不适用于大量不同业务线的指标。我们希望使用AI算法来代替人工,对指标进行全自动的监控,旨在发现指标的异常和导致异常的潜在原因。
携程技术
2023/10/24
1.1K0
干货 | 携程火车票异常检测和根因定位实践
干货 | 携程实时智能异常检测平台的算法及工程实现
陈剑明,携程网站运营中心数据分析高级经理,负责网站容量规划、ATP基线预测及RCA损失计算、成本分摊、运维数据仓库建设,利用机器学习和深度学习相结合,进行运维方向的数据分析与预测。
携程技术
2019/04/22
3.4K0
干货 | 携程实时智能异常检测平台的算法及工程实现
干货 | 关于数据的异常检测,看这一篇就够了
束开亮,携程大市场部BI团队,负责数据分析与挖掘。同济应用数学硕士,金融数学方向,法国统计学工程师,主修风险管理与金融工程。
携程技术
2019/04/22
5.9K0
干货 | 关于数据的异常检测,看这一篇就够了
IT运维要求稳,少了ta可真的不行
目前IT运维领域保证服务运行正常的主要方法是对相关运维指标进行实时监控,并根据经验设定一些规则,通过将实时监控的数据与规则进行对比,当某个指标监控值不符合设定的规则时,则判定为异常的状况,这样的话就会发送对应的告警到告警平台。告警平台收到通知后,会分配给对应的运维人员进行处理,运维人员去根据告警信息来排查,最终定位故障的根本原因,并对故障进行修复。从这个流程可以看出,整个过程是以告警为中心,所以告警的质量是至关重要的。
云大学小编
2020/06/21
7580
IT运维要求稳,少了ta可真的不行
指标波动多大才算是异常?
导读:先举个例子,体温37.4度vs体温36.5度,只有2.5%的波动,可如果有人在测温点被发现体温37.4度,估计马上就被拉走做核酸。为啥?因为人们不是怕2.5%的波动,而是怕新冠!
Spark学习技巧
2023/03/21
8240
指标波动多大才算是异常?
数据导入与预处理-拓展-pandas时间数据处理03
数据导入与预处理-拓展-pandas时间数据处理01 数据导入与预处理-拓展-pandas时间数据处理02 数据导入与预处理-拓展-pandas时间数据处理03 备注:如果有帮助,欢迎点赞收藏评论一键三联哈~~
IT从业者张某某
2022/11/12
1.3K0
数据导入与预处理-拓展-pandas时间数据处理03
15种时间序列预测方法总结(包含多种方法代码实现)
在这篇文章中,我们将深入探讨时间序列预测的基本概念和方法。我们将首先介绍单元预测和多元预测的概念,然后详细介绍各种深度学习和传统机器学习方法如何应用于时间序列预测,包括循环神经网络(RNN)、一维卷积神经网络(1D-CNN)、Transformer、自回归模型(AR)、状态空间模型、支持向量机(SVM)和随机森林(RF)等。我们还会讨论这些方法在单元预测和多元预测中的适用性。
机器学习AI算法工程
2024/04/30
9.4K0
15种时间序列预测方法总结(包含多种方法代码实现)
用R语言做时间序列分析(附数据集和源码)
时间序列(time series)是一系列有序的数据。通常是等时间间隔的采样数据。如果不是等间隔,则一般会标注每个数据点的时间刻度。 下面以time series 普遍使用的数据 airline p
机器学习AI算法工程
2018/03/12
3.7K0
用R语言做时间序列分析(附数据集和源码)
深度学习+实时监控:运维不再靠“拍脑袋”!
在传统运维中,性能监控往往依赖于静态阈值报警,例如 CPU 超过 80% 就触发告警,内存占用超过 90% 就发邮件通知。但问题是,很多时候这些阈值根本不智能,不是误报一堆就是漏报不断。结果呢?运维工程师不是被“狼来了”骗得焦头烂额,就是错过关键异常导致故障升级。
Echo_Wish
2025/03/23
1600
深度学习+实时监控:运维不再靠“拍脑袋”!
时间序列基本概念、任务、预测方法
作者:东哥起飞,来源:Python数据科学 本文开启时间序列系列的相关介绍,从零梳理时序概念、相关技术、和实战案例,欢迎订阅 👉「时间序列专栏」 跟踪全部内容。 本篇介绍时间序列的定义、任务、构成以及预测方法,主要是基本概念的介绍和理解。 时间序列定义 时间序列,通俗的字面含义为一系列历史时间的序列集合。比如2013年到2022年我国全国总人口数依次记录下来,就构成了一个序列长度为10的时间序列。 专业领域里,时间序列定义为一个随机过程,是按时间顺序排列的一组随机变量 ...X_1,X_2,..X_T...
Python数据科学
2023/03/08
2.8K0
时间序列基本概念、任务、预测方法
【时序预测】时间序列分析——时间序列的平稳化
将非平稳时间序列转化成平稳时间序列,包含三种类型:结构变化、差分平稳、确定性去趋势。本文脉络框架如下:
roganhuang
2020/07/22
11.9K0
【时序预测】时间序列分析——时间序列的平稳化
打开我的收藏夹 -- Python时间序列分析篇
这两天,又接收到了不少新的讯息。我是越来越佩服“梦想橡皮檫”,檫哥了(打开周榜/总榜很好找,前排),他居然能用几年的时间来打磨一个系列。别说收39块,就是原价99我也买了,不为啥,就凭人家打磨了三年的毅力,我服!!!
看、未来
2021/09/18
8070
探索时间序列,预测未来
时间序列(time series)是按时间顺序记录的一组数据。其中观察的时间可以是年份,季度,月份或其它任何时间形式,为了方便表述,文中用 t 表示所观察的时间, Yt表示在时间t上的观测值。
herain
2022/04/27
5180
探索时间序列,预测未来
推荐阅读
相关推荐
[业界方案] 智能运维AIOps-学习笔记
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档