GitHub链接:https://github.com/microsoft/ProbTS
论文链接:https://arxiv.org/abs/2310.07446v4
在各个行业的时间序列预测应用中,跨越不同预测时长提供精确的点预测和分布预测是一项重要且持久的挑战。此前关于深度学习模型在时间序列预测中的研究往往集中在单一方面,如长期点预测或短期概率估计。这种狭隘的关注可能会导致方法选择的偏颇,并限制这些模型在未知情境中的适应性。尽管开发通用预测模型的趋势日益增长,但对于其优缺点的全面理解,特别是涉及到点预测和分布预测等基本预测需求时,依然不足。
本文提出了ProbTS,这是一种设计为统一平台的基准工具,用于评估这些基本预测需求,并对近年来的众多前沿研究进行严格的比较分析。作者剖析了不同预测需求所产生的独特数据特征,并阐明了这些特征如何在典型研究过程中偏向方法选择,进而未能完全满足基本预测需求。在此基础上,审视了最新的通用时间序列预测模型,发现本文对方法优势和劣势的分析也适用于这些通用模型。最后,本文概述了当前研究的局限性,并强调了未来探索的几条途径。
ProbTS的核心模块和主要流程如图1所示。
模型:ProbTS的模型模块明确区分了关键的方法决策,特别是解码方案(AR vs NAR)和分布估计方法。自回归(Autoregressive,简称 AR)方法:这些方法逐步生成预测,使用先前的预测作为未来时间步的输入,适用于序列依赖性至关重要的场景。非自回归(Non-autoregressive,简称 NAR)方法:这些方法同时为所有时间步生成预测,提供更快的预测速度,并且可能在长程预测中表现更好。
01-分析经典时间序列预测模型
作者研究了来自不同研究分支的传统非通用时间序列模型:一个分支侧重于开发定制的神经架构以适应长期点预测,另一个分支则专注于创建用于短期分布预测的先进概率方法。
作者还比较了自回归(AR)和非自回归(NAR)两种方法在不同预测长度、不同趋势性、周期性时序数据时的差异。结果显示:(1)随着预测长度的增加,自回归 AR 模型可能受到错误累积的影响。(2)强烈的趋势效应可能导致 NAR 和 AR 模型之间的显著性能差异。(3)基于 AR 的模型在具有强周期性模式的场景中表现更好,这很可能是由于它们在这种情况下具有更高的参数效率。(4)趋势性和周期性对性能差异具有综合影响。
02-分析经典时间序列预测模型
作者还探讨了最近基础模型在通用时间序列预测中的能力,重点关注在不同预测时长下的表现以及在估计分布方面的能力,特别是它们在未见数据集上的零样本转移能力。
应对延长预测时长中的AR解码挑战
图4a展示了各种时间序列基础模型在不同预测时程下表现的演变。在较短时程内,诸如TimesFM和Timer这类基于AR的基础模型表现出与MOIRAI等基于NAR模型相媲美的竞争力。然而,随着预测时程的延长,基于NAR解码的优势日益显现,如图中TimesFM与MOIRAI之间性能差距的扩大所示。这是由于基于AR方法在长期时间序列预测中可能存在显著的误差累积问题。鉴于AR解码的固有优势,如其在捕捉强季节性方面的优越性以及在某些短期预测场景中的稳健表现,显然有必要进一步研究如何克服其在长期预测环境中的局限性。这可能为增强AR基础时间序列模型在更广泛预测时程下的灵活性和效果开辟新途径。
解决复杂数据分布的关键作用
图4b描绘了在高非高斯性数据分布环境中,MOIRAI和Chronos等主要概率时间序列基础模型相对于最佳短期概率模型CSDI在CRPS指标上的增量变化。在高复杂数据分布的场景中,MOIRAI相对于CSDI的性能下降显著加剧。在特定情境下,基础模型可能无法完全取代专门针对特定领域精心设计和训练的传统模型。此外,将这些基础模型进行微调作为补救措施的前景较不经济可行,主要因为它们的尺寸显著较大。这突显了继续完善基础模型以增强其适应性和性能,并承认领域特定模型持续的相关性的重要性,特别是在处理复杂数据分布时可能需要更细腻的方法。