之前专门花了两篇推文来分别介绍两种常用时间序列模型:ETS(指数平滑法)和ARIMA(整合差分移动平均自回归法)的基本原理。本文就进入Power BI的用法篇。
前期准备
上图四个预测相关的视觉对象,都是通过R建立模型。因此,首先在电脑上安装R,同时设置Power BI能调用R。具体可参照这篇推文《R学习笔记 - Day1 简介》。在首次使用上述视觉对象的时候,Power BI会提示下载所需的包(Libraries),用户根据提示一步一步点击即可,无需手动在R上另外安装。
Forecasting TBATS
TBATS是季节性ARIMA模型的变体。基本原理跟ARIMA模型相似。这四个预测型视觉对象都只能拖入两个字段:时间字段和序列数值字段。
该视觉对象提供了相对较多的可以设置的功能。包括:
Forecast using Neural Network by MAQ
该视觉对象使用神经网络模型。该视觉对象不可调参,也基本不能调整图形设置。而且当数据集较大时,运算非常耗时。不建议使用。
Forecasting Using Multiple Models by MAQ
该视觉对象可选4种模型:
该视觉对象默认会将已有的数据集按0.75划分为训练集,0.25划分为测试集,计算出预测误差以及MAPE(平均绝对百分比误差),用以衡量模型的效果。用户可以修改数据集划分的比例。用户也可以选择手动对模型进行调参。详细用法参照这个视频。
Forecasting with ARIMA
这个是专门使用ARIMA的视觉对象。可以设置p,d,q和含季节性的P,D,Q参数。也可以开放数据导出的功能。
总结
时间序列预测本身是个复杂而又难以保证效果的工作。实操中,不可能简单套用任何模型,而需要对模型进行调参,或综合使用多种模型。甚至,由于现实世界的干扰因素远比模型的假设条件复杂,深耕具体行业的老手的个人经验可能比模型预测更加靠谱。
Power BI本身不适合建立复杂的预测模型,可以借助第三方工具(如R)去完成。但从上述介绍中我们可以看到,第三方视觉对象只是为这些模型的可视化提供了一定的可能性,所提供的调参功能非常有限。一方面,可调的参数范围有限,如ARIMA模型一般各参数不能超过3。另一方面,缺乏调参的辅助工具。如ARIMA模型在确定p、q时,可使用ACF和PACF函数。确定差分阶数(d)时,可用单位根检验等。这些调参工作,可以借助专门的工具(Python、R、SPSS、Eviews等)进行。
本文分享自 PowerBI x Python 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!