来自佳格天地的一篇ICDM workshop paper
Deep Learning Prediction of IncomingRainfalls: An OperationalServicefor the City of Beijing China
地址:https://ieeexplore.ieee.org/document/8955589
数据存在一定的噪声,本paper用的是233* 233的每六分钟一次的数据
数据原本是一个维度的数据图片,但为了观察方便进行如上图所示可视化,以RGB显示进行着色的伪彩色图像,由0dbZ到70dbZ的尺度条表示。
这里paper中是用一个模型来去噪的。
这个模型结合了Unet+Resnet+Sqeeze-and-Excitation
输入是三个时刻的数据,相当于RGB,输出是expert处理的mask文件。
其实白话来讲就是学习哪些部分是有先后变化的,哪些是random的,random的就是噪声之后去掉。
做降水预测都会有一些数据集的问题,正所谓数据量很大,但绝非什么时候都在下雨,所以为了让模型对rain天气学的更多,需要select一些数据,这个一般由自己的情况而定,这边的规则是:
毕竟场景是北京地区,所以要根据地区的形势来定,而非其他任务那样random rotation
SE-ResUnet
SE部分:(其实就是channel wise attention)
res block:(加上上面所示的attention,在temporal和spatial都存在)
15 对应于小雨, 35为中雨
左上角,右上角是预测的,对应于左下角右下角是真实的。
写这篇文章的时候刚好和第一作者宋博聊天,他说后期这个模型用的时候有一些经验也可以给大家分享下,以下是他发给我的:
这项深度学习工作是2018年北京市海淀区气象局委托北京佳格天地科技有限公司研发,用于服务北京市城市大脑的短时临近降雨预测。
2019年春天这项工作上线,到2019年秋天的模型迭代总结成了这篇文章。
在2020年,依据观察新的一个雨季,我们得出2020版本的总结,供业界同仁参照。