最近看了印度友人关于建模的书,趁着思考还热乎,赶紧记下来:
期货PV行情落地、清洗;带时间戳的alternative数据(概指价量数据之外的数据)落地、清洗。两类数据按时间戳对齐,入数据库。要用的时候生成raw data的dataframe——这一步主要是力气活,对不同类别的数据,需要不同的dbClean脚本。
利用feature tools库,或者看论文总结各类因子,写成函数,给原始数据dataframe添加pd.assign(factor=column.map(function))——这一步代码不复杂,体现的是对市场逻辑的理解,因子库的更新是最需要长期精进、某种意义也是最重要的过程。
从sklearn中选定回归或者分类模型,挑选因子,划分train和test集,对收益率进行预测,解读预测效果和优化参数——侧重模型经济意义上的可解释性,要求一定的数学能力(概率统计为主)。
策略模型落到实盘,因为实盘情景是事件驱动,需要把开平仓信号代码尽可能写简洁,最简单的if_then即可,不要函数套函数,以免踩坑。
领取专属 10元无门槛券
私享最新 技术干货