Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >MGRN:多源图关系显著提高模型预测能力

MGRN:多源图关系显著提高模型预测能力

作者头像
量化投资与机器学习微信公众号
发布于 2022-09-14 13:17:47
发布于 2022-09-14 13:17:47
6670
举报

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 作者:Qinkai Chen、Christian-Yann Robert

我们在上一篇推文中分享了一篇关于图相关算法在量化研究中的论文综述。从股价预测到组合优化,传统的图算法及图神经网络都有非常丰富的应用场景。今天分享的文章来自Journal of Financial Data Science的最新论文《Graph-Based Learning for Stock Movement Prediction with Textual and Relational Data》,本文与之前图神经网络相关文献最大的不同点体现在以下几处:

1、从新闻文本提取股票表征,并和股票图关系结合进行股票涨跌的预测,这样的结合优于根据新闻预测单个资产的价格走势。

2、上述步骤中,利用了多个图的关系(行业属性、供应链关系等)可以进一步提高预测精度。

3、作者设计了用于股票预测的多图递归网络,并通过准确性测试和交易模拟证明了该模型具有最先进的性能。

我们首先来看一下模型的整体结构(如下图):

  • 最左边是股票池里的股票在过去一段时间(作者选取的是过去1个交易日)的所有新闻。
  • 每篇新闻经过Financial News Encoder(采用的是Universal Sentence Encoder)提取Embedding,在把每只股票所有新闻的Embedding计算平均值,作为该股票当天的新闻的Embedding。
  • 把以上每个股票的Embedding最为图中每个股票节点的属性,分别输入到不同的图中,作者总共使用了以下三个图关系(最终以邻阶矩阵的方式进行定义):
    • 股价相关系数
    • 供应链关系(来自Facset)
    • 股票的行业属性(GICS)
  • 通过以上图神经网络提取的每个股票节点的表征,在与原始个股的新闻表征拼接在一起,得到每天每个股票的特征集。

最后再把这个特征序列输入到RNN(LSTM)模型,训练的目标是下一交易日股票的涨跌方向。

作者实证研究用的是STOXX Europe 600成分股,本文使用的新闻数据来自Bloomberg,并过滤掉每天新闻数量少于两篇的股票,以下是样例数据:

构件图关系的三个邻阶矩阵的热力图如下图所示,Panel A每个元素表示这两个股票的相关系数,Panel B表示两个股票是不是属于同一个Sector,Panel C表示两个股票之间是否存在供应链关系。

下表显示了在不同百分位(根据下一期涨跌幅分成10组)测试集上不同模型的准确性和MCC。我们发现我们的MGRN模型表现出最好的性能,在准确性和MCC方面优于其他基准模型。

我们比较了单图模型(MGRN-Corr, MGRN-Sector和MGRN-Supply)和无图模型(RNN)。我们发现所有的图关系都可以帮助提高性能,特别是对于最极端的分位组(一个更小的q值)。但是,很难说哪个图具有最佳性能,因为每个图在不同的百分位上具有不同的最佳性能。这也意味着每个图中的信息是互补的,使得将不同的图组合起来更加合理。通过比较完整模型(MGRN)和单一图模型,我们验证了我们的假设,即组合不同的图有助于提高模型性能。我们发现,当同时使用这三张图时,我们的准确性有显著提高证明了我们的模型可以同时从多个互补图中吸收必要的信息,验证了来自不同来源的组合关系的有效性。

我们还注意到,在某些情况下,添加图会导致比无图RNN更糟糕的结果。例如,当q = 10时,MGRN-Corr比RNN差。但是,当与其他图组合使用时,结果比单独使用任何图要好。这是因为错误通常来自于几个特定的股票,特别是当我们只有一个信息来源时。如果来源不正确,就会导致重大错误。使用多个图表的好处是,通过基于多个信息源做出决策,可以减少这些情况的影响。

下表显示策略模拟交易结果。我们还可以确认我们的MGRN模型优于其他模型,并且将图组合在一起是有益的。我们还发现,等权策略与市值权重策略具有相似的表现,表明对小盘股几乎没有偏差。

GICS行业分类有四个层级,我们比较了四个层级的表现,发现第三级别的biaoxian最好,特别是在更极端的分数上。因此,我们选择使用第三行业级别来构建图。详细的结果如下表所示。

总结

我们通过综合考虑财经新闻、多个基于图形的特征和新闻的时间模式来预测股票的走势。我们为这个任务引入MGRN模型。通过大量的实验和交易模拟,我们证明了模型结构的有效性。研究结果还证明,添加图关系信息,特别是来自多个来源的不同图关系信息,可以更好地预测股票的走势。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-09-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量化投资与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
QIML Insight:基于多源特征及机器学习的股票聚类模型
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号 独家解读 量化投资与机器学公众号  QIML Insight——深度研读系列 是公众号全力打造的一档深度、前沿、高水准栏目。 公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读
量化投资与机器学习微信公众号
2022/05/25
1.4K0
QIML Insight:基于多源特征及机器学习的股票聚类模型
[量化投资]万字综述,94篇论文分析股市预测的深度学习技术
论文 | Stock Market Prediction via Deep Learning Techniques: A Survey
核桃量化
2023/01/31
3.8K0
[量化投资]万字综述,94篇论文分析股市预测的深度学习技术
基于图神经网络、图谱型数据的收益预测模型(附代码)
传统的股价预测的时许模型,对于收益率的假设往往不切实际,而最近兴起的机器学习模型,特别是深度学习模型对于股价的预测也存在着明显的问题:
量化投资与机器学习微信公众号
2021/07/29
3.3K0
因子挖掘:基于图神经网络与公司主营(附代码)
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业20W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。
量化投资与机器学习微信公众号
2021/11/23
1.6K0
A股实践 :图神经网络与新闻共现矩阵策略(附代码)
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号独家撰写 感谢ChinaScope对本文提供数据支持 核心观点 本文在Qlib已实现的图神经网络模型GATs上进行改进,引入以基于数库SmarTag新闻分析数据的共现矩阵作为显性图关系; 实证
量化投资与机器学习微信公众号
2022/04/13
2K0
A股实践 :图神经网络与新闻共现矩阵策略(附代码)
深度学习LSTM-RNN建立股票预测模型
  此次股票价格预测模型仅根据股票的历史数据来建立,不考虑消息面对个股的影响。曾有日本学者使用深度学习的方法来对当天的新闻内容进行分析,以判断其对股价正面性/负面性影响,并将其与股票的历史数据相结合,各自赋予一定的权重来对近日的股价进行预测[1]。该预测方法取得了一定的效果。
机器学习AI算法工程
2019/10/28
2.7K0
深度学习LSTM-RNN建立股票预测模型
HIST模型的A股实践:基于主营产品分项(附代码)
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 核心观点 本文将公司主营产品分项为预定义概念的 HIST 模型作为实验组,每只股票可对应多个预定义概念;将行业分类作为预定义概念的 HIST模型作为对照组,每只股票只对应一个预定义概念。 在实测时补充加入了预定义概念 po
量化投资与机器学习微信公众号
2022/04/25
1.8K1
HIST模型的A股实践:基于主营产品分项(附代码)
从《繁花》到现实,现代版“宝总”如何通过智能手段预测股市?
在导演王家卫看来,《繁花》“表面是饮食男女,里面是山河岁月,时代变迁”。剧中主角阿宝凭借精准的投资预判和灵活的操作策略,在资本市场的博弈中完成了从散户到“宝总”的华丽转身。而宝总起家的背后,便是抓住了A先生股票投资失败的契机,这一戏剧性转折生动揭示了股市风险无处不在,即便是实力雄厚的大户也可能面临惨痛损失。
可信AI进展
2024/01/19
2850
从《繁花》到现实,现代版“宝总”如何通过智能手段预测股市?
深度学习在股市的应用概述
股票市场预测由于其非线性、高度波动性和复杂性,一直是个复杂的问题。近年来,深度学习在许多领域占据了主导地位,在股市预测方面取得了巨大的成功和普及。本文以深度学习技术为重点,对其应用于股市预测研究进行结构化和全面的概述,介绍了股市预测的四个子任务及股市预测主流模型,并分享了一些关于股市预测的新观点及未来的几个方向。
算法进阶
2023/09/15
1.1K0
深度学习在股市的应用概述
News Co-Occurrences:关注同时出现在新闻中的股票
量化投资与机器学公众号 QIML Insight——深度研读系列 是公众号今年全力打造的一档深度、前沿、高水准栏目。
量化投资与机器学习微信公众号
2021/07/07
8300
News Co-Occurrences:关注同时出现在新闻中的股票
AAAI 2021:仅有的8篇量化投资论文(论文+代码)
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业20W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。
量化投资与机器学习微信公众号
2021/10/12
4.2K10
Two Sigma:Machine Learning Models of Financial Data
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 机器学习是当前金融建模、预测和决策的最先进技术。然而,实现这一潜力需要克服许多复杂的挑战。在本次演讲中,Two Sigma的Justin Sirignano——他也是牛津大学数学副教授——讨论了金融领域机器学习的机遇和挑战
量化投资与机器学习微信公众号
2022/09/02
7220
Two Sigma:Machine Learning Models of Financial Data
【工具】社交数据与行为金融学如何实现超越大盘、绝对收益量
一、互联网让大数据就在身边   互联网作为改变人类历史的产物,近年来得到了飞速的发展,随着互联网的日益普及,其正在逐渐改变人们的生活习惯。商场的购物份额正在被足不出户的网络购物所侵蚀;新闻媒介受到铺天盖地的网络资讯冲击,纸媒生存空间日益狭隘;人与人之间的联系不再局限于写信、电话,微博、网络电话等互联网工具日新月异;旅行社的预定功能难以抗衡网络预定宾馆、机票的透明度;就医、就餐无需再早早敢去排队,网络预约极大的提高了便利性;更为典型的是,具备搜索功能的互联网,正在逐步替代字典、地图乃至百科全书等一系列具备查询
小莹莹
2018/04/19
1.3K0
【工具】社交数据与行为金融学如何实现超越大盘、绝对收益量
A股市场机器学习多因子模型实证
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号 独家解读 量化投资与机器学公众号  QIML Insight——深度研读系列 是公众号全力打造的一档深度、前沿、高水准栏目。 公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读者呈
量化投资与机器学习微信公众号
2022/09/08
1.2K0
A股市场机器学习多因子模型实证
来!新闻流与股价跳跃、图数据应用综述、机器学习与有效前沿
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 资产价格的跳跃已经被认为是许多金融和经济决策的重要因素,例如投资组合重新平衡、衍生品定价以及风险度量和管理。股票价格的大幅波动可能与市场上重要的信息流(如超预期收益)有关,这一直观的想法启发了许多与股票收益跳跃建模相关的
量化投资与机器学习微信公众号
2022/09/08
3810
来!新闻流与股价跳跃、图数据应用综述、机器学习与有效前沿
基于三大图谱网络和HIST模型的A股策略研究
在之前的文章中,我们分别构建了产业链关系网络、供应链关系网络和新闻共现关系网络,都做了图聚类,并分析了各类关系下和集群内外股票间收益率相关性,最终也都得出了“关联股票比非关联股票表现出更强相关性,集群内股票比集群外股票也表现出更强相关性”的结论,三大网络关系和三大集群属性能提供有用的增量信息。本文将进一步以这些集群属性为预定义概念,借助 HIST模型提取集群的共有信息用于预测股票未来收益。
量化投资与机器学习微信公众号
2023/09/05
9160
基于三大图谱网络和HIST模型的A股策略研究
基于『成交数据』的股票联动研究
受市场各参与方及资金流动等相互作用,不同股票之间往往会表现出价格联动或共振的现象。随着市场高频交易参与度的增加,这种共振的现象愈发明显。本文中,作者使用高频的成交数据来研究股票间共同成交(文中称为co-trading,即一只股票发生成交的极短时间内,另一只股票也发生成交)的现象,构建了co-trading network来对股票市场复杂的联动进行建模。
量化投资与机器学习微信公众号
2023/04/20
5260
基于『成交数据』的股票联动研究
告别RNN,迎来TCN!股市预测任务是时候拥抱新技术了
选自towardsdatascience 作者:Bryan Tan 机器之心编译 编辑:魔王、陈萍 本文介绍了 TCN 在股市趋势预测任务中的应用,表明在集成新闻事件和知识图谱后,TCN 的性能大幅超过 RNN。 本文主要介绍了以下几部分内容: 1. 金融时间序列(FTS)中的深度学习背景介绍; 2. 值得关注的 FTS 数据处理实践; 3. 时间卷积网络(TCN); 4. 时间卷积网络在 FTS 中的应用实例; 5. 基于 TCN 的知识驱动股市趋势预测与解释。 1. 背景介绍 金融时间序列(FTS)建
机器之心
2023/03/29
1K0
告别RNN,迎来TCN!股市预测任务是时候拥抱新技术了
解密Prompt系列28. LLM Agent之金融领域智能体:FinMem & FinAgent
本章介绍金融领域大模型智能体,并梳理金融LLM的相关资源。金融领域的大模型智能体当前集中在个股交易决策这个相对简单的场景,不需要考虑多资产组合的复杂场景。交易决策被简化成市场上各个信息,包括技术面,消息面,基本面等等在不同市场情况下,对资产价格变动正负面影响的综合判断。
风雨中的小七
2024/04/24
2.3K0
解密Prompt系列28. LLM Agent之金融领域智能体:FinMem & FinAgent
用AlphaGo来做股票交易会怎样?机器学习预测股票靠谱么?
今天李世石已连续输掉了第二局,粗看下来,后面几盘似乎已没啥悬念了。无疑,这是一个伟大的时刻,也是个伟大的开始,超级智能机器在未来将会在人类生活中扮演更多更重要的角色。 资本市场,越来越多的量化策略与量化交易,越来越多的机器在介入,以前散户面对的是同样赤手空拳的空头,但现在我们面对的是高度智能的机器以及加杠杆的赌徒,以前跌一年,现在一周搞定,信息传播越来越快,人心预期转化也特别迅速,于我们,更需要理性,纪律与底线。 Alpha Go的优势: 无比强大的数据分析能力。对于公司的财务、行业的数据,未来的趋势,依据
机器学习AI算法工程
2018/03/13
1.1K0
用AlphaGo来做股票交易会怎样?机器学习预测股票靠谱么?
推荐阅读
相关推荐
QIML Insight:基于多源特征及机器学习的股票聚类模型
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档