服务量化投资,基于知识图谱的事件表征框架研究入选SIGIR

机器之心专栏

瞰点科技 AI 团队

瞰点科技和上海交大的研究团队提出了一种服务于量化投资的基于知识图谱的事件表征框架,称为 Knowledge Graph-based Event Embedding Framework(KGEEF)。通过在真实股票市场上进行的大规模实验表明,本文提出的方法显著有助于量化投资的策略提升。

研究表明金融市场对于新闻事件的反应具有滞后性,并且相同事件对不同股票在不同时间段内的影响程度都是有差异的。如何将富含信息量的新闻事件融合进量化投资模型中是工业界与学术界面临的共同挑战。针对上述问题,瞰点科技与上海交大研究团队共同研发了基于知识图谱的事件表征框架来服务于量化投资模型策略。该成果发表于 ACM SIGIR 中,由于在表征中嵌入了金融领域知识图谱,所以使用上述表征构建的投资策略在真实股票市场中获得了良好的收益表现。

服务量化投资,基于知识图谱的事件表征框架研究入选SIGIR

简介

金融市场的价格波动是对新闻和事件的一种反应。通常来说,从海量新闻中获取有效的事件表征能辅助投资者采取更合理的决策。近年来,一些研究开始应用自然语言处理(NLP)技术来学习新闻事件的分布式表征并基于此构建事件驱动的交易策略。

经典方法(例如 bags-of-words、命名实体)可以捕获事件元组中的基础特征,但是这些特征并没有反应事件之间的内在关系。随着表征学习和 NLP 技术的发展,研究者开始利用深度学习等技术来表征结构化事件,这样相似的事件即可以在特征空间中更加接近。然而股票的价格波动不仅取决于其自身的情况,与其关联的企业所涉及的事件也高度相关。因此,如何从这种彼此关联的事件信息中学习有效表征是量化投资领域的重要课题。

服务量化投资,基于知识图谱的事件表征框架研究入选SIGIR

论文地址:https://dl.acm.org/doi/abs/10.1145/3397271.3401427

在本文中,瞰点科技和上海交大的研究团队提出了一种服务于量化投资的基于知识图谱的事件表征框架,我们称之为 Knowledge Graph-based Event Embedding Framework(KGEEF)。该框架首先从原始新闻文本中提取结构关系和事件元组,将关系知识和属性知识存储在金融知识图谱(FinKG)中,其中节点表示实体,边对应实体之间的关系。随后,KGEEF 将知识图谱与事件一起学习联合表征,用于后续量化投资预测模型。最后,通过在真实股票市场上进行的大规模实验表明,本文提出的方法显著有助于量化投资的策略提升。

模型和方法

服务量化投资,基于知识图谱的事件表征框架研究入选SIGIR

图 KGEEF 框架

本文提出的方法主要包含三层:

1)多源输入层:将原始文本转换为事件元组(Event Tuple)、关系元组(Relation Tuple)和知识图谱(FinKG)。本文使用序列学习模型来检测新闻文本中的实体关系,然后将检测出的实体关系存储在知识图谱中。

2)事件表征学习层:将预训练的事件元组、关系元组和节点在知识图谱中的表征作为输入,得到事件层(Event Layer)、图谱层(Graph Layer)、关系层(Relation Layer)的中间特征。随后使用 Multi-source Attention 网络学习多个来源的共同特征作为输出。

3)检测与优化层:以实体、事件和图谱特征为输入,学习其是一个真实事件或关系的可能性,并且采用事件损失和关系损失联合优化的方法对模型进行训练。

服务量化投资,基于知识图谱的事件表征框架研究入选SIGIR

图 量化投资事件表征工作流

上图展示了量化投资事件表征的工作流程,主要包含四个模块:

历史语料库图谱建设模块(KG Construction):通过关系检测模型从原始新闻语料库生成实体关系。如果检测到关系,则在知识图谱中储存下来。

事件表征学习模块(Event Presentation Learning):该模块以事件和知识图谱作为输入,生成训练好的模型以及相应的表征词典。

新事件处理模块(New Event Process):从新闻数据中提取事件元组,然后利用构建的知识图谱和表征词典获得相应事件和实体的特征。

量化投资模块(Quantitative Investment):以事件和图谱的联合特征作为输入,输出用于量化投资的预测推断。

展开阅读全文

页面更新:2024-05-14

标签:表征   图谱   框架   语料库   事件   知识   上海交大   股票市场   实体   模块   模型   特征   关系   方法   数码   新闻

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top