金融情报挖掘是情报领域的一个重要分支,通过对金融领域信息进行提取和分析,发现关联线索,对传导关联进行建模,能够挖掘出市场变动的规律,最终辅助决策。
例如,国内外资本市场,衍生品市场热点不断,如“原油跌停”、“智利地震”、“美股暴跌”、“华鑫期货违反法律法规”、“期货公司抵制文华财经”等,这些事件涉及多个金融机构、人物、产品等多类实体。
通过舆情分析,寻找这些事件之间的传导关系,对市场产品(国债期货、股指期货)趋势的影响有着重要意义。
通过舆情分析,寻找这些事件之间的传导关系,对市场产品(国债期货、股指期货)趋势的影响有着重要意义。
本文以该任务为研究对象,对任务的抽象、任务的评估、任务的实现以及总结等几个方面的内容进行介绍。
一、任务的抽象
每天公开的资讯文本中包含了大量的期货相关信息,以“事件”为角度,对资讯中关联的事件、实体、实体关系、事件关系进行舆情分析,目标是挖掘出事件之间的传导关系、事件的舆情信息以及该事件下对市场可交易产品趋势的影响。
为此,我们对该任务进行进一步抽象,即:
输入:
某一时间段中的财经领域公开文本
输出:
1)以该公开文本数据集为基础形成的事件聚合;
2)热点事件列表与排序;
3)事件与资讯、资讯与实体之间的实体关联;
4)舆情数据对实体影响的可解释性路径及大小;
5)影响实体走势的因素分析与排行。
二、 任务的评估
信息提取技术、事件聚合技术、知识图谱技术以及时序分析技术是实现这一目标的重要技术点。其中:
信息提取,需要完成对既定的实体类型、实体关系以及实体属性的提取,事件识别以及事件因果逻辑提取;
事件聚合,通过对相似文本进行判定和聚合,利用资讯去重与聚合技术,形成不同事件主题下相关的文本聚类,得到事件与文本之间的关联关系;
知识图谱,包括对期货领域知识的组织、构建以及应用(具体包括关联可视化以及关系推理等);
时序分析,包括在不同时间窗口中的事件序列识别、市场交易物影响走势推理、可解释性的影响因素分析等。包括事