大模型文本语料库之 CnOpenDataA股上市公司全部公告数据

本文探讨了上市公司信息披露的规范化及其在新媒体时代的大数据体现,聚焦CnOpenData提供的详尽A股公告数据,覆盖2000年至2020年,包括年报、季报等26类公告,对市场研究有重要价值。

       根据2007年1月30日证监会令第40号公布的《上市公司信息披露管理办法》,为规范发行人、上市公司及其他信息披露义务人的信息披露行为,上市公司应当及时、准确、完整地披露相关信息,包括招股说明书、募集说明书、上市公告书、定期报告和临时报告等。

  一份及时、准确的上市公司公告足以给投资者利空或利好的信号、影响实时市场,而回溯历年上市公司公告,又能够实现学术研究中的按图索骥——市场反应、投资者情绪、公司业绩……在当下新媒体时代,上市公司公告的市场反应则更为强烈迅速,而这些都能够通过大数据来体现。

  CnOpenDataA股上市公司全部公告数据时间范围为2000年至2020年,共涵盖年报、半年报、三季报、公司治理、股东大会、日常经营等26个类型公告,囊括股票代码、公司名称、公告标题、公告时间、分类、行业、年度等字段,信息量极全,对A股上市公司研究、证券市场研究等方面起到有力的数据支撑。

  由于本数据文件众多,CnOpenData择取了年报、季报、招股说明书、社会责任报告等重点模块做字段及样本展示,最终数据样式以Excel数据列表和相应的PDF文件呈现。


时间区间

截至2021.6.30


表格展示

A股上市公司公告数据表格展示
年报
半年报
三季报
一季报
补充更正
澄清致歉
董事会
风险提示
内容概要:本文介绍了一个基于Google Earth Engine(GEE)平台的JavaScript函数库,主要用于时间序列数据的优化与子采样处理。核心函数包括de_optim,采用差分进化算法对时间序列模型进行参数优化,支持自定义目标函数、变量边界及多种变异策略,并可返回最优参数或收敛过程的“陡度图”(scree image);sub_sample函数则用于按时间密度对影像集合进行三种方式的子采样(批量、分段打乱、跳跃式),以减少数据量同时保留时序特征;配套函数ts_image_to_coll可将子采样后的数组图像还原为标准影像集合,apply_model可用于将优化所得模型应用于原始时间序列生成预测结果。整个工具链适用于遥感时间序列建模前的数据预处理与参数调优。; 适合人群:具备Earth Engine基础开发经验、熟悉JavaScript语法并从事遥感数据分析、生态建模等相关领域的科研人员或技术人员;有时间序列建模需求且希望自动化参数优化流程的用户。; 使用场景及目标:①在有限观测条件下优化非线性时间序列拟合模型(如物候模型)的参数;②压缩大规模时间序列数据集以提升计算效率;③实现模型验证与交叉验证所需的时间序列子集抽样;④构建端到端的遥感时间序列分析流水线。; 阅读建议:此资源为功能性代码模块,建议结合具体应用场景在GEE平台上实际调试运行,重点关注各函数的输入格式要求(如band命名、image属性设置)和异常处理机制,确保输入数据符合规范以避免运行错误。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值