中国上市公司年报文本+爬虫代码(2000-2023年)

部署运行你感兴趣的模型镜像

更新!2000-2023中国上市公司年报文本(爬虫代码+txt年报文本)

处理软件:Python 3.11

年度区间:2000-2023

年报数量:59160(其中包含2023年年报txt文件5185个

说明:本数据为2000-2023中国上市公司年报文本,已经从pdf转为txt格式,方便以本数据为起点进行文本分析及相关指标的构建。本数据特点如下:

(1)爬虫代码:提供详细的Python爬虫代码,方便大家学习掌握爬虫技术;

(2)文件格式:下载的pdf文件已经转化为txt格式,方便后续文本分析处理;

(3)文件过滤:pdf批量下载过程中存在年报更新的情况,已经对年报进行了筛选,剔除了非年报文件并保留了最新更新或更正的年报;

(4)文件名称:原始地址的文件名称并不统一,已经将年报文件名称进行了统一,统一格式为“股票代码_年度_发布日期_****年年度报告.txt”,例如,“000002_2023_20230331_2022年年度报告.txt”;

文件展示:

代码展示:

【下载→

方式一(推荐):主页个人 简介
经管数据库-优快云博客

方式二:数据下载地址汇总-优快云博客

您可能感兴趣的与本文相关的镜像

Python3.11

Python3.11

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值