爬取网易财经全部A股上市公司年报

最新推荐文章于 2025-10-30 12:49:03 发布

原创

最新推荐文章于 2025-10-30 12:49:03 发布 · 1.1w 阅读

35 ·

CC 4.0 BY-SA版权

本文介绍如何获取所有A股上市公司的股票代码，并以东方财富网为起点，详细阐述了爬取网易财经中各公司资产负债表、利润表和现金流量表的步骤，最终实现对3654家公司的财务数据的全面抓取。

首先要找到所有A股上市公司的股票代码，将东方财富网列表中所有的股票的代码（6位数字号）取下来

东方财富网股票代码列表： http://quote.eastmoney.com/stocklist.html

从网页中找到我们要的信息，保存在字典中，写入"stock_name.txt"文件

# -*- coding: utf-8 -*-
"""
Created on Tue Oct  9 00:03:46 2018

@author: South
"""

import requests
import time
import sys
import json
import os 
def get_file(url, filename):    
    r = requests.get(url)    
    try:
        with open(filename, 'wb') as file:        
            file.write(r.content)
    except:
        print(filename)
        pass

def check_file(filename):    
    '''检查有没有被反爬'''    
    if os.path.exists(filename):        
        with open(filename, 'r') as f: