接上一篇 2、Python爬取东方财富网程序代码 接 上一篇: 代码部分: * coding=gbk * 导入需要使用到的模块 from urllib import request import re import pandas as pd import pymysql import os 爬虫抓取网页函数 def getHtml(url): html = request.urlopen(url).read() html = html.decode(‘gbk’) return html 抓取网页股票代码函数 def getStackCode(html): s = r’ ’ pat = re.compile(s) print(pat) code = pat.findall(html) print(code) return code ####################开始干活 def load_data(urll, save_path): # 实施抓取 code = getStackCode(getHtml(urll)) # 获取所有股票代码(以6开头的,是沪市数据)集合 CodeList = [] for item in code: if item[0] == ‘6’: CodeList.append(item)