获取市场上的股票代码

最新推荐文章于 2025-06-20 14:27:46 发布

褶皱的包子

最新推荐文章于 2025-06-20 14:27:46 发布

阅读量6.1k

点赞数

CC 4.0 BY-SA版权

分类专栏：爬虫爬虫项目汇总文章标签： Python 股票代码数据获取

本文链接：https://blog.youkuaiyun.com/qq_37193537/article/details/89677777

使用python2.7,rullib2,re

对http://www.txsec.com/inc1/gpdm.asp进行数据获取,见代码：

# -*- coding: utf-8 -*-
import urllib
import urllib2
import re
import csv

post_url = 'http://www.txsec.com/inc1/gpdm.asp'
header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36',
             'Origin':'http://www.cninfo.com.cn'}
try:
    request = urllib2.Request(post_url,headers=header)
    response = urllib2.urlopen(request)
    pageCode = response.read().decode('gbk')
except Exception as e:
    print e

pattern = re.compile('<tr .*?>.*?<td .*?>(.*?)</td>.*?<td .*?>(.*?)</td>.*?'+
                     '<td .*?>(.*?)</td>.*?<td .*?>(.*?)</td>.*?</tr>.*?'+'<tr>.*?<td .*?>(.*?)</td>.*?<td .*?>(.*?)</td>.*?'+
                     '<td .*?>(.*?)</td>.*?<td .*?>(.*?)</td&