本次主要爬取东方财富网关于“大盘资金流向历史数据”的数据

根据日期及流入资金数据绘制折线图,尝试使用XHR或者bs抓取数据,无奈失败且比较麻烦,采用了selenium抓取的方法。
并使用xpath获取网页中的表格数据,需要提前安装谷歌浏览器及相关程序
from selenium import webdriver #导入模块
import time
import csv #存储数据
from lxml import etree
option = webdriver.ChromeOptions() #网址获取
option.add_argument('headless') #设置浏览器静默
driver = webdriver.Chrome(options=option)
driver.get('http://data.eastmoney.com/zjlx/zs399006.html')
time.sleep(2)
source = driver.page_source
mytree = etree.HTML(source)
tables = mytree.xpath("//table[@class='tab1']")#定位表格,返回列表
for i in range(len(tables)):#循环表格
onetable = []
trs = tables[i].xpath('.//tr')#取出所有tr标签
for tr in trs:
ui = []
for td in tr:
texts = td.xpath

本文介绍了如何使用selenium爬取东方财富网的大盘资金流向历史数据,并通过xpath获取表格信息。由于原始数据存在格式问题,采用Excel进行预处理,然后利用matplotlib进行数据可视化,虽然不熟悉股市数据,但观察到大部分流向为负值,可能表明大额资金流出。
最低0.47元/天 解锁文章
5599





