环境如下:
语言:python3.7
IDE: Pycharm-2020.1.1
包环境管理:anaconda 4.8.2
库文件:request, pandas, matplotlib, bs4, pandas_datareader
要连接互联网~~~~
问题:很多小伙伴想用机器学习方法对股票进行量化分析,我们面临的第一个问题是如何获得其历史数据?
如何解决上述问题?使用python爬虫爬取历史数据,或者更确切的说,先爬取股票代码,然后使用pandas_datareader从yahoo上获取该股票的历史数据。该网站可以获取到所有上证股票的股票代码。借鉴蒹葭杰克兄弟的代码,对其代码稍作改进,以方便使用。
- 获取数据部分
import matplotlib.pyplot as plt
import pandas as pd
import pandas_datareader.data as web
import requests
import bs4 as bs
def get_stock_code():
res = requests.get('https://www.banban.cn/gupiao/list_sh.html')
res.encoding = res.apparent_encoding
soup = bs.BeautifulSoup(res.text, 'lxml')
content = soup.find('div', {
'class':'u-postcontent cz'})
result = []

本文介绍如何使用Python爬虫从网络获取股票代码,并利用pandas_datareader库从Yahoo财经抓取股票历史数据。通过具体示例,如获取包钢股份的历史数据并保存为CSV文件,以及绘制九鼎投资的收盘价曲线,展示了数据获取和初步分析的过程。
最低0.47元/天 解锁文章
1285

被折叠的 条评论
为什么被折叠?



