简介
数据是研究量化的基础,基于tushare数据进行量化学习与研究更适合新手,通过网页爬取的数据,后续处理时个人觉得有点麻烦,而tushare返回的绝大部分的数据格式都是DataFrame类型,非常便于新手用pandas/NumPy/Matplotlib进行数据分析和可视化。
我选取的数据:包含tushare的数据接口中的行情数据(日线行情、每日指标)合并后构建出自己的数据库。
代码
#导入基本库和数据接口
import pandas as pd
import tushare as ts
pro = ts.pro_api()
#定义获取数据函数,时间和指标可以根据需求更改
def get_data(code):
df1 = pro.daily(ts_code=code, start_date='20101012', end_date='20240325', fields='ts_code,trade_date,open,high,low,close,pre_close,change,pct_chg,vol,amount,')
df1 = df1.sort_values('trade_date')
df2 = pro.daily_basic(ts_code=code, start_date='20101012', end_date='20240325', fields='ts_code,trade_date,close,turnover_rate,turnover_rate_f,volume_ratio,pe,pe_ttm,pb,ps,ps_ttm,dv_ratio,dv_ttm,total_share,float_share,free_share,total_mv,circ_mv')