一、导入数据
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import datetime as dt
#%matlplotlib inline 在Jupter中使用,用来使得图片显示在页面中,而非弹出窗口
## 获取数据
data=pd.read_csv('data.csv',encoding='gbk', index_col='Date') #解决读取文件中中文的问题
##python 3.5 解决csv 读入中的'utf-8' codec can't decode办法
##参考https://blog.youkuaiyun.com/moledyzhang/article/details/78978312
data.index=[dt.datetime.strptime(x,'%Y/%m/%d') for x in data.index]#将字符串日期转为日期格式
二、作图
#作图
#原因:matplotlib库中没有中文字体
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
#有中文出现的情况,需要u'内容'
#参考 https://segmentfault.com/a/1190000005144275
data.plot(figsize=(10,6))
plt.ylabel(u'涨跌幅')
三、回归分析
import statsmodels.api as sm
x=data['沪深300'].values
X=sm.add_constant(x) #添加常数项
y=data['中国平安'].values
###对两者的收益率进行线性回归
model=sm.OLS(y,X)
results=model.fit()
results.params #得到Beta系数
###作图
plt.figure(figsize=(10,6))
plt.plot(x,y,'o',label='中国平安-沪深300')
plt.plot(x, results.fittedvalues,'r--',label='ordinary least square')
plt.legend()#添加图例(标签)
plt.xlabel('沪深300')
plt.ylabel('中国平安')
plt.grid(True) #添加网格线
代码根据《Python 与量化投资 从基础到实战》的内容练习编写。