继上次分析之后,这次打算用详细的时间序列算法预测,我们使用ARMA时间序列模型作为预测,选取17年数据和18年1月和2月数据作为训练,预测18年3月1日,3月2日及3月3日数据。
话不多说,直接整吧。
1.基本数据整理
#-*- coding: utf-8 -*-
#arima时序模型
import pandas as pd
#时序图
import matplotlib.pyplot as plt
from plotly.offline import init_notebook_mode, iplot,plot
init_notebook_mode(connected=True)
import plotly.graph_objs as go
df=pd.read_csv('gun-violence-data_01-2013_03-2018.csv')
df=df[['date','n_killed']]
df.to_csv('data_nkilled.csv')
2.选取所需数据
discfile = 'data_nkilled.csv'
forecastnum = 5
#读取数据,指定日期列为指标,Pandas自动将“日期”列识别为