1. 什么是时间序列
同一统计指标数值按照时间先后顺序排列而成的数据。本质上是反映一个变量随时间序列变化的趋势。
- 简单的例子就像是学生每一年的身高数据,这个也是一个时间序列。变量是我们的身高;每一年都不一样。
- 我们支付宝或者微信的零钱,每一天每一个月都有一个实际的值。
2. 在python中如何导入时间序列数据`
from dateutil.parser import parse #关于时间的函数
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd
import datetime #关于日期的函数
plt.rcParams.update({
'figure.figsize': (10, 7), 'figure.dpi': 120})
# Import as Dataframe
df = pd.read_csv('../datasets/a10.csv', parse_dates=['date'])
df.head()
date value
0 1991-07-01 3.526591
1 1991-08-01 3.180891
2 1991-09-01 3.252221
3 1991-10-01 3.611003
4 1991-11-01 3.565869``
3.面板数据
有多个时间节点,且每一个时间节点上有多个维度的数据
4. 可视化时间序列
##获得数据
import matplotlib.pyplot as plt
df = pd.read_csv('../datasets/a10.csv')
df['date'] = df['date'].apply(lambda x: datetime.datetime.strptime(x, "%Y-%m-%d"))
#######关注一下匿名函数的用法
df.head()
date value
0 1991-07-01 3.526591
1 1991-08-01 3.180891
2 1991-09-01 3.252221
3 1991-10-01 3.611003
4 1991-11-01 3.565869
画图
# 画图
def plot_df(df, x, y, title="", xlabel="Date", ylabel="Value", dpi=100):
plt.figure(figsize=(12, 4), dpi=dpi)
plt