【AI实战】pandas 获取机器学习模型的时间特征

pandas 获取机器学习模型的时间特征

环境

  • Ubuntu 18.04
  • python 3.6.9
  • pandas 1.1.5

获取时间特征


df = pd.read_csv(data_path, low_memory=False)

#时间特征
df['date'] = pd.to_datetime(df['date'])
#年
df['year'] = df['date'].map(lambda x: (x.year))
#月
df['month'] = df['date'].map(lambda x: (x.month))
#日
df['day'] = df['date'].map(lambda x: (x.day))
#小时
df['hour'] = df['date'].map(lambda x: (x.hour))
#分钟
df['minute'] = df['date'].map(lambda x: (x.minute))
#星期几
df['dayofweek'] = df['date'].map(lambda x: (x.dayofweek+1))

上述的时间特征为数值型

独热编码one-hot处理时间特征

自行百度搜索one-hot

  • 问题
    one-hot 适用于的特征应该是分类特征,而且不同类别之间的距离是没有差别的,比如红黄蓝三种颜色,汉字等等用one-hot表示是很好的。但是对于时间序列,5点和6点跟18点之间的距离明显是不同的,所以用one-hot来度量的话,会损失非常多的信息

将一个时间变量变成一个二维平面圆周上的点

在这里插入图片描述

如上所示,将一个时间变量变成一个二维平面圆周上的点。这样就能解决周期性因素。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

szZack

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值