小编今天在学习冠军代码时遇到这样一个问题,迟迟无法解决.最后摸索了很久才发现问题所在.
对数据集进行处理时,出现TypeError: invalid type comparison报错
具体代码片段如下:
import pandas as pd
import numpy as np
from datetime import date
import datetime as dt
#将数据分为3个数据集 利用滑窗法
#将2016年1月1日到4月13日的数据提取特征,利用4月14日的到5月14日的作为测试集
#将2月1日到5月14日的作为数据集提取特征,利用5月15日6月15日的作为测试集
#将3月15日到6月30日作为数据集提取特征,再测试7月1日到7月31日的数据
"""
1 提取用户特征
距离
用户的平均距离,用户的最小距离,用户的最大距离
使用优惠券买的物品数,买的总数,收到的优惠券数
使用优惠券买的/总共收到的优惠券
"""
#利用pandas读取csv个格式的数据,header=None表示原文件没有索引
#原文件中总共有1754884个记录,header=0,表明第0行代表列名
off_train = pd.read_csv("..\input\ccf_offline_stage1_train.csv",header=0)
off_train.columns=['user_id','merchant_id','coupon_id','discount_rate','distance','date_received','date']
#读取线下数据
off_test