薛智怀,广东金融学院
1,导入库
import pandas as pd
import numpy as np
2,读取文件train.csv和test.csv
train_data = pd.read_csv('用户新增预测挑战赛公开数据/train.csv')
test_data = pd.read_csv('用户新增预测挑战赛公开数据/test.csv')
3,common_ts列转换为日期时间格式
train_data['common_ts'] = pd.to_datetime(train_data['common_ts'], unit='ms')
test_data['common_ts'] = pd.to_datetime(test_data['common_ts'], unit='ms')
终端:
4,创建全0数组,如果d=unknown,返回0,如果d!=unknown则存储到d
def udmap_onethot(d):
v = np.zeros(9)
if d == 'unk