机器学习完整代码及运行结果

本文详细介绍了如何运用Python的Pandas、Numpy、Matplotlib和Scikit-learn库进行机器学习实践,特别是在处理时间戳、编码udmap、创建决策树分类器和预测目标变量上的步骤。首先,数据从csv文件读取并进行预处理,包括udmap的数值化和日期时间格式转换。接着,利用编码后的数据训练决策树模型,并预测测试集。最后,预测结果被保存到submit.csv文件中。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

薛智怀,广东金融学院

1,导入库

import pandas as pd
import numpy as np

2,读取文件train.csv和test.csv

train_data = pd.read_csv('用户新增预测挑战赛公开数据/train.csv')
test_data = pd.read_csv('用户新增预测挑战赛公开数据/test.csv')

3,common_ts列转换为日期时间格式

train_data['common_ts'] = pd.to_datetime(train_data['common_ts'], unit='ms')
test_data['common_ts'] = pd.to_datetime(test_data['common_ts'], unit='ms')

终端:

 4,创建全0数组,如果d=unknown,返回0,如果d!=unknown则存储到d

def udmap_onethot(d):
    v = np.zeros(9)
    if d == 'unk
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值