Kaggle比赛 常用代码技巧记录

本文分享了Kaggle竞赛中常用的代码技巧,包括显示代码执行时间、目标变量分布绘图、缺失值检测及处理、特征编码、特征重要性可视化等。通过这些实用技巧提升模型训练效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Kaggle比赛 常用代码技巧记录

代码一般使用于jupyter notebook中,如有特殊会标明。
后续会封装这些函数来更方便的调用和维护。
1.%%time显示该段代码执行时间

%%time
train = pd.read_table("filename")

CPU times: user 7.78 s, sys: 606 ms, total: 8.39 s
Wall time: 8.43 s

2.显示target的分布(二分类),并画图

train['target'].value_counts()
train['target'].astype(int).plot.hist()

3.检验缺失值,函数参数为dataframe
返回值为降序排列的含有缺失值占比的dataframe

def missing_values_table(df):
        # Total missing values
        mis_val = df.isnull().sum()
        
        # Percentage of missing values
        mis_val_percent = 100 * df.isnull().sum() / len(df)
        
        # Make a table with the results
        mis_val_table = pd.concat([mis_val, mis_val_percent], axis=1)
        
        # Rename the columns
        mis_val_table_ren_columns = mis_val_table.rename(
        columns = {
   0 : 'Missing Values', 1 : '% of Total Values'})
        
        
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值