Datawhale -数据挖掘 - task2:特征衍生+特征挑选

任务说明

特征衍生
特征挑选:分别用IV值和随机森林等进行特征选择
……以及你能想到特征工程处理

特征衍生

特征衍生:利用个人(专家)经验来提取出数据里对结果影响更大的特征,往往是原有数据特征字段通过加减乘除等操作生成新的字段,这些字段在结合一些线性算法做训练的时候往往能起到提升模型效果的作用。举例,用户点外卖,同一家店A,统计一个星期内用户在这家店的购买次数,甚至统计一个月时间范围内,这样的时间周期特征就可以被认为是衍生特征。具体是怎么来的呢?拍脑袋想出来的,有些是具有统计含义的,有些就靠自己摸索,所以一开始就说是经验得来的,你要说有技巧没有,那就是多参加比赛,看看别人怎么提取特征,多自己动手探索,

import pandas as pd
import numpy as np

dataPath = "D:\\Data\\dataAnalyse\\"
dataFile = "data.csv"
data = pd.read_csv(dataPath+dataFile,encoding='gbk')

label = data.columns
print('特征名=',label)

结果:

特征名= Index(['Unnamed: 0', 'custid', 'trade_no', 'bank_card_no',
       'low_volume_percent', 'middle_volume_percent',
       'take_amount_in_later_12_month_highest',
       'trans_amount_increase_rate_lately', 'trans_activity_month',
       'trans_activity_day', 'transd_mcc', 'trans_days_interval_filter',
       'trans_days_interval', 'regional_mobility', 'student_feature',
 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值