使用python语言,实现求特征选择的信息增益,可以同时满足特征中有连续型和离散型属性的情况。
##师兄让我做一个特征选择的代码,我在网上找了一下,大部分都是用来求离散型属性的信息益益,但是我的数据是同时包含离散型和连续型属性的,所以这里实现了一下。
代码块
import numpy as np
import math
class IG():
def __init__(self,X,y):
X = np.array(X)
n_feature = np.shape(X)[1]
n_y = len(y)
orig_H = 0
for i in set(y):
orig_H += -(y.count(i)/n_y)*math.log(y.count(i)/n_y)
condi_H_list = [