1 方差选择法
先计算各个特征的方差,选择方差大于阈值的特征
2 案例
import pandas
data = pandas.read_csv('D:\\database\\pystudy\\6.2\\data1.csv')
# 查看数据框里边的数据类型
data.dtypes
# 导入计算方差的方法
from sklearn.feature_selection import VarianceThreshold
# 定义阈值为1
varianceThreshold=VarianceThreshold(threshold=1)
# 调用fit_transform的方法对特征值进行过滤
# data['累计票房']=data['累计票房'].astype('float')
varianceThreshold.fit_transform(data[['票房','评分']])
# 查看方差
data[['票房', '评分']].std()
varianceThreshold = VarianceThreshold(threshold=3)
varianceThreshold.fit_transform(data[['票房', '评分']])
varianceThreshold.get_support()