数据集之转换器以及估计器

最新推荐文章于 2024-11-14 23:58:50 发布

转载最新推荐文章于 2024-11-14 23:58:50 发布 · 90 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/shixinzei/p/10170899.html

文章标签：

#人工智能 #python

数据集的结构：特征值+目标值（有些可以没有目标值）

数据集：uci kaggle

数据处理工具：pandas sklearn

缺失值重复值不需要处理

转换器是一类实现了特征工程的API：

估计器是一类实现了算法的API：

测试代码：

from sklearn.preprocessing import StandardScaler
# 转换器以及估计器
s = StandardScaler()
data = s.fit_transform([[1, 2, 3], [4, 5, 6]])
print(data)

ss = StandardScaler()
print(ss.fit([[1, 2, 3], [4, 5, 6]]))
print(ss.transform([[1, 2, 3], [4, 5, 6]]))

print(ss.fit([[2, 3, 4], [4, 5, 7]]))
print(ss.transform([[1, 2, 3], [4, 5, 6]]))