自定义转换函器:
创建一个类,实现fit()[return self]、transform()和fit_transform(),
如果使用TransformerMixin作为基类,则自动实现fit_transform()函数,fit_transform() <==> fit().transform(),
如果添加BaseEstimator作为基类,,注意此时__init__
函数不能接受 ∗ a r g s *args ∗args 和 ∗ ∗ k w a r g s **kwargs ∗∗kwargs,还可以使用两个额外的方法(get_params()和set_params()),
这两个函数对于自动超参数调优有用处,下面是个列子,结合两个已经存在的属性作为一个新的属性值。
np.c_的用法https://blog.youkuaiyun.com/dss_dssssd/article/details/82824588
from sklearn.base import BaseEstimator, TransformerMixin
# xxx_ix 表示第几列
room_ix, bedroom_ix, population_ix, household_ix = 3, 4, 5, 6
housing[:5]
# out:
longitude latitude housing_median_age total_rooms total_bedrooms population households median_income ocean_proximity
17606 -121.89 37.29 38.0 1568.0 351.0 710.0 339.0 2.7042 <1H OCEAN