- 博客(8)
- 收藏
- 关注
原创 sklearn.preprocessing.LabelEncoder将文本标签转化为数字
官方文档示例from sklearn.preprocessing import LabelEncoderencoder=LabelEncoder()housing_cat=housing["ocean_proximity"]housing_cat_encoded=encoder.fit_transform(housing_cat)housing_cat_encoded=pd.Da...
2019-03-13 09:31:19
7071
原创 sklearn.preprocessing.Imputer
参考博客使用案例from sklearn.preprocessing import Imputerimp=Imputer(strategy="median")imp.fit(housing_num)x=imp.transform(housing_num)#得到的结果是数组housing_tr=pd.DataFrame(x,columns=housing_num.columns)#...
2019-03-13 09:17:56
442
原创 pandas.DataFrame.corr &scatter_matrix计算各个属性之间相关系数
官方文档参考博客corr_matrix=housing.corr()print(corr_matrix)print(corr_matrix["median_house_value"].sort_values(ascending=False))pandas.plotting.scatter_matrix官方文档from pandas.tools.plotting ...
2019-03-06 11:12:24
1675
原创 pandas.DataFrame.plot绘制散点图
官方文档参考博客图1:按坐标绘制散点图图2:设置透明度,可以看清楚高密度数据点的位置。alpha=1为不透图3:用点的大小代表人口数量(参数s),用颜色代表价格(参数c),jet预定义颜色表(参数cmap)housing.plot(kind="scatter",x="longitude",y="latitude")housing.plot(kind="scatter",x=...
2019-03-06 10:54:53
25496
1
原创 sklearn.model_selection.train_test_split
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html实例:train_set,test_set=train_test_split(housing,test_size=0.2,random_state=42)编写函数实现数据集划分:参考《机器学习实...
2019-02-28 17:33:11
252
原创 python导入csv数据并绘制各个属性的直方图
参考:《机器学习实战:基于Scikit-Learn和TensorFlow》import pandas as pdimport osHOUSING_PATH="数据存储路径"#导入数据def load_housing_data(housing_path=HOUSING_PATH): csv_path=os.path.join(housing_path,"文件名称.csv")...
2019-02-28 17:22:16
6479
原创 sklearn.model_selection.StratifiedShuffleSplit
分层抽样https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.StratifiedShuffleSplit.html#sklearn.model_selection.StratifiedShuffleSplit.split实例:根据Income_cat进行分层抽样,前提:Income_ca...
2019-02-28 17:06:21
1161
翻译 pandas.DataFrame.where
http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.where.html实例:将连续的median_income数据进行分类。首先除以1.5限制类别数量,然后用ceil取整获得离散的类别,最后将>5的类别合并为类别5#创建收入类别属性housing["income_cat"]...
2019-02-28 16:17:40
628
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人