
sklearn
文章平均质量分 66
yisuoyanyv
这个作者很懒,什么都没留下…
展开
-
scikit-learn数据预处理
Python下的机器学习工具scikit-learn(-数据预处理)参考自http://lib.youkuaiyun.com/article/machinelearning/1119和http://scikit-learn.org/stable/modules/preprocessing.html(1)数据标准化(Standardization or Mean Removal and Variance Scal原创 2017-07-01 11:52:24 · 624 阅读 · 0 评论 -
sklearn官方文档学习笔记 管道和特征联合(Pipeline and FeatureUnion):组合估计器
sklearn官方文档学习笔记 管道和特征联合:组合估计器Pipeline and FeatureUnion: combining estimators管道:链接估计器from sklearn.pipeline import Pipeline from sklearn.svm import SVC from sklearn.decomposition import PCA estimators翻译 2017-07-01 16:18:32 · 2835 阅读 · 0 评论 -
sklearn 特征提取
Feature extraction 特征提取参考自官方文档http://scikit-learn.org/stable/modules/feature_extraction.html注意:特征提取与特征选择不同:前者包括将任意数据(如文本或图像)转换为可用于机器学习的数值特征。后者是应用这些特征的机器学习技术。从字典加载特征DictVectorizer类可将表示为标准Python字典(dict)对原创 2017-07-01 20:22:47 · 2457 阅读 · 0 评论 -
Cross-validation 交叉验证与训练集测试集划分
由于代码比较简单,直接看代码生成的结果更容易理解代码的功能和作用,所以没有添加更多的说明。 参考官方文档地址:http://scikit-learn.org/stable/modules/cross_validation.html#cross-validation-evaluating-estimator-performanceimport numpy as np from sklearn.mod原创 2017-07-14 18:02:05 · 9141 阅读 · 0 评论 -
机器学习--处理缺失值
处理缺失值 在python语言中,缺失值一般被称为nan,是”not a number”的缩写。 下面的代码可以计算出数据总共有多少个缺失值,这里数据是存储在pandas中的DateFrame中: print(data.isnull().sum()) 处理缺失值有一下几种方式: 1.删除包含缺失值的数据列 data_without_missing_values=origin...原创 2018-05-08 21:57:30 · 2276 阅读 · 1 评论 -
机器学习笔记-房价预测实例
机器学习笔记 摘自kaggle初学者教程 所用数据集为一个房价预测的数据集 import pandas as pd main_file_path = 'dataset/kaggle_house_prices/train.csv' data = pd.read_csv(main_file_path) #删除数据集中的缺失值 # data=data.dropna(axis=0) #显示数据...原创 2018-05-08 11:49:09 · 3828 阅读 · 0 评论