
sklearn
DAN_L
这个作者很懒,什么都没留下…
展开
-
SKLearn数据预处理技术(标称型特征编码和缺失值补全)
原创 2020-05-30 16:47:00 · 473 阅读 · 0 评论 -
SKLearn数据预处理之Normalize和Binarize
原创 2020-05-30 16:04:48 · 1119 阅读 · 0 评论 -
SKlearn数据预处理之Stardardization
原创 2020-05-30 15:32:00 · 179 阅读 · 0 评论 -
SKLearn特征抽取之文本特征抽取(词袋表示法)
原创 2020-05-30 11:21:33 · 516 阅读 · 0 评论 -
SKLearn特征抽取之字典向量化和哈希变换
原创 2020-05-29 10:55:09 · 452 阅读 · 0 评论 -
SKlearn之Pipeline和FeatureUnion
原创 2020-05-29 09:59:24 · 250 阅读 · 0 评论 -
SKLearn数据集变换操作
原创 2020-05-29 09:00:33 · 283 阅读 · 0 评论 -
SKLearn模型选择之模型评估方法
一、Estimator对象的score方法二、在交叉验证中使用scoring参数约定:返回值越大代表性能越好。三、使用sklearn.metric中的性能度量函数原创 2020-05-28 15:04:21 · 390 阅读 · 0 评论 -
SKLearn中回归算法的得分和误差评估方法
原创 2020-05-28 15:02:52 · 1065 阅读 · 0 评论 -
SKLearn分类器评估标准4-各种分类损失函数
原创 2020-05-28 10:52:08 · 868 阅读 · 0 评论 -
SKLearn分类器评估标准3-ROC曲线
原创 2020-05-25 18:45:12 · 281 阅读 · 0 评论 -
SKLearn分类器评估标准2-Precision-Recall-Fscore
原创 2020-05-24 21:40:51 · 437 阅读 · 0 评论 -
SKLearn分类器评估标准1-准确率和混淆矩阵
一、准确率Accuracy score二、混淆矩阵Confusion matrix原创 2020-05-24 17:11:51 · 1322 阅读 · 0 评论 -
SKLearn分类器评估指标(一)
一、使用sklearn.metric包中的性能度量函数(一)分类器性能指标精度-召回率-F度量(Precision-Recall-F_measures)损失函数(Loss Function)接收机操作曲线(ROC Curves)1、只限于二元单标签分类问题的评估指标(1)matthews_corrcoef(y_true,y_pred[,…]计算二元分类中的Matthews相关系数(MCC)(2)precision_recall_curve(y_true,probas_pred)在不同的概率原创 2020-05-24 16:26:02 · 2242 阅读 · 0 评论 -
SKLearn模型选择之模型验证方法
一、通过交叉验证计算得分model_selection.cross_val_score(estimatoe,X)1、estimator:实现了fit函数的学习器2、X:array-like,需要学习的数据,可以是列表或2d数组3、y:array-like,可选的,默认为None,监督学习中样本特征向量的真实目标值4、scoring:string,callable or None,可选的,默认为None一个字符or一个scorer可调用对象或函数,须实现scorer(estimatoe,X,y)原创 2020-05-22 16:45:51 · 1142 阅读 · 0 评论 -
SKLearn模型选择之超参数优化方法
一、GridSearchCVfrom sklearn import svm,datasetsfrom sklearn.model_selection import GridSearchCViris = datasets.load_iris()#定义参数网格:2*3=6个参数组合parameters = {‘kernel’????‘rbf’,‘linear’),‘C’:[1,5,10]}svr = svm.SVC()clf = GridSearchCV(svr,parameters)...原创 2020-05-22 08:38:35 · 1195 阅读 · 0 评论 -
SKLearn模型选择之数据集划分策略
一、KFoldimport numpy as npfrom sklearn.model_selection import KFoldX = np.array([[1,2],[3,4],[5,6],[7,8],[9,10],[11,12]])y = np.array([1,2,3,4,5,6])kf = KFold(n_splits=2)kf.get_n_splits(X)print(kf)for train_index,test_index in kf.split(X):print...原创 2020-05-21 11:11:17 · 838 阅读 · 0 评论 -
SKLearn数据集操作API
原创 2020-05-19 22:07:57 · 149 阅读 · 0 评论 -
SKLearn 统一API调用接口
原创 2020-05-18 16:05:27 · 458 阅读 · 0 评论 -
SKLearn算法库的顶层设计
一、SKLearn各个模块(一)监督学习的各个模块1、neighbors近邻算法2、svm支持向量机算法3、kernal_ridge核岭回归4、neighbors近邻算法5、discriminant_analysis判别分析6、linear_model广义线性模型7、ensemble集成方法8、tree决策树9、naive_bayes朴素贝叶斯10、cross_decomposition交叉分解11、gaussian_process高斯过程12、neural_network多层神经原创 2020-05-18 11:53:31 · 305 阅读 · 0 评论