
sklearn
文章平均质量分 77
Amy_mm
https://github.com/xuman-Amy
积跬步,至千里
展开
-
逻辑回归模型(二)——sklearn实现逻辑回归(logistic regression)
【Modeling class probabilities via logistic regression】 类概率的逻辑回归建模,事件发生的几率(odds)定义为 事件发生概率与事件未发生概率的比值。logit函数代表事件的几率,其中p代表我们所预测事件发生的概率。sigmoid 函数(S形函数) , 如下图sigmoid函数输入为全体实数,将输入转化为(0,1)...原创 2018-03-31 16:59:06 · 6160 阅读 · 0 评论 -
回归分析(三)——多项式回归解决非线性问题
git源码:https://github.com/xuman-Amy/Regression-Analysis【将线性回归模型转换为曲线——多项式回归】之前都是将解释变量和目标值之间的关系假设为线性的,如果假设不成立,可以添加多项式选项,转换为多项式回归。【sklearn实现多项式回归】1、PoltnomialFeatures实现二项回归# quadratic 二项回归...原创 2018-04-19 22:52:44 · 7592 阅读 · 1 评论 -
回归分析(二)——RANSAC强化模型+正则化解决过拟合
git源码:https://github.com/xuman-Amy/Regression-Analysis【运用RANSAC 训练强化的回归模型】RANdom SAmple Consensus (RANSAC),随机样本一致性算法,将回归模型与数据的子集相匹配,即局内点【基本步骤】(1)选择一个随机数量的样本作为局内点,来fit一个模型(2)用除去(1)中之外的所有点对抗这...原创 2018-04-19 22:52:02 · 2590 阅读 · 0 评论 -
回归分析(一)——简单了解
《python machine learning》chapter 10Predicting Continuous Target Variables with Regression Analysis【主要内容】(1)探索和可视化数据集(2)用不同方法实现线性回归分析(3)训练适用于离群值的回归模型(4)评估回归模型,解决通用问题(5)调整适用于非线性数据的回归模型git...原创 2018-04-19 22:46:46 · 2708 阅读 · 1 评论 -
模型评估和超参数调整(四)——网格搜索(grid search)
读《python machine learning》chapt 6Learning Best Practices for Model Evaluation and Hyperparameter Tuning【主要内容】(1)获得对模型评估的无偏估计(2)诊断机器学习算法的常见问题(3)调整机器学习模型(4)使用不同的性能指标对评估预测模型git源码地址https:/...原创 2018-04-11 21:56:31 · 9139 阅读 · 1 评论 -
模型评估和超参数调整(三)——学习曲线和验证曲线 learning curves and validation curves
读《python machine learning》chapt 6Learning Best Practices for Model Evaluation and Hyperparameter Tuning【主要内容】(1)获得对模型评估的无偏估计(2)诊断机器学习算法的常见问题(3)调整机器学习模型(4)使用不同的性能指标对评估预测模型git源码地址https:/...原创 2018-04-11 20:27:59 · 3480 阅读 · 0 评论 -
模型评估和超参数调整(二)——交叉验证 (cross validation)
读《python machine learning》chapt 6Learning Best Practices for Model Evaluation and Hyperparameter Tuning【主要内容】(1)获得对模型评估的无偏估计(2)诊断机器学习算法的常见问题(3)调整机器学习模型(4)使用不同的性能指标对评估预测模型git源码地址https:/...原创 2018-04-11 20:26:00 · 13395 阅读 · 5 评论 -
模型评估和超参数调整(一)——管道机制(pipeline)
读《python machine learning》chapt 6Learning Best Practices for Model Evaluation and Hyperparameter Tuning【主要内容】(1)获得对模型评估的无偏估计(2)诊断机器学习算法的常见问题(3)调整机器学习模型(4)使用不同的性能指标对评估预测模型git源码地址https:/...原创 2018-04-11 20:23:51 · 3636 阅读 · 0 评论 -
sklearn.preprocessing . LabelEncoder
LabelEncoder: Encode labels with value between 0 and n_classes-1.将数字型或者非数字型标签转化为 0--(类个数-1)范围之内代码范例如下:1、将非数值型标签转化为数值型,安装range(n)标号from sklearn.preprocessing import LabelEncoderle =LabelEnco...原创 2018-04-11 09:43:18 · 1348 阅读 · 0 评论 -
数据压缩之降维(二)——LDA
学习《python machine learning》chapter5——Compressing data via dimensionality reduction主要内容如下:(1)主要成分分析 Principal Component Analysis (PCA) ——非监督学习(2)线性判别分析 Linear Discriminant Analysis (LDA) ——监督学习...原创 2018-04-10 18:45:12 · 1066 阅读 · 0 评论 -
scikit-learn 学习总结 (一)——sklearn实现感知机(perceptron)
学习《python machine learning》 的第三章,A Tour of Machine Learning Classifiers Using scikit-learn本章主要讲述 特征选择 和 数据预处理,以下算法实现都是基于sklearn的接口~~~~生命不息,学习不止~ 哈哈哈哈【训练一个机器学习模型的五大关键步骤:】(1)选择特征,收集训练样本(2)选择性能...原创 2018-03-28 11:35:12 · 8907 阅读 · 0 评论 -
数据压缩之降维(一)——PCA降维
学习《python machine learning》chapter5——Compressing data via dimensionality reduction主要内容如下:(1)主要成分分析 Principal Component Analysis (PCA) ——非监督学习(2)线性判别分析 Linear Discriminant Analysis (LDA) ——监督学习...原创 2018-04-10 10:54:57 · 2156 阅读 · 0 评论 -
支持向量机——sklearn 实现支持向量机(SVM)
《Python machine learning》书籍学习~~~支持向量机的数学模型稍后补上,先来讲一下sklearn中的实现。Support Vector Machine(SVM) ,优化目标与感知机相反,感知机是实现错误的最小优化;SVM实现边缘最大优化。边缘(margin):两个分离差超平面之间的距离支持向量(support vector):距离分割超平面最近的训练样本点...原创 2018-04-01 16:58:50 · 3056 阅读 · 0 评论 -
python数据预处理之缺失值简单处理,特征选择
书籍:《python machine learning》推荐kaggel 上大神的数据预处理文章:https://www.kaggle.com/pmarcelino/comprehensive-data-exploration-with-python自己之前也学习过这篇文章对一些代码进行了注释,博文如下:https://blog.youkuaiyun.com/Amy_mm/article...原创 2018-04-03 19:59:39 · 12760 阅读 · 0 评论