
机器学习
嗯_雅娴
数学系研究生
展开
-
sklearn决策树--泰坦尼克号幸存者预测
决策树的原理即利用不同的最优特征选择方法,优先选择样本纯度最高的特征来进行样本分类。其中:使用信息增益的决策树算法为 ID3;使用信息增益率的决策树算法为 C4.5;使用Gini指数的决策树算法为 CART算法。 ID3算法中,信息增益(Information gain)越大,数据越纯净,越有序,自然地我们优先选取信息增益最大的特征来分类样本。样本集的信息熵(Entorpy)的值越小...原创 2019-12-16 01:40:44 · 3079 阅读 · 0 评论 -
scikit-learn两类决策树参数说明
原文链接:https://blog.youkuaiyun.com/qq_16000815/article/details/80954039scikit-learn两类决策树参数说明'''scikit-learn中有两类决策树,它们均采用优化的CART决策树算法。'''from sklearn.tree import DecisionTreeRegressor'''回归决策树'''Decisi...转载 2019-12-16 00:46:05 · 514 阅读 · 0 评论 -
scikit-learn支持向量机(SVM)--手写数字识别
#手写数字识别#scikit-learn库from sklearn import datasetsdigits = datasets.load_digits() #加载scikit-learn自带的手写数字识别图片数据集from matplotlib import pyplot as plt#将数据所代表的的图片显示出来images_and_labels = list(z...原创 2019-12-11 17:34:25 · 1474 阅读 · 0 评论 -
机器学习应用开发典型步骤
一、数据清洗统一同类数据的单位,去掉重复数据及噪声数据。使得数据具备结构化特征,方便作为机器学习算法的输入。二、特征选择从所有的特征值中,逐个分析选择合适的特征集合作为输入。方法:1、人工选择;2、PCA算法三、模型选择根据问题领域、数据量大小、训练时长、模型准确度等多方面因素决定模型的选择。四、模型训练和测试将数据集分为训练集、测试集、验证集(交叉验证集)来进行模型训练。五、模...原创 2019-12-11 10:36:53 · 482 阅读 · 0 评论 -
机器学习笔记总结--Coursera吴恩达
网易云视频连接:https://study.163.com/course/courseMain.htm?courseId=1004570029笔记参考:http://daniellaah.github.io/2016/Machine-Learning-Andrew-Ng-My-Notes监督学习与无监督学习通常我们讲,任何的机器学习(Machine Learning,简ML)算法问题都可以分...原创 2019-08-15 11:45:41 · 306 阅读 · 0 评论