
python
文章平均质量分 86
Will-Lin
计算机视觉/自动化/SJTU
展开
-
机器学习算法的Python实现 (1):logistics回归 与 线性判别分析(LDA)
本文为笔者在学习周志华老师的机器学习教材后,写的课后习题的的编程题。之前放在答案的博文中,现在重新进行整理,将需要实现代码的部分单独拿出来,慢慢积累。希望能写一个机器学习算法实现的系列。本文主要包括:1、logistics回归2、线性判别分析(LDA)使用的python库:numpymatplotlibpandas使用的数据集:机器学习教材上的西瓜数原创 2016-04-01 16:14:16 · 7391 阅读 · 8 评论 -
机器学习-周志华-课后习题答案-决策树
本文为博主原创,由于没有可以参考的答案,所以内容中若有错误的地方烦请指正,不甚感激。注:本文中的代码均使用python,常用工具包包括 pandas,scikit-learn,numpy, scipy,matplotlib等。4.1试证明对于不含冲突数据(即特征向量完全相同但标记不同)的训练集,必存在与训练集一致(即训练误差为0)的决策树答:假设不存在与训练集一致的决策原创 2016-04-04 23:07:26 · 40599 阅读 · 13 评论 -
XGBoost-安装(Windows/VS2015)
昨天想装theano的时候,误删了之前的一些python包,导致xgboost无法使用。索性重新安装了anaconda平台,方便自己后续的使用。 Anaconda是python科学计算的集成。使用起来给人matlab的感觉。并且预装了numpy,scipy,matplotlib,pandas, scikit-learn等多个常用的工具包。 环境:VS2015Win10原创 2016-03-26 13:47:12 · 4874 阅读 · 5 评论 -
机器学习算法的Python实现 (2):ID3决策树
本文数据参照 机器学习-周志华 一书中的决策树一章。可作为此章课后习题3的答案代码则参照《机器学习实战》一书的内容,并做了一些修改。本文使用的Python库包括numpypandasmathoperatormatplotlib本文所用的数据如下: Idx色泽根蒂敲声纹理脐部触感原创 2016-04-01 22:42:39 · 29064 阅读 · 34 评论 -
机器学习算法的Python实现 (3):决策树剪枝处理
本文数据参照 机器学习-周志华 一书中的决策树一章。可作为此章课后习题4的答案代码则参照《机器学习实战》一书的内容,并做了一些修改。CART决策树 使用基尼指数(Gini Index)来选择划分属性。其公式如下:本文内容包括未剪枝CART决策树、预剪枝CART决策树以及后剪枝决策树本文使用的Python库包括numpypandasmath原创 2016-04-04 17:00:22 · 30029 阅读 · 17 评论