
机器学习
文章平均质量分 85
跳舞的驴子
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
R语言 基本数据分析
本文基于R语言进行基本数据统计分析,包括基本作图,线性拟合,逻辑回归,bootstrap采样和Anova方差分析的实现及应用。不多说,直接上代码,代码中有注释。1. 基本作图(盒图,qq图)[plain] view plaincopy#basic plot boxplot(x) qqplot(x转载 2014-06-02 19:56:29 · 845 阅读 · 0 评论 -
K近邻(KNN):分类算法
K近邻(KNN):分类算法* KNN是non-parametric分类器(不做分布形式的假设,直接从数据估计概率密度),是memory-based learning.* KNN不适用于高维数据(curse of dimension)* Machine Learning的Python库很多,比如mlpy(更多packages),这里实现只是为了掌握方法* MA转载 2014-06-02 19:52:02 · 968 阅读 · 0 评论 -
决策树的实现
本文基于python逐步实现Decision Tree(决策树),分为以下几个步骤:加载数据集熵的计算根据最佳分割feature进行数据分割根据最大信息增益选择最佳分割feature递归构建决策树样本分类关于决策树的理论方面本文几乎不讲,详情请google keywords:“决策树 信息增益 熵”将分别体现于代码。本文只建一个.py文件,所有代码转载 2014-06-02 19:50:08 · 834 阅读 · 0 评论 -
MC, MCMC, Gibbs采样 原理&实现(in R)
本文用讲一下指定分布的随机抽样方法:MC(Monte Carlo), MC(Markov Chain), MCMC(Markov Chain Monte Carlo)的基本原理,并用R语言实现了几个例子:1. Markov Chain (马尔科夫链)2. Random Walk(随机游走)3. MCMC具体方法: 3.1 M-H法 3.2 G转载 2014-06-02 19:54:38 · 1334 阅读 · 0 评论