
机器学习
Pikachu5808
这个作者很懒,什么都没留下…
展开
-
Gensim官方教程中译版
Gensim是一个基于Python实现的工具包,正如其所描述的“topic modeling for human”,它上手很快,简单易学。整个包主要用于主题模型的计算,当然其中也实现了其它一些NLP中常用的算法(包括LSA,word2vec等)。为方便大家的使用,译者在此将其官网的教程翻译成中文,也算是为后来者做一点贡献。 限于译者的水平,翻译过程中难免存在错误纰漏,对于本文的任何建议,望读翻译 2018-01-31 16:20:18 · 556 阅读 · 0 评论 -
《统计学习方法》系列(1)
最近在看李航老师的《统计学习方法》,为了让书本上的知识更好地沉淀,也便于和大家更好地交流,遂决定每看完一章则写一篇笔记,将书中值得思考的地方写下来。所写内容均包含笔者本人的理解,限于水平,难免有纰漏,望读者不吝指正。 本篇对应全书第一章,主要讲了统计学习方法的一些基本概念。 1.基本概念 a).统计学习方法主要有:监督学习(supervised learning)、非监督学习...原创 2018-02-02 14:41:18 · 322 阅读 · 0 评论 -
《统计学习方法》系列(2)
本篇对应全书第二章,讲的是感知机。感知机(perceptron)是二类分类的线性分类模型,对应于输入空间(特征空间)中将数据进行线性划分的分离超平面,属于判别模型。感知机1957年由Rosenblatt提出,是神经网络与支持向量机的基础。 1、理论讲解 1.1、感知机模型 假设输入空间(特征空间)是⊆RnX⊆Rn,输出空间是={1,−1}Y={1,−1}。输入x∈x∈X表示...原创 2018-03-04 16:27:31 · 337 阅读 · 0 评论 -
《统计学习方法》系列(3)
本篇对应全书第三章,讲的是kkk近邻法。kkk近邻法(k-nearest neighbor,k-NN)是一种基本分类与回归方法,输入为实例的特征向量,对应于特征空间中的点,输出为实例的类别,可以取多类。kkk近邻法不具有显示的学习过程,它实际上利用训练集对特征向量空间进行划分,并作为其分类的模型。kkk近邻法1968年由Cover和Hart提出。 1、理论讲解 距离度量、k值的...原创 2018-03-24 15:17:47 · 272 阅读 · 0 评论 -
《统计学习方法》系列(4)
本篇对应全书第四章,讲的是朴素贝叶斯法。朴素贝叶斯(Naive Bayes)是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入xxx,利用贝叶斯定理求出后验概率最大的输出yyy。 1、理论讲解 1.1、模型原理 设输入空间X⊆RnX⊆Rn\mathbf X \subsete...原创 2018-04-03 20:16:16 · 309 阅读 · 0 评论 -
《统计学习方法》系列(5)
本篇对应全书第五章,讲的是决策树。决策树(decision tree)是一种基本的分类与回归方法。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。决策树学习通常包括3个步骤:特征选择、决策树的生成和决策树的修剪。决策树学习常用的算法有ID3、C4.5和CART。 1、理论讲解 ID3和C4.5生成的决策树只能用于分类问题,而CART生成的决策树既可用于分类...原创 2018-04-06 17:36:58 · 498 阅读 · 0 评论