
机器学习
文章平均质量分 75
kjcsdnblog
新人求罩
展开
-
优化算法——牛顿法和拟牛顿法
原文链接原创 2017-12-02 11:28:41 · 342 阅读 · 0 评论 -
LDA主题模型要概括
本文为学习LDA主题模型的笔记,主要是对LDA主题模型进行一个简单的概括,具体的细节及推导可以参见:非常详细的参考资料一、问题提出什么是主题模型?什么是LDA? 将文档集中,每篇文档的主题按照概率分布的形式给出,属于无监督的学习算法。需要的输入仅仅是文档集和指定的文档主题数量K 隐含狄利克雷分布(Latent Dirichlet allocation)简称LDA。LDA是一种典型的词袋原创 2017-10-25 20:17:46 · 2320 阅读 · 0 评论 -
中文分词原理及实践
简要介绍中文分词的原理中文分词原理中文分词算法可以分成以下几种基于词典的方法基于统计的方法基于规则的方法基于词典的方法正向最大匹配1) 正向最大匹配算法首先从句首(文章首部)开始选取m个字符作为待匹配字段,m为词典中最长词条的字符个数。2) 将待匹配字段与词典进行匹配,若匹配成功则说明待匹配字段可以当成是一个词3) 若匹配失败,则将待匹配字段的最后一个字符去掉,再用新的待匹配字段与词典中的词原创 2017-10-20 17:08:45 · 409 阅读 · 0 评论 -
支持向量机专题——线性可分支持向量机
原文支持向量机(support vector machine, SVM)是一种经典的分类器,其主要思想是学习一个在特征空间上使间隔最大的分类器。支持向量机的学习可以看成是一个求解凸二次规划问题的过程,同时也等价于正则化的合页损失函数的最小化问题。支持向量机可以分为:线性可分支持向量机、线性支持向量机、非线性支持向量机三种。当训练数据线性可分时,可通过硬间隔最大化,学习一个线性可分支持向量机(也称为硬原创 2017-09-02 00:50:09 · 867 阅读 · 0 评论 -
梯度下降
原文在机器学习中,梯度下降是十分常见的一种方法。在很多机器学习算法中,对于参数的学习调整,采用的方法都是梯度下降。可以说,梯度下降是每一个学习Machine Learning 的人必须彻底掌握的方法。只有理解了梯度下降,才能初步对于机器学习有所了解。接下来,这篇博客将从头到尾详细讲述一遍梯度下降。首先必须说明的是,这篇博客是参照Andrew Ng讲解的《Machine Learning》课程中关于梯原创 2017-09-02 00:45:10 · 383 阅读 · 0 评论 -
使用weka内置算法分析数据(图形界面操作)
原文 本文使用weka中内置的三种分类算法(naive bayes,SVM,Logistic Regression)根据收集到的鸢尾属植物的数据进行分类,通过精度和效率对三种算法进行比较。1、鸢尾属植物的分类数据中包含鸢尾属植物的四种属性。四种属性分别是萼片长度、萼片宽度、花瓣长度、花瓣宽度。数据中还包含鸢尾属植物的三种种类,分别是:Iris-setosa(山鸢尾)、Iris-Versicol原创 2017-09-02 00:43:29 · 3785 阅读 · 0 评论