
机器学习
dextern
这个作者很懒,什么都没留下…
展开
-
支持向量机(SVM)简介
本文主要参考于http://www.cnblogs.com/steven-yang/p/5658362.html基本概念:支持向量机(Support Vector Machine,SVM)是一种解决二元分类问题的方法。它根据实验数据中的部分数据来确定分类器,这些部分数据叫做支持向量。“机”是指分类器。接下来通过实例更加直观的理解支持向量机。原创 2017-07-03 10:15:54 · 2889 阅读 · 7 评论 -
决策树(decision tree)简介
基本概念:决策树用来解决分类问题,一棵树包含一个根结点,多个内部结点和多个叶子结点。未知数据从树的根结点开始判断,一直到叶子结点得到分类结果。本文主要关注决策树的构造方法。决策树算法是一种根据数据属性的泛化能力大小来进行分类的方法。其中属性的泛化能力大小由信息增益和信息增益率来评估。具体步骤:1.信息熵定义: 2.信息增益定义: 属性的信息增益越大表明属性的泛化能力越强。 3.增益率定原创 2017-07-03 20:38:38 · 598 阅读 · 3 评论 -
朴素贝叶斯过滤垃圾邮件
邮件数据下载地址:http://download.youkuaiyun.com/detail/liyuefeilong/9106481 具体代码如下:# -*- coding: utf-8 -*-"""Created on Tue Sep 08 16:12:55 2015@author: Administrator"""from numpy import *# 创建实验样本,可能需要对真实样本做一些处理原创 2017-07-04 16:31:41 · 1133 阅读 · 2 评论 -
基于梯度上升算法的Logistic回归
基本概念:Logisitc回归用来解决二分类问题,训练数据为f(x,y),x为特征,y为类别。它的假设函数为Sigmoid函数,Sigmoid函数具体定义为: Sigmoid函数图像: 图1 Sigmoid函数从图像中可看出该函数的值大于0小于1,在分类问题中若大于0.5,则属于类1,若小于0.5则属于类0。Sigmoid函数的输入X为: 其中的[x_0,x_1,x_2原创 2017-07-04 19:44:35 · 545 阅读 · 2 评论 -
全连接神经网络
基本概念:人工神经网络是根据生物神经网络构造的一种数据模型,每一层包含大量神经元。每两层神经元间的连接都存在一个初始参数,这个参数用来衡量神经元间相连接的重要程度。神经网络的每一层都具有多个节点,每个节点都与下层的所有节点相连,并且每一层的输出可以作为下一层的输入,每层神经网络中的节点只与其上一层和下一层的节点相连。 图1 神经网络结构BP(Back Propagation)神经网络:它是原创 2017-07-05 15:31:44 · 1352 阅读 · 1 评论 -
LDA(主题模型)简介
LDA(主题模型)1、 基本概念LDA(Latent Dirichlet Allocation)是一种文档主题生成模型。LDA的作用是判断两个文档的相似度,传统的方法使用词共现来判断,例如TF-IDF等,但这种方法未考虑文档的语义结构。LDA模型根据文档中的主题分布来判断文档的相似度。给定一个文档,首先分析出文档中包含哪些主题,然后判断不同文档中各个主题出现的概率大小。 例如下面两句话:原创 2017-08-29 21:00:07 · 3634 阅读 · 1 评论