
Machine Learning
文章平均质量分 83
Jayden Huang
这个作者很懒,什么都没留下…
展开
-
机器学习之一:K近邻算法学习笔记
本文为作者学习K近邻算法后的整理笔记,仅供学习使用!K近邻算法1、概述 意思是K个最近的邻居,也就是说对于每个样本,都可以用它最近的K个邻居来代表。2、工作原理(1)存在一个训练样本集,样本集中的每一个数据都有对应的标签(2)当输入一个新的数据时,将新数据中的每个特征与训练样本集中对应的特征进行比较(3)利用算法提取出训练样本集中与新数据最相似的K个数据(4)将这...原创 2018-09-06 00:36:03 · 322 阅读 · 0 评论 -
机器学习之二:决策树
本文为作者学习决策树后的整理笔记,仅供学习使用!决策树1、概述 决策树(Decision Tree)实在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于0的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。2、基本原理(1)工作原理: a、获取原始数据集 b、基于最好的属性值划分数据集 ...原创 2018-09-23 15:43:01 · 294 阅读 · 0 评论 -
机器学习之三:朴素贝叶斯算法
本文为作者学习朴素贝叶斯算法后的整理笔记,仅供学习使用!一、概述 贝叶斯算法是一系列分类算法的总称,这类算法均是以贝叶斯定理为基础,所以将之统称为贝叶斯分类。而朴素贝叶斯(Naive Bayesian)是其中应用最为广泛的分类算法之一。 朴素贝叶斯分类器是基于一个简单的假定:给定目标值时属性之间相互条件独立。二、核心思想 用p1(x, y)表示数据点(x, y)输入类别1...原创 2018-09-27 00:32:21 · 306 阅读 · 0 评论 -
机器学习之四:Logistic回归
本文为作者学习Logistic回归算法后的整理笔记,仅供学习使用!一、概述 假设现有一些数据点,现有一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程称为回归。二、核心思想 根据现有数据分类边界线建立回归公式,以此进行分类。三、优缺点(1)优点 计算代价不高,易于理解和实现(2)缺点 容易欠拟合,分类精度可能不高 综上,该算法适...原创 2018-10-09 00:00:42 · 191 阅读 · 0 评论 -
机器学习之Word2Vec
本文为作者学习Word2Vec算法后的整理笔记,仅供学习使用!1、概述 Word2vec是Geogle公司2013年开源的一款用于训练词向量的软件工具。可以根据给定的语料库,通过优化后的训练 模型快速有效地将一个词语表达成向量形式。2、语言模型 统计语言模型用于统计一个句子出现概率的模型。 给定一个由n个词语按顺序组成的句子S = (W1, W2, W3, ..., WN...原创 2018-10-24 22:39:56 · 444 阅读 · 0 评论 -
深度学习之神经网络
本文为作者学习神经网络后的整理笔记,仅供学习使用!一、概述 人工神经网络(Artificial Neural Network,即ANN),它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。 神经网络是一种运算模型,由大量的节点(或神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数。每两个节点间的连接都代表一个对于通过该连...原创 2018-11-15 00:16:39 · 557 阅读 · 0 评论 -
Tensorflow报错:InvalidArgumentError:indices[401,33] = 77571 is not in [0, 10000)
在进行影评文本分类时,遇到一个报错,记录下解决过程。报错信息:InvalidArgumentError:indices[401,33] = 77571 is not in [0, 10000)[[{{node embedding/embedding_lookup}} = ResourceGather[Tindices=DT_INT32, dtype=DT_FLOAT, valida...原创 2019-03-31 23:49:02 · 14543 阅读 · 4 评论