
数据挖掘
文章平均质量分 73
MezereonXP
A developer ,love life, love saber
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
关于机器学习中的梯度下降
说到梯度,在高等数学已经有十分全面的解释,然而再机器学习之中的梯度下降算法中梯度实际也是一样的,这个算法现在的实用性已经不大了,但是仍有必要提一提。在解决最优化问题之中,找到局部最优值是算法编写的目的,在高等数学之中,函数曲线中一点的梯度代表了这一点沿这一曲线上升或下降的最快方向,那么在机器学习之中,我们也是想寻找一种方法让某个值变得很小或很大,那么机器学习中想让哪个值变得小呢,这原创 2017-01-10 18:08:26 · 427 阅读 · 0 评论 -
关于机器学习中的朴素贝叶斯以及拉普拉斯平滑
看过我博文的同学可能知道机器学习之中,存在着监督学习以及生成学习,其主要区别我在另一篇文章中有详细描述,今天我们要讨论的是,在高斯判别分析之中,特征向量x是连续的,实数域上的向量,那么如果这个特征向量x是离散的情况呢?这就引入了朴素贝叶斯的理论。在这里,借鉴Andrew Ng机器学习课程上面的例子,即对垃圾邮件进行分类,我们希望能够有一种学习算法,能够对邮件进行分类,自动区分邮件是否是垃圾原创 2017-01-12 02:03:54 · 10344 阅读 · 2 评论 -
关于机器学习中的生成学习算法(Generative Learning Algorithm)
我们之前可能接触到一些线性回归的案例,以至于广义线性模型GLM等等之类的,这些模型呢,都是在给定训练集合,而且这些训练集有着确定的输入和输出,我们通过利用这些训练集来构建预测函数,从而实现预测,判断之类的功能。举个简单的例子,我们需要将大象和狗分类,以往的做法是,利用特征来画出分界线,那么下一次我们只需要输入特征就可以利用这条分界线来判断这只动物是大象还是狗了。那么还有另一种方法,如果我们原创 2017-01-11 19:26:23 · 496 阅读 · 0 评论 -
Building task-oriented dialogue systems for online shopping 论文笔记
Building task-oriented dialogue systems for online shopping 论文笔记1. 摘要该文给出了针对用于线上购物的面向任务的对话系统的一个一般的解决方案, 目标是协助用户完成多样化的购买相关任务, 比如搜索商品和回答问题, 如同正常人之间的对话. 作为一个创始工作, 我们会展现NLP的技术, 数据源以及可以利用的众包来建立这样一个关于...原创 2018-04-01 20:46:39 · 933 阅读 · 1 评论 -
教你用java实现时序数据异常检测(1)LOF-ICAD方法
数据的异常检测是一个难题, 面临许多挑战, 其中包括: - 定义一个正常表现的范围是比较困难的, 异常值和正常值有时候边界并不是特别明显 - 某些恶意行为会伪装成正常值, 难以发现 - 大多数领域的正常行为只能在一段时间内有效, 对于未来的普适性并不是很高 - 对于异常的概念会由于应用的不同而不同 - 缺少带有标记的数据 - 数据的噪声可能有较大的影响分析异常数据有多种方案, 包括...原创 2019-06-12 20:46:35 · 3171 阅读 · 0 评论 -
时序数据异常检测(2)指数平滑方法
上文我们使用LOF-ICAD方法实现了时序数据的异常检测, 这次我们介绍一种更为常见的方法——-指数平滑.指数平滑的方法, 其原理就是通过拟合出一个近似的模型来对未来进行预测, 我们可以通过这个预测来和实际的值进行比较, 如果差距过大, 我们就可以判定这个点是异常的.首先我们介绍一下一阶指数平滑的算法一阶指数平滑算法这里给出一些符号的定义: 1. 序列长度记为n, 参数记为α...原创 2019-06-12 20:46:57 · 2474 阅读 · 0 评论 -
凸优化笔记(1) 引言
#凸优化笔记(1) 引言文章目录1. 引言1.1 数学优化1.1.1 应用1.1.2 求解优化问题1.2 最小二乘和线性规划1.2.1 最小二乘问题1.2.2 线性规划1.3 凸优化1.3.1 求解凸优化问题1.3.2 使用凸优化1.4 非线性优化1.4.1 局部优化1.4.2 全局优化1.4.3 非凸问题中凸优化的应用1. 引言1.1 数学优化优化问题可以写成如下形式minimize&...原创 2019-03-11 16:42:51 · 295 阅读 · 0 评论