
机器学习
山歌嘎子
睡觉睡觉
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Learning with Pseudo-Ensembles
Learning with Pseudo-EnsemblesPseudo-EnsemblesThe Pseudo-Ensemble Agreement regularizer新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是...原创 2019-10-23 15:31:54 · 1173 阅读 · 0 评论 -
生成模型
数理统计基本概念 先解释一些基本概念:举例说明,如果你在山洞,觉得山洞中有熊出现的事件为,然后听到山洞中传出来一阵熊吼的事件为。那么一开始你觉得山洞中有熊的事件的概率为,听到熊吼之后的认为山洞中有熊的概率为。很明显。这里就是所谓的先验概率;就是后验概率。 先验概率:为先验概率,是根据以往数据的分析或者经验的到的概率; 后验概率:为后验概率,是根据本次实验的信息从而重新修正的概率。 条件概...原创 2018-11-14 17:32:58 · 665 阅读 · 0 评论 -
聚类算法(一)
聚类任务 在无监督学习(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。形式化的表示为:样本集D={x1,x2...,xm}D={x1,x2...,xm}D = \left \{x_1,x_2...,x_m \right \} 包含mmm个无标记样本,每个样本xi=(x...原创 2018-04-07 13:49:56 · 387 阅读 · 0 评论 -
损失函数(一)
1. 损失函数损失函数(Loss function)是用来估量你模型的预测值 f(x)f(x) 与真实值 YY 的不一致程度,它是一个非负实值函数,通常用 L(Y,f(x))L(Y,f(x)) 来表示。损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数的重要组成部分。模型的风险结构包括了风险项和正则项,通常如下所示: θ∗=argminθ1N∑i=1NL(yi,f...转载 2018-03-21 16:12:43 · 1500 阅读 · 0 评论 -
梯度下降算法(一)
梯度下降法 梯度下降法是求解无约束最优化问题的一种最常用的方法,有实现简单的特点。梯度下降法是迭代算法,每一步需要求解目标函数的梯度向量。假设f(x)f(x)f(x)是NNN为维几里德空间上具有一阶连续偏导数的函数。 符号解释 学习率: aaa 特征值:x1,x2x1,x2x_{1},x_{2} 参数:w1,w2w1,w2w_{1},w_{2} 预测函数:...原创 2018-03-24 15:50:00 · 505 阅读 · 0 评论 -
梯度下降算法(二)
梯度下降法大家族(BGD,SGD,MBGD) 批量梯度下降法(Batch Gradient Descent) 批量梯度下降法,是梯度下降法最常用的形式,具体做法也就是在更新参数时使用所有的样本来进行更新,这个方法对应于前面3.3.1的线性回归的梯度下降算法,也就是说3.3.1的梯度下降算法就是批量梯度下降法。 θi=θi−α∑j=0m(hθ(x(j)0,x(j)1,...x...转载 2018-03-29 21:12:10 · 283 阅读 · 0 评论 -
机器学习公开数据集
原文地址:http://rensanning.iteye.com/blog/1601663 海量数据(又称大数据)已经成为各大互联网企业面临的最大问题,如何处理海量数据,提供更好的解决方案,是目前相当热门的一个话题。类似MapReduce、 Hadoop等架构的普遍推广,大家都在构建自己的大数据处理,大数据分析平台。 相应之下,目前对于海量数据处理人才的需求也在不断增多,此类人才可谓炙手可热!越转载 2018-01-31 17:52:46 · 9245 阅读 · 0 评论 -
mahout (一)kmeans的使用
原文地址:http://mahout.apache.org/users/clustering/k-means-commandline.html翻译 2017-11-27 11:17:11 · 373 阅读 · 0 评论 -
常用机器学习数据集网站
常用的基本上UCI和w3c的。关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:http://www.cs.waikato.ac.nz/ml/weka/UCI收集的机器学习数据集ftp://pami.sjtu.edu.cnhttp://www.ics.uci.edu/~mlearn/\\MLRepository.htmstatli转载 2017-11-26 22:01:16 · 2628 阅读 · 1 评论 -
hadoop2.7+mahout0.13.0在数据集synthetic_control.data具体操作
hadoop 2.7 运行环境:Ubuntu16.04 master节点:1 slave节点:2原创 2017-11-20 19:42:43 · 1892 阅读 · 0 评论 -
损失函数(二)
损失函数(loss function)是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项,通常可以表示成如下式子:θ∗=argminθ1N∑i=1NL(yi,f(xi;θ))+λ Φ(θ)θ∗=a...转载 2017-09-03 20:52:47 · 799 阅读 · 0 评论 -
良/恶性乳腺癌肿瘤预测
'''Created on 2017年5月25日@author: Administrator'''#导入numpy工具包,并且更名为npimport numpy as np#导入pandas工具包,并且更名为pdimport pandas as pd#导入matplotlib工具包中的pyplot,并且更名为pltimport matplotlib.pyplot as plt#导入sklearn工原创 2017-05-25 16:43:24 · 788 阅读 · 1 评论 -
线性模型
线性模型一、基本形式 线性模型是一种有监督学习,它试图得到一个线性模型以尽可能准确地预测实际输出标记。f(x)=w1x1+w2x2+...+wdxd+bf(x)=w_1x_1+w_2x_2+...+w_dx_d+b其中x1x_1到xdx_d为描述事例xx的dd个属性,w=(w1;w2;...;wd),ww=(w_1;w_2;...;w_d),w可以看作每个属性的权重系数越大对于线性模型影响越大。翻译 2017-05-22 19:33:31 · 632 阅读 · 0 评论