
机器学习
千尺浪
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Dynamic Routing Between Capsules 深度学习新方向-胶囊
Dynamic RoutingBetween Capsules 荚膜是一组神经元,其活动向量代表特定类型实体的实例化参数,如对象或对象部分。我们使用的活动矢量长度表示实体的存在和它的方向代表实例化参数的概率。一级的活性胶囊通过变换矩阵预测更高级别胶囊的实例化参数。当多个预测一致时,一个更高水平的胶囊变得活跃。我们发现,discrimininatively训练多层胶囊系统达到了国原创 2017-10-28 10:29:40 · 2588 阅读 · 1 评论 -
机器学习-EM算法
EM算法Expectation-Maximization:最大似然EM算法推导GMM(高斯混合模型) EM算法最大似然估计一个栗子:假如你去赌场,但是不知道能不能赚钱,你就在门口堵着出来一个人就问一个赚了还是赔了,如果问了5个人都说赚了,那么你就会认为,赚钱的概率肯定是非常大的。已知:(1)样本服从分布的模型, (2)观测到的样本求解:模型的参数原创 2017-11-26 11:51:20 · 358 阅读 · 0 评论 -
机器学习-神经网络
为什么围棋选手不信阿法狗呢?结果呢?4:1 李世石惨败人工智能的时代已经来临为什么人工智能技术这么厉害? 无人驾驶汽车:1.物体检测2.行人检测3.标志识别4.速度识别。。。 黑科技:Image TransferContent + Style = Interesting thing (假设我们有一系列的标签:狗,猫,汽车,飞机。。原创 2017-11-26 11:57:52 · 310 阅读 · 0 评论 -
cifar分类可能遇到的错误更正
直接运行课件下载的源码会报错是因为它是python2,而你的是python3。如果是python2版本是可以直接运行的。更改:1, python2和3使用的默认编码是不同的,我们会发现pickle.load()函数报错。在代码开始部分添加如图所示代码:同时把这个函数里面添加:因为python3把cpickle改成pickle了,记得把import那里修改好原创 2017-12-14 21:00:03 · 319 阅读 · 0 评论 -
机器学习-时间序列分析
ARIMA平稳性:平稳性就是要求经由样本时间序列所得到的拟合曲线在未来的一段期间内仍能顺着现有的形态“惯性”地延续下去平稳性要求序列的均值和方差不发生明显变化 ARIMA严平稳与弱平稳:严平稳:严平稳表示的分布不随时间的改变而改变。如:白噪声(正态),无论怎么取,都是期望为0,方差为1弱平稳:期望与相关系数(依赖性)不变未来某时刻的t的值Xt就要依赖于它原创 2017-11-27 20:18:13 · 3894 阅读 · 0 评论 -
机器学习-文本分析
文本分析文本数据 文本分析停用词 1.!2."3.#4.$5.%6.&7.'8.(9.)10.*11.+12.,13.-14.--15..16...17....18......原创 2017-11-27 20:18:43 · 2764 阅读 · 0 评论 -
机器学习-自然语言处理
自然语言处理 深度学习 深度学习为什么需要深度学习 机器翻译 拼写纠错 智能问答语言模型语言模型实例: 机器翻译 拼写纠错语言模型P(h原创 2017-11-27 20:19:23 · 1391 阅读 · 0 评论 -
机器学习数据集
大学公开数据集(Stanford)69G大规模无人机(校园)图像数据集【Stanford】http://cvgl.stanford.edu/projects/uav_data/ 人脸素描数据集【CUHK】http://mmlab.ie.cuhk.edu.hk/archive/facesketch.html 自然语言推理(文本蕴含标记)数据集【NYU】http://w原创 2017-11-27 20:59:56 · 4818 阅读 · 0 评论 -
树模型
%matplotlib inlineimportmatplotlib.pyplotaspltimport pandasaspdfromsklearn.datasets.california_housingimportfetch_california_housinghousing = fetch_california_housing()print(housing.原创 2017-12-15 21:11:27 · 490 阅读 · 0 评论 -
机器学习-LDA与PCA算法
Linear Discriminant Analysis用途:数据预处理中的降维,分类任务历史:Ronald A. Fisher在1936年提出了线性判别方法线性判别分析(LDA)目标:LDA关心的是能够最大化类间区分度的坐标轴成分将特征空间(数据集中的多维样本)投影到一个维度更小的 k 维子空间中,同时保持区分类别的信息 Linear Discriminant A原创 2017-11-26 11:46:36 · 658 阅读 · 0 评论 -
机器学习-xgboost
目标函数:如何最优函数解?集成算法的表示: 现在还剩下一个问题,我们如何选择每一轮加入什么f呢?答案是非常直接的,选取一个f来使得我们的目标函数尽量最大地降低 1.样本上遍历2.叶子节点上遍历3.带回原目标函数原创 2017-11-26 11:42:03 · 240 阅读 · 0 评论 -
机器学习-推荐系统
推荐系统 推荐系统19444人在进行视频或语音聊天62.5万部优酷土豆视频被观看Facebook共产生701,389账号登陆App Store上已有51,000个app被下载。。。 推荐系统 推荐系统 推荐系统 协同过滤如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?如何确定一个用户是不是和你有相似的品位?如何将邻居们原创 2017-11-26 11:34:51 · 694 阅读 · 0 评论 -
一文读懂Hinton最新Capsules论文
Capsule:实体的视觉数学表征深度学习,其实就是一系列的张量变换。从图像、视频、音频、文字等等原始数据中,通过一系列张量变换,筛选出特征数据,以便完成识别、分解、翻译等等任务。譬如原始数据是 28 x 28 的黑白图像,每个黑白像素可以用 8 个 bits 来表达,那么这张黑白图像就可以用 28 * 28 * 8 的张量来表达,张量中转载 2017-11-29 21:12:17 · 323 阅读 · 0 评论 -
梯度下降求解逻辑回归(代码)
import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlineimport ospath = 'data' + os.sep + 'LogiReg_data.txt'pdData = pd.read_csv(path, header=None, names=['Exam 1'原创 2017-12-03 16:18:09 · 1212 阅读 · 3 评论 -
梯度下降求解逻辑回归
Logistic RegressionThe data我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会。你有以前的申请人的历史数据,你可以用它作为逻辑回归的训练集。对于每一个培训例子,你有两个考试的申请人的分数和录取决定。为了做到这一点,我们将建立一个分类模型,根据考试成绩估计入学概率。The原创 2017-12-03 16:47:31 · 536 阅读 · 0 评论 -
机器学习-线性回归
一个栗子数据:工资和年龄(2个特征)目标:预测银行会贷款给我多少钱(标签)线性回归考虑:工资和年龄都会影响最终银行贷款的结果那么它们各自有多大的影响呢?(参数)工资 年龄 额度4000 25 200008000 30 700005000原创 2017-11-26 11:08:06 · 310 阅读 · 0 评论 -
机器学习-决策树与集成算法
树模型决策树:从根节点开始一步步走到叶子节点(决策)决策树所有的数据最终都会落到叶子节点,既可以做分类也可以做回归 树的组成根节点:第一个选择点决策树非叶子节点与分支:中间过程叶子节点:最终的决策结果 决策树的训练与测试训练阶段:从给定的训练集构造出来一棵树(从跟节点开始选择特征,如何进行特征切分)决策树测试阶段:根据构造出来的树模型从上原创 2017-11-26 11:12:15 · 510 阅读 · 0 评论 -
机器学习-聚类算法
K-MEANS算法聚类概念:无监督问题:我们手里没有标签了难点:如何评估,如何调参聚类:相似的东西分到一组 K-MEANS算法基本概念:要得到簇的个数,需要指定K值距离的度量:常用欧几里得距离和余弦相似度(先标准化)优化目标:质心:均值,即向量各维取平均即可 K-MEANS算法工作流程: K-MEANS算法优势:简单,快速,适原创 2017-11-26 11:16:40 · 454 阅读 · 0 评论 -
机器学习-贝叶斯算法
贝叶斯贝叶斯简介:贝叶斯(约1701-1761) Thomas Bayes,英国数学家贝叶斯方法源于他生前为解决一个“逆概”问题写的一篇文章生不逢时,死后它的作品才被世人认可 贝叶斯贝叶斯要解决的问题:正向概率:假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大逆向概率:如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个原创 2017-11-26 11:22:54 · 371 阅读 · 0 评论 -
机器学习-支持向量机
Support Vector Machine要解决的问题:什么样的决策边界才是最好的呢?支持向量机特征数据本身如果就很难分,怎么办呢?计算复杂度怎么样?能实际应用吗?目标:基于上述问题对SVM进行推导 Support Vector Machine决策边界:选出来离雷区最远的(雷区就是边界上的点,要Large Margin)支持向量机 距离的计算支持向原创 2017-11-26 11:26:32 · 315 阅读 · 0 评论 -
xgboost
importxgboost# First XGBoost model for Pima IndiansdatasetfromnumpyimportloadtxtfromxgboostimportXGBClassifierfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccura原创 2017-12-15 21:12:28 · 357 阅读 · 0 评论