
机器学习算法
文章平均质量分 71
Mingsheng Zhang
20年开始工作于金山云调度算法,主要是做优化算法,包括运筹优化,机器学习优化
展开
-
通俗理解谱聚类
转自:谱聚类(spectral clustering)原理总结 - 刘建平Pinard - 博客园本文对其中的难懂的地方做一些备注 谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂。在处理实际的聚类问题时,个人认为谱聚类是应该首先考虑的几种算法之一。下面我们就对谱聚类的算法原理做一个总结。1. 谱聚类概述 谱聚类是从图论中演化出来转载 2021-11-03 20:29:36 · 933 阅读 · 0 评论 -
LSTM/GRU 出现预测值滞后现象
问题:当利用LSTM/GRU等做预测时,在数据上升较快或者下降较快的地方出现预测值滞后现象,即T+1时刻的预测值就是或者与T,T-1时刻的真实输入值基本相同原因:回归算法将使用您提供的时间窗口中的值作为样本,以最大程度地减少误差。假设您正在尝试预测时间t的值。输入是以前的收盘价,即t-20到t-1的最后20个输入的时间序列窗口(假设样本输入的timestamp是20)。回归算法可能会学习在时间t-1或t-2处的值作为预测值,因为这样不需要做什么就可以达到优化的误差之类了。这样想:如果在t-1值6..原创 2021-03-08 22:27:55 · 15142 阅读 · 7 评论 -
LSTM 与GRU
LSTM 通俗理解:https://blog.youkuaiyun.com/v_JULY_v/article/details/89894058GRU :https://www.jiqizhixin.com/articles/2017-12-24原创 2021-03-06 20:00:58 · 330 阅读 · 0 评论 -
激活函数以0为中心的好处
今天在讨论神经网络中的激活函数时,陆同学提出 Sigmoid 函数的输出不是以零为中心的(non-zero-centered),这会导致神经网络收敛较慢。关于这一点,过去我只是将其记下,却并未理解背后的原因。此篇谈谈背后的原因。神经元如图是神经网络中一个典型的神经元设计,它完全仿照人类大脑中神经元之间传递数据的模式设计。大脑中,神经元通过若干树突(dendrite)的突触(synapse),接受其他神经元的轴突(axon)或树突传递来的消息,而后经过处理再由轴突输出。在这里,诸x..转载 2021-03-06 17:15:37 · 2661 阅读 · 6 评论 -
机器学习实战——第十二章-FP-growth
第一部分为我看到的一篇文章https://www.cnblogs.com/pinard/p/6307064.html,让我理解了这个算法,很好,讲的很明白,我引用过来了。1.FP Tree数据结构 为了减少I/O次数,FP Tree算法引入了一些数据结构来临时存储数据。这个数据结构包括三部分,如下图所示: 第一部分是一个项头表。里面记录了所有的1项频繁集出现的次数,按...转载 2019-02-26 21:58:54 · 5445 阅读 · 3 评论 -
对dropout的一些理解
20. 为什么dropout在训练期间神经元将被连接到两倍于( 平均) 的输入神经元。 为了弥补这个事实,我们需要在训练之后将每个神经元的输入连接权重乘以1-p??有一个小而重要的技术细节。 假设 p = 50% ,在这种情况下,在测试期间,输入的信号是训练新号的两倍,因为训练的时候对输入信号进行了dropout(p=0.5),而测试的时候不进行dropout,所以训练的时候输入信号只是测试...原创 2019-07-05 15:43:18 · 17632 阅读 · 7 评论