
Big Data
文章平均质量分 68
Yunhe_Feng
这个作者很懒,什么都没留下…
展开
-
LDA 主题模型解析
这几篇文章分析的LDA比较透彻:http://www.cnblogs.com/hebin/archive/2013/04/25/3043575.htmlhttp://m.blog.youkuaiyun.com/blog/lansatiankongxxc/8875634http://m.blog.youkuaiyun.com/blog/lansatiankongxxc/8875660转载 2015-05-31 04:18:09 · 1102 阅读 · 0 评论 -
评价聚类结果之entropy(熵值)和purity(纯度)
使用k-means算法对数据进行聚类之后,通常需要估计一下原创 2015-06-12 09:46:09 · 38705 阅读 · 1 评论 -
R语言中常用的语法
R语言中的$表示访问一个变量的分组或者插槽。R语言中的数组访问data(, [1:10])原创 2015-08-17 22:33:01 · 1366 阅读 · 0 评论 -
何时需要对时间序列进行Log Transformation
处理时间序列数据时,经常需要对数据进行预处理,然后在使用复杂模型处理数据。其中,常用的一种方法就是对数据取log,进行log变形。那么什么样的时间序列数据需要进行取log呢?查阅资料发现,如果数据满足如下两点,就比较适合take log。每个时刻的数据都为正数(为0时,可以通过+1来变为正数)数据的变化量随着时间的增加,指数级增加以一个具体的例子来看:原始数据:原创 2015-08-31 06:43:26 · 9525 阅读 · 3 评论