
日记
DeeFOX
架构师之路
展开
-
日记2015/1/15
今天没完成任务:实现:FP-GROWTH:http://blog.youkuaiyun.com/fansy1990/article/details/41279833今天安装完了hadoop1.2 + mahout0.9并且配置了一个远程登录的vnc,其实就是傻瓜教程:。。。晚上写了一个小时的博客~~挺好的听日将今日未做完的事情搞定了FP-GROWTH + LDA + user-basedKNN原创 2015-01-15 00:34:15 · 446 阅读 · 0 评论 -
日记2015/1/13
昨天做了一个PPT用于今天的展示,发现ppt水平不行了,以后记得,展示的尤其是一个过程,尽量在一页之内用消失、出现等动作来表示!展示完剩下的时间主要用来配置hadoop集群安装之前的必要准备工作。附上ppt:明天装一下hadoop2:http://www.aboutyun.com/thread-10572-1-1.html http://blog.youkuaiyun.com/fansy1990/原创 2015-01-14 00:04:25 · 405 阅读 · 0 评论 -
日记2015/1/19
开始实现音乐推荐算法了,今日大概写了一下融合部分的代码和推荐系统整体框架中的一部分,LDA的代码正在重用中,都怪自己之前写的程序接口不好,要改的地方还是不少的,是不是要看看代码大全来提高开发的效率呢?另外,在老板的威逼利诱下,仔细看了一下项亮的那本《推荐系统实践》中有关用LFM做音乐推荐的部分,发现了LDA(Latent Dirichlet Allocation)和LFM(Latent Fac原创 2015-01-19 00:41:03 · 455 阅读 · 0 评论 -
日记2014/12/30
发现自己不喜欢在一个统一的地方记录东西,这样做往往造成的后果就是知识随着记忆曲线的推移慢慢遗忘,这样真不行啊!!所以,今年必须把优快云博客搞起来,同时作为写点东西的地方(技术屌丝无力维护博客啊)记录一下日常吧~呵呵~~那么既然要不就不搞,要不就高大上!那天看了优快云上的一篇精品blog,说年初定的目标要让博客推上主页,最后真的实现了!感动不已。。因此,以此为榜样,并借新年愿望的契机,我原创 2014-12-30 22:50:32 · 364 阅读 · 0 评论 -
日记2015/1/20
今日效率有点低了,早上仅仅完成了代码的融合部分,到下午为了能在那堆14万session的数据集上跑出一个结果搞了半天还是不行!可以断定用GSP在如此大的数据集上做频繁序列挖掘是几乎不可能完成的,每次都要做数据库扫描这种方法明显不可能!spade算法在计算支持度的时候利用了已有频繁序列的计数,因此在计算支持度的时候只需要计算序列某个子集下的计数,大大减少了全表扫描的及数量!明天实现以下才行~还有~~原创 2015-01-21 01:13:59 · 402 阅读 · 0 评论 -
日记2015/1/1
昨天师兄回来了,相聊申欢,台湾了,就没有写blog了。昨天早上去看了下病,然后中午开始才到了lab,差不多早上就没了,之后下午开始麦包包找我聊那个啥,谈了一下推荐系统,发现,如果结合LFM做用item或者user行为的抽象,然后再做随机游走(personal rank或者folk rank)是可以做的。晚上开始补log方面的知识,还好,将log4j2弄好了,其实就是一个配置文件的问题。。。原创 2015-01-01 23:54:21 · 316 阅读 · 0 评论 -
日记2015/1/21
今天开始在数据机上做测试了,并用SPADE算法测试了一下再大数据集上的速度,感觉是可以的,因为不需要全表扫描,而且可以利用上索引,因此大大减少了计算的时间,R语言也有一个SPADE的实现库,可见频繁序列挖掘中,SPADE算法的应用应该算是比较广泛了。另外还不知不觉发现了找论文的好地方:http://www.sciencedirect.com/和一个看论文找索引很好用的应用(主要是因为多平台):ht原创 2015-01-22 00:40:53 · 352 阅读 · 0 评论 -
日记2015/1/6
前两天不在,补一下昨天看过的一篇论文的笔记:《Context-Aware Music Recommendation Based on Latent》其假设是用户听什么歌主要由环境,心情等作为context的因素决定的,找出这样的context可以增加推荐的准确度和说服力。其中,论文主要利用lda思想对用音乐标签表示的音乐进行聚类发现,得到音乐和类别的分布矩阵,利用得到的分类或话题重新表示用户收原创 2015-01-06 00:25:47 · 310 阅读 · 0 评论