
数据挖掘
文章平均质量分 92
计算机视觉life
这个作者很懒,什么都没留下…
展开
-
阿里音乐流行趋势预测大赛一起做-(5)温故知新
比赛进行到现在已经有十天了,我们队伍已经进入瓶颈期了,具体表现就是: 1、每次线下预测结果都感觉不错,应该可以提升成绩吧,至少和现在成绩相当吧,结果10点成绩出来就傻眼了,成绩一直掉掉掉。 2、黔驴技穷。每天为提交成绩而发愁,没有好的思路和方法。看着后面的队伍蹭蹭蹭超越了自己,心里真不是滋味呐。那么问题来了,到底怎么破?我觉得可以先考虑从两方面入手: 1、多交流、多思考、多尝试。话说一个队伍内原创 2016-05-27 11:17:50 · 6401 阅读 · 19 评论 -
阿里音乐流行趋势预测大赛一起做-(2)weka初识
本次比赛第一赛季我们团队大赛先用weka对数据进行预处理。weka是一款开源的,免费的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。我非常喜欢这个软件,很容易上手,功能很强大,也不需要很多的编程,图形化做的比较好。打算在数据预处理上主要使用weka。原创 2016-04-09 20:59:30 · 7137 阅读 · 2 评论 -
阿里音乐流行趋势预测大赛一起做-(4)成绩提交
按照我上一篇博客中所描述的思路,我们仅用artist_id和艺人当天的播放量Plays,以及日期Ds三个维度的数据作为训练集合,对每个艺人分别使用时间序列算法进行预测,提交了成绩。本来没报多大希望,只是希望能在排行榜里露个脸,结果竟然进了首页!惊讶之余还是非常开心的。虽然不能说明该方法有多好,至少可以认为是有效的。简单总结由于我们仅仅使用了和 选手提交结果表(mars_tianchi_artist_原创 2016-05-20 10:47:02 · 5309 阅读 · 16 评论 -
阿里音乐流行趋势预测大赛一起做-(6)小结
最近一直在忙毕业的事情,比赛也落下不少。今天第一次切换了数据,在此对之前的工作做个简单的总结。感谢组委会岱月邀请我写自己的参赛经历,《天池小白成长记》在阿里的“天池大数据科研平台”上发布了,还是蛮激动的。好啦,进入正题!扒一扒别人的方法在论坛和QQ群里看到有部分同学透露自己的方法,我就顺道记下来啦,注:以下成绩均为6月7日切换数据前的成绩,评分时间大概在6月1日到6日之间 1、RNN(递归神经网络原创 2016-06-07 14:59:47 · 5320 阅读 · 6 评论 -
阿里音乐流行趋势预测大赛一起做-(1)介绍
动机去年在同学推荐下参加了阿里的“资金流入流出预测大赛”,当时对数据挖掘的了解仅存在模糊的概念上,看了那本《大数据时代》后热血沸腾了几天,趁着这三分钟热度还没冷,就在什么都不懂的情况下报名开始搞了。我们三个队员都是新手,刚开始一片茫然后来是手忙脚乱。第一赛季在本地调试算法,期间换了Python,R,MATLAB各种平台和开发环境,倒腾了一个多月,幸运地进入了第二赛季。第二赛季在线上比赛,阿里要求利用原创 2016-04-09 11:11:10 · 7833 阅读 · 6 评论 -
阿里音乐流行趋势预测大赛一起做-(3)思路
最近几个月忙着写论文,比赛给抛到脑后了(汗颜。。)。昨天阿里给了短信通知,说今天可以提交成绩了,于是抓紧搞起,结果也没赶上截止时间(早上10点)提交。无论如何今天也要提交一次成绩试试水。比赛的详细思路其实我也没怎么想好,有一些初步的想法和实践分享一下。思路我的想法比较简单,就是先用最简单的方法做一下,提交一次成绩,让自己有参与感,然后在后续不断的迭代更新中提升自己。要想达到提交成绩的地步,我们采用倒原创 2016-05-17 22:32:32 · 8079 阅读 · 5 评论 -
阿里音乐流行趋势预测大赛一起做-(7)初赛总结之用户分类
音乐预测大赛的初赛今天轰轰烈烈地谢幕了,先来看看排名前10的队伍吧 我们队的成绩在切换数据后一直没有特别大的长进,虽然成绩没有达到预期,但是初赛这些天还是涌现并实现了一些不错的思路,有一些还没有来得及实现或者优化,相比去年资金预测时候的我们已经有很大进步啦(自我安慰)。看到群里不少人在询问大神团队的经验方法,虽然我们排名比较靠后,远远算不上大神,但是也有一些收获,故在此总结一下我们队用到的比较原创 2016-06-14 13:12:16 · 4426 阅读 · 5 评论