
数据挖掘竞赛
文章平均质量分 71
Bryan__
17年硕士毕业入职腾讯,工作4年晋升至T11
研究生期间多次参加国内外数据挖掘竞赛,累计获得10次top3;
ijcai-2017冠军,kddcup-2017季军,ijcai-2018亚军;
工作方向:大规模搜索推荐,算法与架构开发
展开
-
腾讯2018广告算法大赛思路解析 100行代码带你上0.73
比赛报名地址:algo.qq.com/person/mobile/landingPage?from=dsbryan由于本次比赛我属于内部员工不得参赛,所以我尽量写一些思路解析,为大家提供一个baselinegithub:https://github.com/YouChouNoBB/2018-tencent-ad-competition-baseline1...原创 2018-03-20 11:33:41 · 40640 阅读 · 73 评论 -
[天池竞赛系列] 历届天池竞赛答辩PPT和视频
1、阿里移动推荐算法: 答辩视频:https://space.dingtalk.com/c/gQHOEnXdXw 2、资金流入流出预测: 答辩视频:https://space.dingtalk.com/c/gQHOEnXi6w 3、阿里移动推荐&资金流入流出预测答辩PPT下载: https://tianchi.shuju.aliyun.com/mini/reply.htm?spm=原创 2017-03-23 21:01:11 · 12773 阅读 · 6 评论 -
【天池竞赛系列】菜鸟-需求预测与分仓规划初赛冠军解决方案
第一赛季第一名,第二赛季第6名,答辩结束后再公开方案。主要从模型与规则方面结合补多补少成本入手。原创 2016-06-15 21:56:03 · 8978 阅读 · 5 评论 -
[天池竞赛系列]IJCAI-17 口碑商家客流量预测冠军思路
题目链接:https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.100066.0.0.773ef42fw2ednG&raceId=231591 代码链接:https://github.com/YouChouNoBB/ijcai-17-top1-single-mole-solution ...原创 2017-08-20 22:32:13 · 18941 阅读 · 21 评论 -
[天池竞赛系列]阿里音乐流行趋势预测大赛初赛三等奖思路
第一赛季8名,第二赛季11名主要使用模型和规则预处理:过滤异常用户的操作记录,比如一整天都听同一首歌,疯狂下载歌的等等构建样本:对每个歌手建模,每一天的播放数据为一个样本,会出现很多突然的波动,使用7点平滑特征:因为是对每个歌手建模,所以不用考虑歌手特征,全部使用时间特征工作日,节假日,是否加班,放假第几天,工作第几天,星期几,节前,节后趋势特征:不同大小的窗口做差分特原创 2016-08-04 19:17:02 · 6055 阅读 · 6 评论 -
【天池竞赛系列】阿里移动推荐算法思路解析
赛题地址:http://tianchi.aliyun.com/competition/information.htm?raceId=1登录即可下载数据从4月到7月,学习了很多也收获了很多题目就不多说了,一句话表达就是根据过去一个月的行为预测14年12月19号的购买情况。看题目貌似推荐算法,自然就有队伍想到用协同过滤什么的,当然效果不好。首先是特征的问题,然后是这是基于行原创 2015-07-28 23:05:00 · 17739 阅读 · 17 评论 -
Kesci“魔镜杯”风控算法大赛铜奖解决方案
决赛答辩第4,获得铜奖代码地址:https://github.com/wepe/PPD_RiskControlCompetition原创 2016-04-19 15:09:42 · 24679 阅读 · 17 评论 -
一些数据挖掘比赛经验
之前应老师要求,跟学弟学妹们吹了下牛。。。只准备了一天,水平有限,看看就好原创 2016-05-20 00:35:08 · 5870 阅读 · 5 评论 -
[天池竞赛系列]O2O优惠券使用预测复赛第三名思路
本次竞赛初赛获得第二名,复赛第三名代码参考 第一名队伍【诗人都藏在水底】的代码:https://github.com/wepe/O2O-Coupon-Usage-Forecast原创 2016-12-28 12:09:24 · 24134 阅读 · 9 评论 -
【开车了】9个大数据竞赛思路分享
本次分享主要从笔者过去一年和今年上半年的参赛经验来做讲解后续将会针对目前天池开放的几个新人挑战赛推出手把手教你进首页系列文章包括赛题详细思路讲解,demo代码讲解。开始今天的分享是将之前的比赛做一个压缩,每个比赛两页搞定。首先介绍下这一年半的战绩,主要参加了9个比赛,有7次进入top10。成绩不好的就没放上来了哈,主要广东交通那两个没时间去搞,当时在弄穿衣搭配。原创 2016-06-19 20:27:41 · 12585 阅读 · 2 评论 -
【天池竞赛系列】淘宝穿衣搭配算法第二赛季12名思路
给的数据集有4部分达人搭配组合商品信息购买记录线上测试集在第一赛季中的思路和阿里星小江分享的差不多http://datartist.cn/?p=5第二赛季自己实力不够,思路陷入迷信模型中,导致被干出了前10那么我就来讲讲12名的思路吧首先根据达人搭配提取出类别搭配对,一共2600+然后把历史记录按同一个人同一个月购买的数据传入MR原创 2015-12-08 16:51:19 · 7556 阅读 · 10 评论 -
【手把手教你玩天池新人挑战赛】新浪微博互动预测100行代码
由于第二赛季的时候去做淘宝穿衣搭配了,所以第二赛季成绩不太好。主要讲下第一赛季是怎么用歪路子做到第6名。换数据之前是第4名。首先我们先看一下评估指标评估指标我们希望参赛队对于每一条博文预测出发表一周后的转发数、评论数和赞的数目,对于每一项均和真实值计算偏差: 注:countfp为预测的转发数,countfr为实际的转发数;co原创 2015-12-08 16:19:50 · 15005 阅读 · 11 评论 -
【天池竞赛系列】资金流入流出预测思路
赛题地址:http://tianchi.aliyun.com/competition/information.htm?spm=5176.100067.5678.2.VZW16k&raceId=3登录即可下载数据题目一句话:根据13年7月到14年8月的申购赎回数据预测14年9月每一条的申购赎回数据。算法问题:此题可以使用线性回归和时间序列预测,只要特征好效果都还可以。我们原创 2015-07-28 23:37:19 · 12600 阅读 · 17 评论 -
DataCastle微额借款用户人品预测大赛冠军思路
微额借款用户人品预测的数据不仅有带标签数据,而且还有大量无标签数据,数据存在缺失值,类别不平衡,特征高维度等特点。本次大赛主要是为了能从用户行为数据分析‘小额微贷’申请借款用户的信用状况,来判断其是否逾期。针对需要解决的问题和数据特征,我们主要从四个方面进行处理:数据预处理,特征工程,数据不平衡,以及半监督模型训练。首先,由于数据中存在大量的缺失值,因此需要对缺失值数据进行预处理。比赛中,我们视缺失值为一种特征进行处理。统计了每个样本的缺失值个数,并进行排序,发现样本类别和缺失值个数呈规律性阶梯状关系。通原创 2016-03-25 10:42:37 · 18749 阅读 · 12 评论 -
【开车了】大数据竞赛技术分享
本次分享为笔者在一年半时间里的关于数据挖掘技术在学习和实践方面的经验由于准备时间仓促和水平有限,有误之处请多多指教原创 2016-06-23 20:35:20 · 9345 阅读 · 7 评论 -
IJCAI-18 阿里妈妈搜索广告算法大赛亚军解决方案
代码和解决方案见github: https://github.com/YouChouNoBB/ijcai-18-top2-single-mole-solution原创 2018-06-06 20:06:23 · 13138 阅读 · 15 评论