
kaggle
文章平均质量分 89
ZSYGOOOD
这个作者很懒,什么都没留下…
展开
-
笔记-Kaggle竞赛入门
鉴于之前看过两遍斯坦福Ng的机器学习课程,最近想通过kaggle来入手数据挖掘,通过实际问题加深对于算法、问题解决过程的理解。在网上找了一些对kaggle比赛过程的介绍与参赛心得,参考链接如下:kaggle home pagekaggle入门教程-传送门1kaggle入门教程-传送门2原创 2017-06-16 08:57:05 · 504 阅读 · 0 评论 -
kaggle-Titanic
kaggle入门题——Titanic。给出写代码时参考的notebook:传送门原创 2017-11-30 13:34:06 · 396 阅读 · 0 评论 -
kaggle-Digit Recognition(手写数字识别)
DR(手写数字识别)问题是多分类问题的入门题目,可以采用多种机器学习方法进行求解。同时由于是图像类问题,可以使用CNN(卷积神经网络)求解。列出做该比赛时的参考链接:Digit Recognition【机器学习算法实现】logistic回归__基于Python和Numpy函数库 - wepon的专栏 - 博客频道 - youkuaiyun.comKaggle入门——使用scikit-learn解决DigitRe原创 2017-11-30 13:40:42 · 695 阅读 · 0 评论 -
kaggle-House Price Prediction
房价预测问题,kaggle回归类入门题。做该比赛时,参考链接如下:数据分析: Comprehensive data exploration with Python | Kaggle正则化线性模型: Regularized Linear Models | Kaggle原创 2017-11-30 13:43:44 · 1667 阅读 · 0 评论 -
kaggle-Porto Seguro's Safe Driver Prediction
Porto Seguro’s Safe Driver Prediction是一道回归预测题,参赛者需要根据数据给出某个保险实例是否会出发赔款的概率。该题有5000+人参加,近期也结赛了。最终我的排名1000+,离前20%只差一点点,有些可惜。不过这一次比赛中还是学到了很多东西。列出参考的notebook链接:EDA: Interactive Porto Insights - A Plot.ly T原创 2017-12-04 14:21:47 · 2307 阅读 · 0 评论 -
笔记-kagger都在用的python编辑器-Jupyter Notebook
经常逛kaggle社区的人常会在forum看到大家都是用notebook形式来进行代码组织和策略讲解。Jupyter就是这样一个工具,它允许你分块组织代码并分别执行,每个代码块都较为独立,而所有代码块又能共享中间结果,十分适用于做数据挖掘的实验。除此最基本的功能之外,Jupyter还有很多小trick。在知乎上看到一篇讲解Jupyter的文章,讲解清晰,几分钟就能入门。给出链接如下,相信Jupyt...原创 2018-02-09 09:28:17 · 1066 阅读 · 0 评论 -
kaggle-Corporación Favorita Grocery Sales Forecasting
该项比赛1月15日就已经结赛了,但由于之后进入期末,备考花费了大量的时间,没来得及整理相关内容。现在终于有时间好好回顾比赛,并对这次比赛的过程进行记录。Corporación Favorita Grocery Sales Forecasting本次比赛是预测商品销量,给出的训练数据为<单位销量,日期,商店ID,商品ID,推销活动标签>,其中单位销量是待预测值,基本上属于回归...原创 2018-02-08 11:17:31 · 2878 阅读 · 4 评论 -
笔记(总结)-自编码器(Autoencoders)
AE自编码器(下简记为AE)为一类特殊的神经网络,该网络输入维度等于输出维度,通过网络隐层的复杂神经元结构,尝试学习数据的内在特征(pattern),从而达到特征提取、数据降维、生成新数据等多种目的。简单的AE和MLP类似,except输入维度等于输出维度。此时输入数据的标签即为自身,模型的损失函数cost=cost(output, input),用来评估输出是否很好地重新构建了输入。...原创 2017-12-19 23:29:56 · 2113 阅读 · 0 评论