
kaggle 数据竞赛
文章平均质量分 92
本专栏主要介绍kaggle数据竞赛的相关内容
Li Kang
这个作者很懒,什么都没留下…
展开
-
Predict Future Sales 预测未来销量, Kaggle 比赛,LB 0.89896 排名6%
预测未来销售该项目来源于kaggle中的一场比赛的赛题,数据是由日常销售数据组成的时间序列数据集,该数据集由俄罗斯最大的软件公司之一 - 1C公司提供。提供了包括商店,商品,价格,日销量等连续34个月内的数据,要求预测第35个月的各商店各商品的销量。评价指标为RMSE,Baseline是1.1677,我的成绩是0.89896,目前排名178/3200。原创 2019-10-08 13:25:55 · 18048 阅读 · 52 评论 -
基于XGBOOST的电能消耗预测
PJM INT.,L.L.C.(以下简称为PJM)是经美国联邦能源管制委员会(FERC)批准,于1997的3月31日成立的一个非股份制有限责任公司,它实际上是一个独立系统运营商(ISO)。PJM目前负责美国13个州以及哥伦比亚特区电力系统的运行与管理。作为区域性ISO,PJM负责集中调度美国目前最大、最复杂的电力控制区,其规模在世界上处于第三位。PJM控制区人口占全美总人口的8.7%(约2300万人),负荷占7.5%,装机容量占8%(约58698MW),输电线路长达12800多公里。原创 2019-10-21 21:53:31 · 4763 阅读 · 1 评论 -
Credit Fraud信用卡欺诈数据集,如何处理非平衡数据
数据集源自位于比利时布鲁塞尔ULB(Université Libre de Bruxelles) 的研究小组Worldline and the Machine Learning Group。数据集包含由欧洲持卡人于2013年9月使用信用卡在两天内发生的交易,284,807笔交易中有492笔被盗刷,正类(被盗刷)占所有交易的0.172%,数据集非常不平衡。它只包含作为PCA转换结果的数字输入变量。由于保密问题,特征V1,V2,… V28是使用PCA获得的主要组件,只有“交易时间”和“交易额”是原始特征。原创 2019-10-24 09:47:14 · 6431 阅读 · 1 评论 -
Home Credit Default Risk 违约风险预测,kaggle比赛,初级篇,LB 0.749
数据由Home Credit提供,Home Credit致力于向无银行账户的人群提供信贷。任务要求预测客户是否偿还贷款或遇到困难。使用AUC(ROC)作为模型的评估标准。本篇博客只对 application_train, application_test的数据进行分析,使用Logistic Regression进行分类预测。原创 2020-03-10 13:10:36 · 7681 阅读 · 3 评论