
kaggle
文章平均质量分 74
whiker
这个作者很懒,什么都没留下…
展开
-
kaggle 入门 digit recognizer python randomForestClassifier
kaggl之101新手赛digit recognizer利用python的sklearn包中的randomForestClassifier进行分类import pandas, numpyfrom sklearn.ensemble import RandomForestClassifierdataset = pandas.read_csv("...\\data\\train.csv原创 2016-05-15 12:35:25 · 1395 阅读 · 0 评论 -
kaggle 入门 Bike sharing Demand prediction
根据天气等因素对自行车租赁数量进行预测利用xgboost进行预测import csvfrom math import log, expimport numpy__author__ = 'Whiker'__mtime__ = '2016/5/26'from datetime import datetimeimport pandasimport xgboostdef原创 2016-05-27 20:10:11 · 3105 阅读 · 2 评论 -
Kaggle 入门 Crime
对犯罪案件进行分类 提交每个类别概率 xgboost成绩 2.35461feature: Category用preprocessing.labelEncoder()转成int型有序变量 时间抽出年月日时分,分钟根据时间对称性abs(m-30) 地址判断是否包含’/’ XY进行标准化 区域和DOW变为哑变量 xgboost参数: “booster”: “gbtre原创 2016-05-26 10:09:36 · 1204 阅读 · 0 评论 -
kaggle 入门 rossmann randomForest
预测给定日期的销量特征:对train和test数据:Open为空的都默认为1从日期中提取Day MonthStateHoliday除了0为0外,其他都变为1对store数据:StoreType/Assortment 变哑变量CompetitionDistance 填充0/标准化CompetitionOpenSinceYear 填充0/更改然后原创 2016-06-10 22:02:40 · 2413 阅读 · 2 评论 -
kaggle 入门 rossmann xgboost
对商店的某天进行销量预测这个特征处理得很好,用上一个特征进行xgboost得到0.32的成绩,换成该特征得到0.14的成绩特征:Open为空赋为1train中只看open为1且sales>0的记录合并store和train&test所有空值填0'StoreType', 'Assortment', 'StateHoliday'中将0abcd变为01234从日期中抽原创 2016-06-10 22:15:59 · 5388 阅读 · 0 评论 -
windows64 CPU python2.7 安装theano & keras
根据这里 完成安装了theano包1. 从gitbub上下载并解压theano 地址2. 在cmd中, 执行"conda install mingw libpython". 这将安装mingw g++ 和libpython (前提安装了Anaconda)3. 在cmd中, 进入解压后的theano目录中执行"python setup.py install --record f原创 2016-06-06 22:20:31 · 3637 阅读 · 0 评论 -
pandas append性能问题
实际场景:向pandas.Dataframe中添加n条数据利用pandas.append方法一条一条向其中添加数据,很慢(我向pandas.Dataframe中添加16*715条数据,pc跑了一晚上)解决方法:利用list将数据封装好,然后再一起加入pandas中测试样例:import randomimport timeitimport pandas as pd原创 2016-07-24 10:57:14 · 8629 阅读 · 0 评论