ML-Demo
fly_Xiaoma
技术分享,技术学习
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
特征工程--BikeSharing预测
目录 1 bikesharing中的字段说明2 数据预处理3 读入数据4 数据探索5 特征分析5.1 离散特征的分析5.2 数值型特征分析5.2.1 年份与骑行量的分布5.2.2 一年中每天的骑行量5.2.3 季节与骑行量的关系5.2.4 月份与骑行量的关系5.2.5 天气和骑行量的关系5.2.6 工作日和节假日的分布5.2.7 数值特征...原创 2019-02-04 10:19:12 · 1379 阅读 · 0 评论 -
线性回归模型、岭回归、Lasso对数据的训练与测试
1、导入工具包from sklearn.model_selection import train_test_splitimport numpy as npimport pandas as pdfrom sklearn import linear_modelfrom sklearn.linear_model import Ridgefrom sklearn.linear_mo...原创 2019-02-04 17:01:50 · 2129 阅读 · 0 评论 -
特征工程---Boston房价预测
1、什么是特征工程特征工程是对原始特征做必要的数据预处理和特征编码,使得变换后的特征符合模型要求。数据预处理好理解,那么什么是特征编码?2、特征编码特征编码分为离散型特征编码和数值型(连续)特征编码离散型特征编码 离散特征可以通过独热编码(one-hot encode),将原来有K种取值的离散型特征变成K维0-1编码特征,这K维特征中只有一个是1(独热),其余...原创 2019-02-03 18:05:24 · 1952 阅读 · 0 评论 -
Otto商品分类(一)----数据探索&特征工程
目录 ***训练数据探索部分***1、导入工具包2、读取数据3、标签的分布3.1 各特征的分布4、特征之间的相关系数***训练数据特征工程部分***1、分开特征和标签1.1 feat编码:log(x+1)1.2 feat编码:TF-IDF***其他特征工程***一行的最大值、和、非0元素数目 将这些特征加到原始特征中1、数据预处理2、保存...原创 2019-02-10 17:18:35 · 1913 阅读 · 0 评论 -
Otto商品分类(二)----Logistic回归预测&超参数调优
目录***训练部分***1.读取数据2.准备数据3.默认参数的Logistic Regression4.Logistic Regression+GridSearchCV超参数调优***测试部分***1.读取数据2.准备数据3.生成预测的结果本demo以kaggle 2015年举办的Otto Group Product Classif...原创 2019-02-10 21:38:38 · 8280 阅读 · 0 评论 -
Otto商品分类--PCA&tSNE
目录PCA***训练部分***1.工具2.准备数据3.PCA降维4.绘制PCA维的方差5.保存结果,PCA降维后的表示可作为特征提取的一部分6.保存特征编码过程中用到的模型,用于后续对测试数据的编码7.PCA前两维上显示降维后的数据分布***测试部分***读取数据准备数据PCA降维保存结果,PCA降维后的表示可作为特征提取的一部分tNSE...原创 2019-03-04 13:32:25 · 822 阅读 · 0 评论
分享