- 博客(12)
- 收藏
- 关注
原创 Kaggle--房价预测小组报告
房价预测 目录 一、认识数据一、认识数据 House Prices数据集分为train(即训练)数据和test(即测试)数据,其中,训练集含有1460个样本,80个属性(包括序号),一个标签(SalePrice,即房价);测试集含有1459个样本,80个属性。 需要做的工作:根据测试集的属性预测每个样本的房价。...
2018-07-07 21:33:50
8267
6
转载 Kaggle--房价预测
房价预测 目录目录一、认识数据二、定性分析2.1 属性的意义2.2 属性分析三、缺失值处理3.1 缺失值举例3.2 缺失值统计3.3 填充缺失值3.4 格式转换四、特征分析4.1 房价分析4.2 房价属性的关系4.3 相关性4.5 特征选取五、回归前的准备5.1 特征向量化5.2 测试集预处理六、回归6.1梯度提升回归6....
2018-07-07 21:17:55
14180
1
转载 机器学习随笔5--Logistic回归
摘要 本文主要介绍Logistic回归,以及Logistic回归在数据集上的应用。目录摘要目录一、问题描述 疝气病一直是牧场主的强敌。牧场主辛勤劳作若干年,将牛、马养的肥肥的,但一旦马患上疝气病,马匹将大量死去,造成牧场瘟疫传播,引发更多的动物死去,牧场主血本无归。医院检测马疝气病的一些指标,有的指标比较主观,有的指标难以测量,例如马的疼痛级别。所以现在能否有更加...
2018-07-07 19:08:15
1203
原创 机器学习随笔4--kNN、决策树与朴素贝叶斯
摘要 本文主要在数据集上综合运用kNN、决策树与朴素贝叶斯,并作对比。目录摘要目录一、问题描述二、数据获取与预处理2.1 数据的获取2.2 数据预处理2.2.1 字符分割2.2.2 评价等级量化2.2.3 缺失数据和异常数据的检测2.3 数据可视化三、算法的简要介绍3.1 kNN算法3.1.1 kNN算法介绍3.1.2 计算步骤3.2 决策...
2018-07-07 18:32:59
5868
1
转载 机器学习随笔3--决策树
摘要 本文主要介绍决策树,以及决策树在数据集上的应用。目录摘要目录一、问题描述一、问题描述配隐形眼镜是一件技术活,隐形眼镜类型包括硬材质、软材质以及不适合佩戴隐形眼镜。经验丰富的眼科医生根据许多患者的眼球状况的观察条件和患者本身的身体条件,包括:年龄、处诊结果、散光情况、流泪量等,来推荐隐形眼镜类型。但对于新人医生来说,其经验未及老医生经验丰富。幸运的...
2018-07-07 18:10:13
2236
原创 机器学习随笔13--主成分分析法
摘要 本文主要介绍降维技术、主成分分析法,及应用。目录摘要目录一、降维1.1 降维简介1.2 主要降维方法二、主成分分析法2.1 主成分分析法简介2.2 主成分分析法的推导三、示例四、小结五、参考文献六、附录一、降维1.1 降维简介降维是对数据高维度特征的一种预处理方法。降维是将高维度的数据保留下最重要的一些特征,去除...
2018-06-08 14:32:16
2130
3
转载 机器学习随笔10--K均值
摘要 聚类算法是一个简单易懂的无监督学习算法。本文主要介绍K-means聚类算法,以及二分K-means算法。目录摘要目录一、引言二、K-means聚类算法2.1 K-means算法简介2.2 K-means算法原理2.3 K-means算法的缺陷与改进三、二分K-means算法3.1 二分K-means算法简介3.2 二分K-means算法工作流程四...
2018-06-03 16:25:54
2020
转载 机器学习随笔8--回归
摘要:本文分别介绍了线性回归、局部加权回归和岭回归,并使用python进行了简单实现。 在这之前,已经学习过了Logistic回归,今天继续看回归。首先说一下回归的由来:回归是由达尔文的表兄弟Francis Galton发明的。Galton于1877年完成了第一次回归预测,目的是根据上一代豌豆的种子(双亲)的尺寸来预测下一代豌豆种子(孩子)的尺寸(身高)。Galton在大量对象上应用了回归分...
2018-05-29 13:41:43
1452
转载 机器学习随笔7--AdaBoost元算法
摘要本文主要介绍组合相似的分类器来提高分类器性能、AdaBoost算法以及应用于处理非均衡问题分类问题。目录摘要目录一、元算法二、AdaBoost元算法2.1 AdaBoost简介2.2 AdaBoost步骤2.3单层决策树三、非均衡分类问题四、小结七、参考文献八、附录一、元算法元算法就是对其他算法进行组合的一种方式。也称为集成算法(ense...
2018-05-25 12:46:43
1653
原创 机器学习随笔6--支持向量机
摘要 本文是作者最近在学习支持向量机的随笔,主要是简单介绍支持向量机,阐述支持向量机的原理、SMO算法、核函数以及实际数据测试效果,附录含有代码。目录摘要目录一、支持向量机简介二、支持向量机的原理2.1 二维的样本空间2.2 高维的样本空间2.3 对偶问题三、SMO算法四、核函数五、测试5.1 线性可分数据5.2 非线性可分数据六、小结七、参考文献...
2018-05-19 21:12:56
1975
5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人