
机器学习
文章平均质量分 91
好瘦的小胖子
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于XGBoost保险赔偿预测
数据介绍https://www.kaggle.com/c/allstate-claims-severitykeggle比赛保险赔偿预测观察数据导入库#导入库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.linear_model import Logi...原创 2019-04-15 21:09:16 · 1851 阅读 · 2 评论 -
sklearn 中的cross_val_score()
sklearn中的cross_val_score()函数sklearn.model_selection.cross_val_score(estimator, X, y=None, scoring=None, cv=None, n_jobs=1, verbose=0, fit_params=None, pre_dispatch=‘2*n_jobs’)参数estimator:数据对象X...原创 2019-04-13 09:56:25 · 1726 阅读 · 0 评论 -
泰坦尼克号
数据挖掘流程:(一)读取数据:读取数据,并进行展示 统计数据各项指标 明确数据规模与要完成的任务(二)特征理解分析单特征分析,逐个变量分析其对结果的影响 多变量统计分析,综合考虑多种情况影响 统计绘图得出结论(三)数据清洗与预处理对缺失值进行填充 特征值标准化/归一化 筛选有价值的特征 分析特征中间的相关性(四)建立模型特征数据与标签准备 数据集切分 多...转载 2019-04-13 09:51:41 · 2077 阅读 · 1 评论 -
Seaborn
- 为什么用 Seaborn -Seaborn 是基于 Python 且非常受欢迎的图形可视化库,在 Matplotlib 的基础上,进行了更高级的封装,使得作图更加方便快捷。即便是没有什么基础的人,也能通过极简的代码,做出具有分析价值而又十分美观的图形。Seaborn 可以实现 Python 环境下的绝大部分探索性分析的任务,图形化的表达帮助你对数据进行分析,而且对 Python 的其他...转载 2019-04-12 08:55:45 · 518 阅读 · 0 评论 -
表示学习
表示学习表示:将输入信息转换为有效的特征表示学习:自动地学习出有效的特征,并提高最终机器学习模型的性能。语义鸿沟:输入数据的底层特征和高层语义信息之间的不一致性和差异性。表示学习的关键是解决语义鸿沟。+好的表示:一个好的表示应该具有很强的表示能力,即同样大小的向量可以表示更多信息。 一个好的表示应该使后续的学习任务变得简单,即需要包含更高层的语义信息。 一个好的表示应该...转载 2019-04-18 15:59:21 · 1047 阅读 · 0 评论