自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 问答 (8)
  • 收藏
  • 关注

原创 白话机器学习算法 第6-12章 读书笔记

回归分析 趋势线 预测 一般只涉及单个预测变量 也可用于比较个个预测变量的强弱 梯度下降法 优化参数的方法 梯度下降法先初步猜测合适的权重组合,再通过一个迭代过程,把这些权重应用于每个数据点做预测,然后调整权重,以减少整体预测误差。 但是梯度下降法可能会受到初始参数值的影响,如下 为了降低这种风险–> 随机梯度下降法 在这种方法中,每次迭代并不是采用所有数据点,而是只从其中选取一个来调整参数。这样做就引入了多变性,有助于算法逃离凹坑。 梯度下降法的这个缺点通常只出现在更为复杂的模型中,做回归分析时

2020-12-15 20:56:04 1708

原创 白话机器学习算法 第2-5章 读书笔记

K均值聚类 聚类 聚类是通过识别共同的喜好或特征,把顾客分组,其中k表示群组个数。 定义群组 有多少个群组? 每个群组中有谁? 群组数量 群组数量越多,组内成员越相似,响铃群组之间的区别则越不明显 所以在决定群组数量时必须有所权衡 往大,便于提取有意义的模式 够小,确保各个群组之间有所区别 确定群组数量的方式 陡坡图 陡坡图可以展现群组内散度随群组数量增加而降低的过程。 陡坡图地拐弯处往往体现了最佳主成分数量 若所有成员都属于同一个群组,则群组内散度将达到最大值。随着群组数量增加,各个群组变得更紧凑,群组成

2020-12-14 20:59:41 444

原创 白话机器学习算法 第一章 读书笔记

前言 数据科学的意义 从大型数据集中发现隐藏的趋势 充分利用发现的趋势做预测 计算每种结果出现的概率 快速获取准确结果 数据科学研究步骤 处理数据 选择算法 算法调优 创建模型 比较 确定 基础知识 准备数据 数据格式 略 数据类型 二值变量:这是最简单的变量类型,它只有两种可能的值。在表1-1中,“是否买鱼”就是二值变量。 分类变量:当某信息可以取Z两个以上的值时,便可以使用分类变量来表示它。在表1-1中,“顾客类别”就是分类变量。 整型变量:这种变量用来描述可以使用整数表示的信息。在表1-1中

2020-12-11 00:46:02 304 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除