- 博客(3)
- 问答 (8)
- 收藏
- 关注
原创 白话机器学习算法 第6-12章 读书笔记
回归分析 趋势线 预测 一般只涉及单个预测变量 也可用于比较个个预测变量的强弱 梯度下降法 优化参数的方法 梯度下降法先初步猜测合适的权重组合,再通过一个迭代过程,把这些权重应用于每个数据点做预测,然后调整权重,以减少整体预测误差。 但是梯度下降法可能会受到初始参数值的影响,如下 为了降低这种风险–> 随机梯度下降法 在这种方法中,每次迭代并不是采用所有数据点,而是只从其中选取一个来调整参数。这样做就引入了多变性,有助于算法逃离凹坑。 梯度下降法的这个缺点通常只出现在更为复杂的模型中,做回归分析时
2020-12-15 20:56:04
1708
原创 白话机器学习算法 第2-5章 读书笔记
K均值聚类 聚类 聚类是通过识别共同的喜好或特征,把顾客分组,其中k表示群组个数。 定义群组 有多少个群组? 每个群组中有谁? 群组数量 群组数量越多,组内成员越相似,响铃群组之间的区别则越不明显 所以在决定群组数量时必须有所权衡 往大,便于提取有意义的模式 够小,确保各个群组之间有所区别 确定群组数量的方式 陡坡图 陡坡图可以展现群组内散度随群组数量增加而降低的过程。 陡坡图地拐弯处往往体现了最佳主成分数量 若所有成员都属于同一个群组,则群组内散度将达到最大值。随着群组数量增加,各个群组变得更紧凑,群组成
2020-12-14 20:59:41
444
原创 白话机器学习算法 第一章 读书笔记
前言 数据科学的意义 从大型数据集中发现隐藏的趋势 充分利用发现的趋势做预测 计算每种结果出现的概率 快速获取准确结果 数据科学研究步骤 处理数据 选择算法 算法调优 创建模型 比较 确定 基础知识 准备数据 数据格式 略 数据类型 二值变量:这是最简单的变量类型,它只有两种可能的值。在表1-1中,“是否买鱼”就是二值变量。 分类变量:当某信息可以取Z两个以上的值时,便可以使用分类变量来表示它。在表1-1中,“顾客类别”就是分类变量。 整型变量:这种变量用来描述可以使用整数表示的信息。在表1-1中
2020-12-11 00:46:02
304
1
空空如也
使用insert插入时间数据,只有日期没有时间
2022-06-20
ORACLE和PLSQL时间(date格式)字段显示问题
2021-07-07
Python Combination函数全排列问题
2021-05-31
python 全排列问题
2021-05-25
Dataframe值替换问题
2021-05-19
Python Dataframe 列值筛选问题
2021-05-14
如何统计表中一行值为1的列(字段),并将其列名组合输出?
2021-05-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅