- 博客(5)
- 收藏
- 关注
原创 建模与预测学习笔记
建模与预测学习笔记一.统计学习分类:1.监督学习利用一组带标签的数据,学习从输入到输出的映射,然后将新数据用这种关系可以得到映射结果,达到分类或者回归的目的,常用的有线性回归、决策树等.2.非监督学习输入数据没有被标记,也没有确定的结果,常用的有K-means聚类、层次聚类等.3.半监督学习在实际情况中,获取的数据大部分是无标签的,人们企图加入一些人为标注的样本,使得无标签的数据通过...
2020-04-01 21:45:02
213
原创 特征工程学习笔记
特征工程学习笔记一.特征工程的重要性:为了解决实际问题,通常需要收集大量的数据,这些数据未经过滤,可能非常杂乱,甚至不完整。为了更好地使用这些数据,需要对数据进行处理,这就需要用到特征工程。特征工程是这样一个过程:将数据转换为能更好地表示潜在问题的特征,从而提高及其学习性能。特征工程具体包括以下几个方面:1.转换数据的过程:这里并不特指原始数据或未过滤的数据,特征工程适用于任何阶段的数据...
2020-03-27 21:18:19
141
原创 探索性数据分析学习笔记
探索性数据分析学习笔记探索性数据分析(EDA),也成描述性统计分析,是指对已有数据在尽量少的先验假设下通过作图、制表、计算统计量等手段探索数据的结构和规律的一种数据分析方法。传统的统计分析方法常常先假设数据符合一种统计模型,然后依据数据样本来估计模型的一些参数及统计量,以此了解数据特征,但是实际中往往有很多的数据并不符合假设的统计模型分布,这导致数据分析并不理想。EDA则是一种更加贴合实际情况的...
2020-03-24 21:32:25
518
原创 过拟合、欠拟合学习笔记
探究模型训练中经常出现的两类典型问题:一类是欠拟合,另一类是过拟合.1.欠拟合模型无法得到较低的训练误差,将这一现象成为欠拟合.2.过拟合模型的训练误差远小于它在测试集上的误差,称这一现象为过拟合.可能导致这两种拟合问题的因素有很多,比如模型复杂度和训练集大小.模型复杂度随着模型复杂度增加,训练误差波动降低,平均训练误差降低趋向于0,而测试误差波动上升,平均测试误差先降低后升高。这...
2020-02-18 21:11:18
302
原创 线性回归学习笔记
线性回归模型假设输出与输入之间是线性关系.线性回归模型基本思路:定义模型/初始化模型参数—前向传播/计算预测值/计算损失—反向传播/更新权值.1.读取数据集/生成数据集#导入相关计算包import torchfrom torch import nnimport numpy as nptorch.manual_seed(1)print(torch.version)torch.se...
2020-02-14 18:42:46
166
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅