机器学习
文章平均质量分 95
Enguanei
Not multiply entities beyond necessity.
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【学习笔记】GitModel统计分析
“Datawhale开源项目:GitModel统计分析”学习笔记原创 2022-07-13 01:02:56 · 954 阅读 · 1 评论 -
【学习笔记】集成学习(八):案例二
Datawhale组队学习第27期:集成学习本次学习的指导老师萌弟本贴为学习记录帖,有任何问题欢迎随时交流~部分内容可能还不完整,后期随着知识积累逐步完善。开始时间:2021年7月29日最新更新:2021年8月1日(Task8 案例二)案例二:蒸汽量预测一、数据来源天池新人实战赛从火力发电的基本原理入手,考虑影响锅炉生成蒸汽的效率。数据内容:经脱敏后的锅炉传感器采集的数据(采集频率是分钟级别)赛题任务:根据锅炉的工况,预测产生的蒸汽量。二、数据信息数据分成训练数据(tra.原创 2021-08-01 02:51:23 · 679 阅读 · 0 评论 -
【学习笔记】集成学习(七):Stacking和案例一
Datawhale组队学习第27期:集成学习本次学习的指导老师萌弟的教学视频本贴为学习记录帖,有任何问题欢迎随时交流~部分内容可能还不完整,后期随着知识积累逐步完善。开始时间:2021年7月26日最新更新:2021年7月29日(Task7 Stacking和案例一)一、Blending1. 集成方式划分训练集和测试集TestTestTest这里的训练集用于训练最优模型测试集用于判断模型性能训练集进一步划分训练集TrainTrainTrain和验证集ValValVal.原创 2021-07-29 00:38:57 · 485 阅读 · 0 评论 -
【学习笔记】集成学习(五):Bagging
Datawhale组队学习第27期:集成学习本次学习的指导老师萌弟的教学视频本贴为学习记录帖,有任何问题欢迎随时交流~部分内容可能还不完整,后期随着知识积累逐步完善。开始时间:2021年7月22日最新更新:2021年7月22日(Task5 Bagging)一、Bootstrap抽样1. 简单描述有放回采样(自助采样),如:对给定样本,抽n个样本集合,重复抽m次,可以得到m个参数估计,可以估计总体的方差。2. 含义设总体AAA服从未知分布FFF,样本X={x1,x2,...xn.原创 2021-07-22 22:59:39 · 392 阅读 · 1 评论 -
【学习笔记】集成学习(四):分类问题
Datawhale组队学习第27期:集成学习本次学习的指导老师萌弟的教学视频本贴为学习记录帖,有任何问题欢迎随时交流~部分内容可能还不完整,后期随着知识积累逐步完善。开始时间:2021年7月19日最新更新:2021年7月20日(Task4分类问题)一、度量分类模型的性能指标1. 混淆矩阵假阴性和假阳性都是分类错误,在现实生活中这两种分类错误的代价有所不同,需要分开讨论。这里有点类似最小错误率决策和最小风险决策。2.分类模型的指标准确率Accuracy含义:真阳性和真阴性.原创 2021-07-20 22:38:49 · 585 阅读 · 0 评论 -
【学习笔记】集成学习(三):偏差和方差理论
Datawhale组队学习第27期:集成学习本次学习的指导老师萌弟的教学视频本贴为学习记录帖,有任何问题欢迎随时交流~部分内容可能还不完整,后期随着知识积累逐步完善。开始时间:2021年7月13日最新更新:2021年7月17日(Task3偏差和方差理论)一、训练误差与测试误差偏差和方差理论偏差-方差的权衡E(y0−f^(x0))2=Var(f^(x0))+[Bias(f^(x0))]2+Var(ϵ) E(y_0 - \hat f(x_0))^2 = Va.原创 2021-07-17 22:50:37 · 638 阅读 · 2 评论 -
【学习笔记】集成学习(二):回归问题
Datawhale组队学习第27期:集成学习本次学习的指导老师萌弟的教学视频本贴为学习记录帖,有任何问题欢迎随时交流~部分内容可能还不完整,后期随着知识积累逐步完善。开始时间:2021年7月13日最新更新:2021年7月15日(Task2回归问题)一、基本建模步骤明确项目任务收集数据集并选取合适的特征选择度量模型性能的指标选择具体的模型并进行训练以优化模型评估模型并调参二、以Boston房价为例Boston房价预测,显然是一个回归问题。数据集已有,这里默认选定所有.原创 2021-07-15 21:20:14 · 1097 阅读 · 0 评论 -
【学习笔记】集成学习(一):数学基础
Datawhale组队学习第27期:集成学习本次学习的指导老师萌弟的教学视频本贴为学习记录帖,有任何问题欢迎随时交流~部分内容可能还不完整,后期随着知识积累逐步完善。开始时间:2021年7月13日最新更新:2021年7月13日(Task1数学基础)文章目录【Task01】数学基础一、高等数学1. 多元函数2. 雅可比矩阵和黑塞矩阵3. 极值二、线性代数三、概率论基础1. 基本的概念2. **随机变量**3. **随机向量**四、数理统计1. 主要分支:2. 总体与样本3. 极大似然估计ML.原创 2021-07-13 22:56:50 · 747 阅读 · 0 评论 -
机器学习与Python应用(二)
机器学习——线性回归算法本贴为学习记录贴,有任何问题随时可以交流。课程名称:机器学习与数据挖掘使用教材:《Python机器学习》/赵涓涓,强彦主编.——北京:机械工业出版社,2019.06记录时间:2021.03.21本节说明:主要讲解教材第三章的线性回归算法应用题目,重点关注sklearn的数据集使用方法以及数据集处理思路。文章目录机器学习——线性回归算法一、简要介绍二、库的导入和使用二、数据集(一)数据集导入(二)数据集分析(三)数据集提取与转换(后面有待补充......)一、简要介绍原创 2021-03-21 23:55:30 · 968 阅读 · 1 评论 -
机器学习与Python应用(一)
导入包import pandas as pdimport numpy as npfrom sklearn import datasetsimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegression“”"一、数据结构1、列表list:多个元素构成一个整体,但元素的数据类型不一定是相同的2、数组ndarray:一般来说,元素的数据类型是相同的,能进行广播、标量运算和矢量运算。运行效率高和内原创 2021-03-21 16:45:53 · 2176 阅读 · 13 评论
分享