
机器学习
笨鸟的GPS
早睡早起
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习第九周-PCA算法实现使用
学习内容:主成分分析、PCA算法源源不断的饼干动力,又开始新的饼干笔记搬运大法一、PCA的概念PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法(非监督的机器学习方法),其最主要的用途在于降维,通过分析取主成分显出最大的个别差异。也可以用来削减回归分析的聚类分析中变量的数目多变量之间可能存在相关性,从而增加了问题分析的复杂性...转载 2019-12-30 08:11:59 · 359 阅读 · 0 评论 -
机器学习最后一周-总结
前言N个月前,加了木东居士的数据分析群,日常划水,听大佬发言2.25个月前,加了木东居士组织的统计学小组,星空妹子考勤,DD出笔记干货2个月前,加了木东居士组织的机器学习小组,饼干大佬写的干货不干系列推文感受系统学习路线+自主学习笔记打卡+可退还报名费机制,有一定的约束影响力,学习效果还不错,记得有一晚奋战到了23:58,才最终提交打卡作业,相当不容易,熬夜伤身体。其他就是感觉学习小组讨...原创 2019-12-27 13:30:26 · 187 阅读 · 0 评论 -
机器学习第八周-K-means聚类
学习内容:模型原理、收敛过程、代码实现一、模型原理聚类的概念聚类试图将数据集中的样本划分为若干个通常是不想交的子集,每个子集成为簇。通过这样的划分,每个簇可能对应一些潜在的概念(也就是类别),如浅色瓜,深色瓜,有籽瓜,甚至本地瓜,外地瓜;需要说明的事,这些概念对聚类算法而言事先是未知的,聚类过程仅能自动形成簇结构,簇对应的概念语义由使用者来把握和命名聚类和分类的区别聚类是无监督的...转载 2019-12-26 08:35:58 · 597 阅读 · 0 评论 -
机器学习第七周-决策树
学习内容(决策树、信息熵与最优划分、基尼系数、CART)一、决策树的概念和构建1.什么是决策树类似流程图的结构,其中每个内部节点表示一个测试功能,即类似做出决策的过程(动作),每个叶节点都表示一个类标签,即在计算所有特征之后做出的决定(结果)。标签和分支表示导致这些类标签的功能的连接。从根到叶的路径表示分类规则2.决策树与条件概率决策树表示给定特征条件下,类的条件概率分布,这个条件概率...转载 2019-12-21 17:26:13 · 631 阅读 · 0 评论 -
机器学习第六周-逻辑回归
学习内容(逻辑回归:损失函数、梯度、决策边界)(代码实现和sklearn逻辑回归 待深入学习)这周份,三条无痛,食用已饱 @ 饼干大佬一、逻辑回归概念逻辑回归(Logistic Regression,LR):对问题划分层次,并利用非线性变换和线性模型的组合,将未知的复杂问题分解为已知的简单问题有些算法,表面上叫“XX回归”,背地里却是解决分类问题的。其原理是将样本的特征和样本发生的...转载 2019-12-15 23:56:01 · 439 阅读 · 1 评论 -
机器学习第零周-基础知识
机器学习第零周-基础知识一、 numpy1.np.arange(1,10,0.1) #闭开区间,步长01.,浮点数组形式2.np.linspace(0,5,4) #闭区间,二等分的浮点数组形式3.np.random.randint(0,10) #闭开区间任意随机整数4.random_seed = 1 #定义随机种子保证每次随机试验结果一致5.np.random.randint(...原创 2019-12-13 07:10:05 · 240 阅读 · 0 评论 -
机器学习第五周-梯度下降
学习内容梯度下降手动实现线性回归下的梯度下降批量和随机梯度下降一、梯度下降机器学习的“三板斧”第一步:定义一个函数几何第二步:判断函数的好坏第三步:选择最好的函数我们的目标是让损失函数最小化,梯度下降是目前机器学习、深度学习解决最优化问题的算法中,最核心、应用最广的方法梯度下降(Grandient Descent,GD),不是一个机器学习算法,而是一种基于搜索的最优化方法...转载 2019-12-08 11:12:41 · 419 阅读 · 0 评论 -
机器学习第四周-线性回归算法
学习内容简单线性回归最小二乘法数据推导简单线性回归向量化应用多元性回归和正规方程实现一、简单线性回归概念Label为连续数值型,如房价、股票价格、降雨量,只有一个样本特征,即只有一个自变量,回归是指用方程来模拟变量之间是如何关联的。我们所谓的建模过程,其实就是找到一个模型,最大程度的拟合我们的数据,要想最大的拟合数据,本质上就是找到没有拟合的部分,也就是损失的部分尽量小,就是损...转载 2019-12-01 18:57:14 · 286 阅读 · 0 评论 -
机器学习第零周-课程介绍
机器学习第零周-课程介绍一、环境背景1.机器学习,可以解决传统算法(编写规则定义难,规则变化快)等问题2.机器学习应用比较广泛在图像识别,人脸识别,数字识别二、课程内容KNN近邻线性回归多项式回归逻辑回归模型正则化PCA降维SVM决策树随机森林集成学习模型选择模型调整三、代码环境成体系讲解,实际使用算法解决真实场景,介绍如何使用算法1.课程环境:Pytho...原创 2019-11-18 14:28:36 · 173 阅读 · 0 评论 -
机器学习第二周-分类指标评价
一、分类指标评价混淆矩阵二分类问题,混淆矩阵2*2TN:真实值为0,预测值为0,即我们预测是negative,预测正确FP:真实值为0,预测值为1,即我们预测是positive,预测错误FN:真实值为1,预测值为0,即我们预测是negative,预测错误TP:真实值为1,预测值为1,即我们预测是positive,预测正确import numpy as npfrom sklea...转载 2019-11-17 15:53:32 · 360 阅读 · 0 评论 -
机器学习第一周-KNN近邻算法
机器学习KNN近邻算法一、算法原理K近邻学习是一种常用的监督学习方法。工作机制:给定测试样本,基于某种距离度量找出训练集中与其最靠近的K哥训练样本,基于这K个“邻居”的信息进行预测。通常咋分类任务中可使用“投票法”,即选择这K个样本中出现最多的类别标记作为预测结果;在回归任务中可使用“平均法”,即将这K个样本的实值输出标记的平均值作为预测结果;还可基于距离远近进行加权平均或加权投票,距离越近的...原创 2019-11-10 16:31:20 · 336 阅读 · 0 评论