
机器学习
文章平均质量分 86
Laughing@me
奔跑的小乌龟,虽然慢,但不会停,因为他只想到达终点。
展开
-
第八十七篇 朴素贝叶斯
心得: 还是需要记录一下,自己的学习历程,平时学到的比较杂,在此能全面总结一下自己学到的,看到的,理解的东西。一、公式原理条件概率条件概率是指事件A在事件B发生的条件下发生的概率。条件概率表示为:P(A|B),读作“A在B发生的条件下发生的概率”。若只有两个事件A,B,那么,全概率公式(知因求果)如图;从家到公司有三条路,选择第一条路的概率为P(L1),选择第一条路且不堵车的概率为P(C|L1)假设遇到拥堵会迟到,那么从Home到Company不迟到的概率是多少?选择每条路都有原创 2020-11-08 12:56:26 · 771 阅读 · 0 评论 -
第八十四篇 决策树
心得:终于可以来总结一下关于决策树的内容了,接下来的几篇来逐一介绍决策树,随即森林,以及xgboos等,希望自己可以对这些知识理解更深刻。一、简介什么是决策树,字面意思是用来决策的一种树模型,下图就是一个女生相亲的树形结构图,女生会根据男生的年龄,长相,收入,是否为公务员等来决定自己的相亲标准;所以决策树模型就相当于我们根据已有的样本建立一颗树,来预测未知样本会产生的结果。什么是树,二叉树:https://blog.youkuaiyun.com/l_ppp/article/details/108307532二原创 2020-09-07 23:17:59 · 614 阅读 · 2 评论 -
第八十五篇 XGBoost梯度提升树
心得:总结一下xgboost相关的知识点,希望自己对它的理解更加深刻,xgboost在树模型里算是比较准确的,比较流行的算法,从我接触到的东西逐一总结一下。一、简介集成算法思想用单个决策树模型效果一般来说不是太好,通常会用一种集成的方法,就是一棵树效果可能不太好,用两棵树呢?多棵树呢?是指构建多个分类器(弱分类器)对数据集进行预测,然后用某种策略将多个分类器预测的结果集成起来,作为最终预测结果集成学习根据各个弱分类器之间有无依赖关系,分为Boosting和Bagging两大流派:Boostin原创 2020-09-14 22:31:50 · 862 阅读 · 0 评论 -
第八十六篇 K-means(聚类) 和 KNN(分类) 算法
心得: 每天坚持学一点,新的算法新的技能,学到的都是属于自己的,希望在这里记录一下自己的历程,不忘初心机器学习分为四大块算法1. classification (分类)给定一个样本特征 , 我们希望预测其对应的属性值 , 如果 是离散的, 那么这就是一个分类问题,反之,如果 是连续的实数, 这就是一个回归问题。类问题最常用的学习算法包括 SVM (支持向量机) , SGD (随机梯度下降算法), Bayes (贝叶斯估计), Ensemble(集成), KNN 等2. regression原创 2020-11-05 21:55:31 · 2896 阅读 · 0 评论 -
第九十二篇 搭建神经网络
Follow Your Heart:面临太多的选择,人总会迷茫,有好有坏,理性的选择往往是最好的选择,但往往会有人选择感性,遵从自己的内心,哪怕举步维艰,不知道是成功还是失败,还是想这样选择,可能有些人有些事有些东西值得你付出,但愿这一切都会变得好起来。一、神经网络初步接触神经网络,感觉被高大上名词给吓住了,高深莫测的CNN,DNN,让人望而却步。简单来说神经网络是用来预测数据的一种模型,而这种模型是由一个个神经元组成,共同对数据进行训练决策,输出结果。一个神经元会接收信号,输出信号。二、 搭建神转载 2021-05-11 22:23:51 · 330 阅读 · 0 评论 -
第八十九篇 模型评估AUC,KS,ROC曲线
心得:平时用到模型评估挺多的,来总结一下各个评估标准的具体计算方法和原理一、混淆矩阵混淆矩阵是用来总结一个分类器结果的矩阵。对于k元分类,其实它就是一个k x k的表格,用来记录分类器的预测结果。比如我们最常见的二分类:比如我们一个模型对15个样本进行预测,然后结果如下。预测值:1 1 1 1 1 0 0 0 0 0 1 1 1 0 1真实值:0 1 1 0 1 1 0原创 2020-12-03 23:28:46 · 931 阅读 · 0 评论 -
第八十八篇 支持向量机(SVM)
心得:支持向量机的公式原理理解上还是比较复杂的,本文以流程和原理以及应用方面来进行一、什么是支持向量机1. SVM 简介支持向量机(support vector machines, SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;转化为一个凸二次规划问题来求解由简至繁的模型包括:当训练样本线性可分时,通过硬间隔最大化,学习一个线性可分支持向量机;当训练样本近似线性可分时,通过软间隔最大化,学习一个线性支持向量机;当训练样本线性不可分时原创 2020-11-22 21:52:29 · 525 阅读 · 0 评论 -
第八十三篇 搭建神经网络logistic回归
心得:学习神经网络知识,面对很多的数学公式和推导,很难况且已经忘记了大部分关于微积分和概率论的东西,学神经网络这些都是基础,所以在之后碰到对应的知识点会详细的记录下来。加油~文章目录:一、logistic回归是什么二、神经网络相关概念1. 输入层,输出层,隐藏层2. 权重和偏值2. 激活函数(Activation Function)3.损失函数3. 导数4. 梯度下降法6. 向量化7 .向前传播,向后传播三、神经网络初步建立一、logistic回归是什么面对一个回归或者分类问题,建立代价函数,然后通过原创 2020-06-07 22:18:58 · 691 阅读 · 0 评论 -
第八十二篇 机器学习(介绍)
心得:终于决定要踏上了新的旅程,一个全新的领域等待着你去挑战,你知道你的内心有许多不甘心,所以 拼一次~一、机器学习相关概念1. 什么是人工智能它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。主要解决如:自然语言理解,图像识别,语音识别等问题2. 什么是机器学习机器学习是一种原创 2020-06-07 00:06:54 · 416 阅读 · 0 评论