- 博客(10)
- 收藏
- 关注
原创 【机器学习实战】-Logistic回归之从疝气病症预测病马的死亡率
数据还存在一个问题,数据集中有30%的值是缺失的。下面将首先介绍如何处理数据集中的数据缺失问题,然后再利用Logistic回归和随机梯度上升算法来预测病马的生死。在本次实验中,第一,所有的缺失值必须用一个实数值来替换,因为我们使用的NumPy数据类型不允许包含缺失值。这里选择实数0来替换所有缺失值,恰好能适用于Logistic回归。这样做的直觉在于,我们需要的是一个在更新时不会影响系数的值。
2024-03-05 20:27:29
891
原创 【机器学习实战】-Logistic回归
逻辑回归的思想还是求权重系数,也有很多学习到的新概念,严格下降(动态调小alpha)、如何减少周期性的波动(随机选取梯度)啊等知识,梯度回归就是找梯度上升快的方向,对多个特征求导才能得到,但是也可以用真实值与预测值之间的误差来近似导数,学会了梯度上升算法,同理也学会了梯度下降算法。如有错误或不当之处欢迎大家批评指正,路还很长,加油。
2024-03-05 20:02:46
944
原创 【机器学习实战】-使用朴素贝叶斯过滤垃圾邮件
是英文句子进行切分感觉还容易一点,单词与单词之间用标点符号和空格就可以分割了,但是中文好像分割起来更加困难一点,好像使用jieba分词可以,这个贝叶斯预测还是很有意思的,我看书中还可以建立相关模型来挑选自己的意中人哈哈哈,希望有时间可以建立自己的中文情感分析模型。如有错误,欢迎指正。如有侵权,欢迎提出。
2024-03-02 09:10:44
1763
1
原创 【机器学习实战】-基于概率论的分类方法:朴素贝叶斯
这个例子主要是来讲解朴素贝叶斯怎么进行文本情感分类,基于条件概率和特征独立来计算词条向量的情感概率值,有很多地方都进行了简化,像开始例子就提供了词汇表,不需要分词,自己在做文本情感分析的时候上来就需要分词,建立词汇向量表,预测文本也得做分词处理形成分词向量,这里简化了。如有错误欢迎指正,加油,时间不等人。
2024-03-01 15:50:48
1092
原创 【机器学习实战】-k-近邻算法之手写数字识别
机器学习实战》中k-近邻算法中的第二个例子,使用k-近邻算法来识别数字,跟海伦算法区别在于,数字是图像的形式,宽高是32像素×32像素的黑白图像,需要转换成文本格式。
2024-02-17 23:48:04
624
原创 小白算法之深度优先搜索
深度优先搜索前言 算法是程序员的灵魂之一,木得灵魂的我开始收集灵魂,收拾自己懒筋。深度优先搜索算法关键关键是构建递归函数,解决“当下该如何做”,下一步的做法和上一步的做法是相同的,每一次处理的时候要把所有的可能都尝试,注意在尝试完之后要记得释放所尝试的可能。基本模型void dfs(int step){ 判断边界 尝试每一种可能 for(i=1;i<=n;i++) { 继续下一步 dfs(step+1);
2020-09-28 23:24:38
201
原创 牛顿迭代法-matlab实现
牛顿迭代法-matlab实现牛顿迭代法简介:牛顿迭代法又称为切线法,简单来说就是不断求切线与x轴的交点,来逐渐接近解的迭代过程。方法使用函数f(x)的泰勒级数的前面几项来寻找方程f(x) = 0的根。具体迭代的方法可以看度娘的解释,或者相关的教材。今天来介绍下简单的matlab的实现。代码实现:使用了三个.m文件来实现,分别是原函数(需要迭代的函数)文件、牛顿迭代函数文件、和实现的主文件。...
2020-04-25 22:59:09
57287
14
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人