帅翰GG-优快云博客

原创 C2-2.1 Mini-batch 梯度下降

，比如这里有5000万个训练样本，由于一次性对这些训练样本进行训练拟合模型，会发生训练速度过慢的情况 / 完全训练不了因为数据量太大了，对内存 GPU都是一个考验。。。提高运算速度。内存不足的情况。和之间找到平衡，使得处理大型数据集成为可能，同时也利用了现代计算硬件的并行处理能力。

2024-04-10 15:41:13 937

原创 C2-1.4（L1,L2）正则化

如λ取1000时，损失函数的值受正则化影响，为了减小J（w,b）最终的值，就尽量减少 w值，如λ取0时，损失函数的值就导致了不受正则化的影响，就变成了以前那样的函数。外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传。首先来复习一下**“正则化”公式：**最终 f(x) ≈ b。为了防止过拟合，线性回归的。

2024-02-22 17:15:31 652

原创 C2-1.6 Dropout正则化——提高泛化能力

以图一为例：假设在训练图一所示的神经网络，它存在（模型过于复杂情况），dropout（每一层设置的阈值不同），并。假设每个节点得以保留和消除的概率都是0.5。设置完节点概率会消除一些节点，然后删除掉从该节点进出的连线，目的：随机消除一些神经元，让网络规模更小，模型变得相对简单一些。

2024-02-22 17:13:19 1342

原创 C1-3.4 多个样本的向量化

输入X，x的个数为m，就是m列的向量。1、把多组输入变量X拼接在一起2、通过计算得出多样本向量化Z。

2024-01-13 10:08:31 596

原创 C1-3.2 关于‘神经网络’

【注释】彩色图像（RGB）由三原色构成，二维图像在任意一个点像素为立体三层结构，分别是红色、绿色、蓝色值，该值的范围在0∽255之间。

2024-01-13 10:04:00 1063

原创 C3-1.3.1 无监督学习——异常检测

这里只拿出来两个特征值（X1 , X2）来举例，为了可视化让我们了解的更加方便，实际应用中特征的数量可能达到上百 / 上千：说明的大概率的，是正常的：是小概率发生的事件，要进行进一步的检查**P（X）：**这里通过训练集建立完成模型 P(X)后，用训练集数据 X-test 来判断结果 P（X-test）：是否是状态异常的发动机**ε的值：**即最外圈蓝色框的概率的值。

2024-01-10 09:52:25 1409

原创 C2-3.3.4 One-hot编码

前面提到的决策树——判断是否是 “猫”，利用的是原理——即：只有两个判断结果 “是否软耳”、“是否有胡子”…

2024-01-09 11:02:34 415

决策树中的每一个节点是特征的一个随机子集，用于计算输出。当我们执行分类任务时，新的输入样本进入，对森林中的每一棵决策树分别进行判断和分类。每棵决策树都会得到自己的分类结果，而决策树哪个分类结果最多，那么随机森林就会用这个结果作为最终结果。所以就变成了右侧的决策树，使得左右两侧变成了完全不同的决策树。，往往一棵树的结果不是那么理想—— 通过多个决策树的组合，让它对数据变化没那么敏感，得到更加准确的结果。，将选取的N个样本作为决策树根节点的样本来训练一棵决策树。如下：是有放回的随机抽样的结果。

2024-01-09 10:57:56 1449

原创 C2-4.2.2 决策树-纯度+信息熵+信息增益

【※※※总结】：信息熵是用来衡量给出的数据集中数据的纯度的信息熵越小，数据就越纯。通常用在机器学习分类的情况下3.2 信息熵公式。

2024-01-09 10:38:07 2163

原创 C2-3.3.3 迁移学习

【※注释】：必须是同一个输入类型。

2024-01-08 21:28:06 532

原创 1.4.1机器学习——梯度下降+α学习率大小判定

我们开始的时候w和b可以设置为任意值。（这里我们设置 w=0 , b = 0）通过迭代不断的调整 w和b 的值，去尽量的降低损失函数J(w,b)直到我们的损失函数J(w,b) 达到/接近 “谷底”/最小值【※注意】：损失函数可能不仅仅是一个如右图的抛物线，也可能是“高尔夫球场图”，这样的话minimum最小值的个数就不仅仅是一个了“高尔夫球场图”图中XYZ轴分别代表：W，b ，损失函数 J(w,b)的值。

2024-01-08 10:05:01 1309

原创 2.2.3机器学习—— 判定梯度下降是否收敛 + α学习率的选择

*第一步：**首先选择从 0.0001 0.01 0.1 1 10 依次去尝试，当发现学习率α的值过大时（J（W,b）损失函数发生上弹）。第二步：再进行从最后一次正常的α值（出现损失函数J(w,b)上弹之前的值），依次迭代乘3去尝试。最后收敛后，选择最合适的α值。

2024-01-08 10:04:09 1070 1

原创 C2-3.4.1 精准率和召回率——解决样本不平衡的情况下准确率的问题

总结一句话：精准率和召回率——解决**样本不平衡**的情况下 **准确率**的问题

2024-01-05 20:08:20 1411 1

原创 C2-3.3.2 机器学习/深度学习——数据增强

# 1、为什么要使用数据增强？- ※总结最经典的一句话：**希望模型学习的更稳健**

2024-01-05 15:39:48 1201 1

原创 C2-3.2.1 诊断Bias（偏差） and variance(方差)——误差的两大来源+解决方案

总结：理解一：方差度量了同等大小的的变动导致学习性能的变化，。当模型越复杂时，拟合的程度就越高，模型的训练偏差就越小。但此时如果换一组数据可能模型的变化就会很大，即模型的方差很大。所以模型过于复杂的时候会导致过拟合。：是指：对于一组给定范围的数据，我们预测的很好。。但是换了一组数据后我们预测的结果没有那么理想。。。——这也是方差的定义：说一个小孩学习成绩方差大，该不该派他去参加比赛，泛化能力差，因此在训练集上变现的很好，但是在测试集上变现的不好。导致的是过拟合。

2024-01-04 09:57:34 1113 1

原创 3.4.1-欠拟合与过拟合（Bias and variance） + 相关解决方案

欠拟合与过拟合（Bias and variance） + 相关解决方案

2024-01-04 09:55:27 1388 1

原创 GitHub项目上传报错：Failed to connect to github.com port 443 after 21098 ms: Couldn‘t connect to server

windows 2008操作系统教程：https://www.gworg.com/problems/1074.html。本教程已经windows操作系统2012版本举列，当然其它的操作系统系统版本操作类似。六、TCP——特定本地端口：80，443（如果之前有80了，填写443就可以）方法二：快捷键操作方式：win+R，输入：control，回车。一、进入服务器远程桌面——开始菜单——控制面板。九、名称可自定义——描述不填写——完成。四、入站规则——新建规则。七、允许连接——下一步。八、全部勾选——下一步。

2023-09-26 16:07:13 1190 3

转载 GitHub项目创建并上传

Public 是公开，可以在 GitHub 搜到，Private 是私密项目，只有自己和项目成员能看到。本文将要记录的是，创建第一个 GitHub 项目，并将自己的本地项目上传到 GitHub。新手创建第一个GitHub项目，一步一步将本地项目提交到GitHub 经验总结第1张。新手创建第一个GitHub项目，一步一步将本地项目提交到GitHub 经验总结第2张。执行完以上命令再刷新一下 GitHub 的项目，可以看到，本地的代码已经被传上去了。（创建项目），之后会看到如下界面。

2023-09-26 16:02:12 348 1

原创 Python基础之NumPy教程——全网最全面最详细！！！

NumPy（Numerical Python的简称）是Python数值计算最重要的基础包。⼤多数提供科学计算的包都是⽤NumPy的数组作为构建基础。多维数组对象，是同构数据多维容器，也就是说，他的内容类型是相同的。基于NumPy的算法要⽐纯Python快10到100倍（甚⾄更快），并且使⽤的内存更少.专门为大数据计算所诞生的【注释：参考《书》P114】

2023-09-13 19:29:12 763 1

原创 pandas中使用 drop() 和 del()删除列数据的区别

【代码】pandas中使用 drop() 和 del()删除列数据的区别。

2023-09-13 11:49:09 766 1

原创！！！已解决ahocorasick包安装出现的 ERROR: No matching distribution found for pyahocorasick

pip install ahocorasick安装出错，怎么办？

2023-08-28 12:03:31 1355 3

原创 langchain+ChatGLM 部署

链接：https://pan.baidu.com/s/14Dx9djCxpLJb2MgpoOkG1A?pwd=ABCD提取码：ABCD。

2023-08-25 20:06:03 592 1

原创！！！亲测成功：langchain+ChatGLM 大模型部署

部署langchain+ChatGLM

2023-08-25 15:42:59 3109 3

原创前向传播之——得分函数

理解参数W和b:下面咱们再通过这张图来形象的理解下参数W和b,在真实的情况下对于每一个类别的参数W是一个3072维的，但是咱们为了形象化理解把它画在了2维的空间中，我们可以从图中看到三种颜色的线代表了三个线性分类器，参数W的每一个小权重的改变(共有3072个小权重)意味着这条线在改变的小参数的那个维度发生了偏转，我们可以想象2维空间中对于W的改变意味着什么然后再去想象这个3072维的空间。可能有些同学对于一个输入的图片如何计算出它的得分还有点困惑，这里我简单的来说一下从输入到输出的一个矩阵计算过程。

2023-07-12 15:49:58 537 2

weixin_46228946的博客

原创 C2-2.1 Mini-batch 梯度下降

原创 C2-1.4（L1,L2）正则化

原创 C2-1.6 Dropout正则化——提高泛化能力

原创 C1-3.4 多个样本的向量化

原创 C1-3.2 关于‘神经网络’

原创 C3-1.3.1 无监督学习——异常检测

原创 C2-3.3.4 One-hot编码

原创 C2-4.3.1 多个决策树——随机森林

原创 C2-4.2.2 决策树-纯度+信息熵+信息增益

原创 C2-3.3.3 迁移学习

原创 1.4.1机器学习——梯度下降+α学习率大小判定

原创 2.2.3机器学习—— 判定梯度下降是否收敛 + α学习率的选择

原创 C2-3.4.1 精准率和召回率——解决样本不平衡的情况下准确率的问题

原创 C2-3.3.2 机器学习/深度学习——数据增强

原创 C2-3.2.1 诊断Bias（偏差） and variance(方差)——误差的两大来源+解决方案

原创 3.4.1-欠拟合与过拟合（Bias and variance） + 相关解决方案

原创 GitHub项目上传报错：Failed to connect to github.com port 443 after 21098 ms: Couldn‘t connect to server

转载 GitHub项目创建并上传

原创 Python基础之NumPy教程——全网最全面最详细！！！

原创 pandas中使用 drop() 和 del()删除列数据的区别

原创！！！已解决ahocorasick包安装出现的 ERROR: No matching distribution found for pyahocorasick

原创 langchain+ChatGLM 部署

原创！！！亲测成功：langchain+ChatGLM 大模型部署

原创前向传播之——得分函数

原创什么是卷积神经网络——CNN

原创！！！已解决： Linux操作系统登录，输入正确账号密码显示却显示：Sorry, that didn‘t work. Please try again.

原创小程序反编译

转载 C#,ASP.NET 数据的持久化存储-xml文件

转载 C#，ASP.NET数据持久化存储——APP.config

原创 C#，ASP.NET委托的使用

原创小程序报错 H.createEvent is not a function !已解决

黑马day-01自己跟写笔记

黑马day-02自己跟写笔记

黑马day-02自己跟写笔记

空空如也