BingJJJ-优快云博客

原创记录一次薛定谔bug

复制粘贴上述调试代码到你的 __getitem__ 方法中。运行你的训练脚本。仔细观察终端的输出。如果看到我们自定义的FileNotFoundError，恭喜你找到了新的“罪犯”，记下它的名字去处理。如果还是老的cv2.error，那么问题就是文件损坏或权限问题，去检查那个文件本身。我们正在从外围的“缓存”问题，深入到代码内部去直接捕捉证据。这个方法几乎肯定能帮你定位到问题的根源。请把修改后再次运行的完整错误信息（如果有的话）发给我，我们可以一起分析。

2025-07-27 19:47:28 659

原创 Pycharm画图中文无法显示：UserWarning: Glyph 20013 (\N{CJK UNIFIED IDEOGRAPH-4E2D}) missing from current font.

删除该后中文字体显示恢复正常，因为。，某些参数与中文字体渲染存在冲突。正常情况下，添加以下代码即可解决。

2025-05-27 10:59:56 834 1

原创远程服务器打开Tensorboard最简易方法

【代码】远程服务器打开Tensorboard最简易方法。

2025-05-14 20:14:56 227

原创 5.7 表格模型学习

之间用于提取表格数据的DAE很简单，担心模型效果不好，所以寻找一个更合适的模型进行特征编码，之后进行模型效果的对比。

2025-05-07 21:38:03 940

原创 5.6-DAE实现

【代码】5.6-DAE实现。

2025-05-07 19:42:30 337

原创深度学习零碎知识

激活函数帮助神经网络提取不同层次的特征。如果没有激活函数，神经网络只是多个线性变换的叠加，整体仍然是一个线性模型。通过激活函数，神经网络可以表示复杂的非线性函数，从而解决更复杂的任务。深层网络可以用更少的参数学习到更复杂的特征。相比之下，单层网络需要大量神经元才能达到类似的效果，导致参数冗余和计算浪费。，从而使神经网络能够学习复杂的函数关系。在实际应用中，单层网络可能需要非常多的神经元才能达到较好的效果。激活函数可以控制神经元的输出范围，使其符合任务需求。就可以最大化似然函数，最大可能找到正确的模型。

2025-03-18 16:51:01 912

原创理解矩阵乘以向量如何“将空间进行了扭曲”

矩阵乘以向量的运算 c=Ab 是一种。

2025-03-17 10:22:26 526

原创深度学习知识：softlabel策略

根据目标值 y 的位置，为每个区间分配一个概率值。例如：如果 y=0.7，它更接近区间 3，因此可以定义 Soft 标签为 q=[0.1,0.2,0.7]。

2025-03-13 20:19:45 1489 1

原创深度学习基础：线性代数本质6——逆矩阵、列空间与零向量

从几何角度求解线性方程组：从逆矩阵，列空间，零空间线性方程组：对应一个线性变换。

2025-03-12 15:29:53 1095

原创深度学习基础：线性代数本质5——行列式

我们注意到，有一些变换在结果上拉伸了整个网格，有一些则是压缩了，那如何度量这种压缩和拉伸呢？或者换一种更容易思考的表达，某一块面积的缩放比例是多少？其实，根据我们之前讲的基向量，我们只需要知道i帽和j帽组成的面积为1的正方形面积缩放了多少。所以行列式就是这个特殊的缩放比例，即线性变换对面积产生改变的比例。比如说一个线性变换的行列式为6，那么就算是它将一个区域的面积增加为原来的6倍特别的，我们可以发现，如果一个矩阵的行列式为0，意味着它把这个空间降维了（例如原本二维的变为了一维的线了），并且矩阵的。

2025-03-12 11:42:46 762

原创深度学习基础：线性代数本质4——矩阵乘法

两个矩阵相乘的意义就是。

2025-03-12 11:15:47 504

原创深度学习基础：线性代数本质3——矩阵与线性变换

你对线性代数的一切困惑，根源就在于没有真正理解矩阵到底是什么。

2025-03-12 10:43:22 762

原创深度学习基础：线性代数本质2——线性组合、张成的空间与基

向量空间的一组基是张成该空间的一个线性无关向量集。

2025-03-11 22:41:34 1141

原创深度学习基础：线性代数的本质1——深入理解向量

从几何方面思考向量，当遇到向量时，首先考虑一个箭头以及落在某个坐标系中，比如x-y平面，并且箭头起点为原点，这里和物理学角度的不同，向量可以在空间中如何位置落脚（起点），但是在线性代数中向量（通常以坐标系中的原点为起点）把每个向量看作一种特定的运动，及在空间中朝着某个方向迈出一定的，先按v的运动方式运动，然后按照w的运动方式运动，总体运动效果与沿着这两个向量的和运动无异。，等于将向量中的各个元素（分量）分别进行缩放。平移向量使向量首尾相连，则向量相加的结果是第一个向量的起点到最后一个向量的终点。

2025-03-11 22:00:55 1145

原创 DeepGEM模型

这篇论文讨论了使用深度学习技术，基于组织学图像来预测肺癌基因突变的研究。以下是主要内容的总结和讲解：### 研究背景肺癌是全球范围内导致癌症死亡的主要原因之一。准确检测和识别特定基因突变对于指导个性化治疗至关重要。近年来，随着计算机视觉和深度学习技术的发展，利用组织学图像进行基因突变预测成为了一个热门研究领域。### 数据集和参与者特征该研究汇总了来自16个医疗中心的数据，包括内部数据集（n=1716）、外部数据集（n=1718）以及淋巴结转移数据集（n=203）。

2025-02-07 15:51:27 994

原创机器学习基础-支持向量机SVM

基本概念和定义SVM算法基本思想和分类间隔最大化核函数的概念

2025-01-06 12:52:09 465

原创机器学习基础-线性回归和逻辑回归

基本概念和定义线性回归中的最小二乘法和梯度下降法数据归一化方法过拟合和欠拟合的概念及处理方法激活函数SIGMOD表示及特点线性回归和逻辑回归的异同

2025-01-06 12:13:34 862

原创机器学习基础-概率图模型

（一阶）马尔科夫模型的基本概念状态转移矩阵的基本概念隐马尔可夫模型（HMM）的基本概念条件随机场（CRF）的基本概念HMM和CRF的比较主题模型（Topic Model）的基本概念

2025-01-05 21:57:05 549

原创机器学习基础-贝叶斯分类器

贝叶斯公式极大似然估计生成式模型和判别式模型的概念朴素贝叶斯分类器基本假设和计算

2025-01-05 20:54:26 1208

原创机器学习基础-大语言模型

大语言模型的基本概念“大”体现在什么地方？预训练+微调两阶段的基本流程和作用；BERT模型中MLM和NSP机制基本概念；Prompt提示学习的基本概念；思维链提示（Chain-of-Thought Prompting）的基本概念；模型蒸馏的基本概念；多模态的基本概念

2025-01-04 21:20:05 1104

原创机器学习基础-机器学习的常用学习方法

半监督学习、规则学习、强化学习的概念

2025-01-03 07:53:18 1063

原创机器学习基础-卷积的计算

掌握卷积计算的基本过程卷积如何计算，padding，stride的作用

2025-01-02 22:42:21 997 1

原创 Transformer从零详细解读——DASOU讲AI

transformer的任务是什么？进一步细化进一步细化，注意：每个encoder结构相同，参数不同；

2025-01-02 21:17:38 955

原创李宏毅机器学习笔记-Transformer

Transformer 中的每个 Block 结构较为复杂，不仅包括 self-attention 层和全连接（FC）层，还结合了 residual connections 和 layer normalization 技术，以提高模型性能和训练稳定性。

2025-01-01 22:31:56 1774

原创李宏毅机器学习笔记-自注意力机制（self-attention)

I 是self -attention 的input，一串vector；self-attention 的运作机制其实就是一连串的矩阵乘法。在这一系列矩阵中，只有矩阵W q , W k , W v 是未知的，是需要通过训练学习的参数。

2024-12-30 21:32:34 1209

原创机器学习基础-神经网络与深度学习

多层前馈网络MLP的基本结构BP算法的基本原理局部极小值和全局极小值，如何跳出局部极小值如何缓解过拟合卷积神经网络的基本概念卷积和下采样的概念和方法循环网络的基本结构，梯度消失和梯度爆炸产生的原因LSTM的结构，三个门的作用循环网络模型解决翻译问题的弊端注意力机制的基本概念和方法Transformer中的自注意力机制（Q,K,V矩阵的作用）Transformer中编码器-解码器结构工作基本流程

2024-12-29 22:18:41 1262

原创 CPU条件下Pytorch、jupyter环境配置

选择合适版本复制链接，运行所给指令。创建python虚拟环境。查看虚拟环境下有哪些包。

2024-12-22 14:01:37 356 1

原创优化器介绍——SGD和Adam

在SGD中，模型的参数向负梯度方向更新，使得损失函数的值逐渐减少。具体来说，每个训练样本的误差对每个参数的偏导数被计算，并且应用于参数的当前值以更新它。在迭代过程中，每次更新后，下一个样本的误差被计算，参数再次更新。Adam（Adaptive Moment Estimation）是一种自适应学习率的优化算法，是在动量梯度下降和自适应学习率算法的基础上发展而来的。总的来说，Adam算法是一种高效、自适应的优化算法，在各类深度学习问题中表现出色，被广泛应用。能够处理稀疏梯度，对参数的更新不受梯度的大小影响。

2024-12-13 02:05:11 1027 1

空空如也

空空如也