君若子衿-优快云博客

原创深度学习＞生成任务的初步认识

基于输入数据（文本/图像/语音）或特定条件（标签/风格描述），生成全新、连贯且有意义的内容典型场景：文生图、对话回复生成、语音合成等。

2025-03-14 09:39:16 502

虽然 RNN 理论上可以记住长序列信息，但在实际训练过程中，由于梯度消失或梯度爆炸问题，通常只能有效记住短期信息，而长距离的信息容易遗忘。自注意力机制类似于一个“超强搜索引擎”，在写作时，作者不仅依赖上一句话的信息，还可以快速从全文中提取最相关的内容，而不必逐句回顾。在很多任务中，Transformer 架构会被用于监督学习的场景，如机器翻译任务中直接使用带有标签的训练数据进行训练。Transformer 是一种架构，可以用于多种学习任务，包括监督学习、无监督学习（或自监督学习）以及强化学习。

2025-02-19 15:45:39 899

原创深度学习＞初识无监督学习

无监督自学习即“自监督学习”。该方法无需外部提供的标注信息，而是通过设计“预任务”让数据自身生成监督信号，帮助模型学习数据的内在结构和特征。

2025-02-18 16:59:15 331

原创深度学习＞分类任务的初步认识

池化是一种降维操作，通过汇总小区域内的信息来压缩特征图（如下图），分为最大池化和平均值池化两种方式，最大池化用该区域的最大值代表所有数，准确性低于平均池化但实现简单的多，平均池化用该区域所有数的平均值代表该区域，准确性更低但实现会多出很多计算。），交叉熵用于衡量预测的概率分布（即上图右边的y'）与真实标签分布（即上图右边的y^）的差异，如果模型把正确类别的概率预测得越高，损失就越小。2、输出图的通道数仅与卷积核的数量有关（注意区分卷积核的数量和卷积核的通道数，这是两个概念）三、卷积与全连接的关联。

2025-02-17 17:47:23 1313

原创深度学习＞回归问题实例

主成分分析（PCA，PrincipalComponentAnalysis）是一个常用于降维的统计技术，它通过线性变换将数据从原始空间投影到一个新的坐标系中，保留数据中最大的方差，去除冗余信息。例如，当输入数据是高分辨率图像时，可以通过PCA将图像的维度降低（如减少每张图像的像素数量），以减少模型的计算负担，同时保持大部分重要信息。可以训练的过程中要求loss越少越好，而正则化的损失函数可以保证loss越小的同时，参数w也尽量的小。假设原始的损失函数为L(θ)，表示模型对训练数据的预测误差。

2025-01-19 10:51:00 265

原创深度学习＞回归问题的初步认识

对于一个单层模型，可以简化为如下矩阵表示。那么在设计模型时，就可以用张量w来表示各个参数，用张量x表示输入数据。这里用一个相当简单的模型展示回归问题的流程，用于简单理解回归问题。

2025-01-13 11:34:48 146

原创深度学习＞进一步理解神经网络

具体为用输出替换激活函数中的x，得到新的输出，这样输出不再是线性的，多层的神经网络也就有了意义。在上面的过程中，由输入得到输出的过程叫做前向过程即foward，由loss求出每个参数导数的过程叫做梯度回传过程即backward，更新参数的方法叫做梯度下降（即沿着梯度方向更新参数，即沿着方向导数最大的方向更新参数）。具体实现时，loss函数只会作用于最终的输出，即求最终输出的loss，再用loss对神经网络中所有的参数进行求导（是一个复杂的链式求导过程，但用计算机实现并不需要我们关心）。

2025-01-11 10:13:29 167

原创深度学习＞初识深度学习

其中KNN即k-nearest neighbors（k最近邻居算法），是一种监督学习算法，监督即每个输入数据都有一个已知的标签或答案，模型通过这些标签来学习如何做出正确的预测，本质上可以理解为用已知答案的问题去估计未知答案的问题（用于分类和回归）；3、序列，即一组按顺序排列的数据集合，重点在于数据具有明确的前驱后继关系，同时要注意，序列中的单个元素可能很复杂（就像用队列存储结构体，每个结构体之间有明确的先后关系，且单个结构体内部包含很多变量）。2、分类，即结果要将数据分到给到的几个分类中的某个分类。

2024-12-30 21:58:18 813

原创深度学习笔记＞基础准备

直接在线安装下载速度可能很慢，可以考虑使用断点续传软件将所需包下载到本地再本地安装（conda install 文件绝对地址）略，注意将运行环境切换到上面配置的Anaconda环境中。一、安装Anaconda。二、安装touch等环境。三、安装Pycharm。

2024-12-30 20:56:42 86

原创数据结构-图

1、线性表可以为空表，树可以是空树，但图不可以是空图，即图中不能一个顶点也没有，途中的顶点集V（Vertex）一定非空，但边集E（Edge）可以为空2、顶点集V和边集E中的元素数量必须是有限的3、任意一条边的两边必须连接着两个顶点。

2023-05-17 20:40:06 331 1

原创数据结构-树与二叉树

1）二叉树是每个结点至多只有两棵子树的树，且二叉树存在左右之分，顺序不能任意颠倒，即使二叉树仅存在一个结点，也需要区分该结点的左右2）度为2的树至少有三个结点，但二叉树可以为空；度为2的树孩子的左右顺序是相对于另一个孩子而言的，当某个结点只有一个孩子时，也就不需要考虑孩子的左右顺序，但二叉树即使只有一个结点也需要考虑结点的左右顺序，即二叉树的左右顺序是绝对的，确定的3）满二叉树即指高h，结点数为2^h-1个的二叉树；完全二叉树即满二叉树少了最下层最右侧的部分叶结点的树；

2023-04-30 15:06:30 234

原创数据结构-串

1）字符串简称串，计算机上非数值春丽的对象基本都是字符串数据。如信息检索系统，即搜索引擎，文本编辑系统，即Word等2）串是由零个或多个字符组成的有限序列，一般记为S=‘a1a2....an’ (n>=0)，其中，S是串名，单引号括起来的字符序列是串的值，且ai可以是字母、数字或其他字符。串中字符的个数称为串的长度，n=0时称该串为空串3）串的逻辑结构和线性表极为相似，区别仅在于串的数据对象限定为字符集。

2023-04-12 20:28:13 221 1

原创数据结构-栈、队列和数组

1）数组是由n个相同类型的数据元素构成的有限序列，每个数据元素称为一个数组元素，每个元素在n个线性关系中的序号称为该元素的下标，下标的取值范围称为数组的维界2）数组与线性表的关系，数组是线性表的推广。一维数组可视为一个线性表，二维数组可视为其元素也是定长线性表的线性表。数组一旦被定义，其维数和维界就不再改变，因此除结构的初始化和销毁外，数组只会有存取元素的操作。

2023-04-01 10:44:55 205

原创数据结构-线性表

3）静态链表具有链表的部分优点，如在增删结点时不需要大量移动元素，而且可以利用数组中的碎片空间，但是其不如单链表灵活，失去了顺序表随机存取的特性，总的来说，是一种妥协的数据结构，可以使用在一些不支持指针的高级语言中。7）链表排序有两种思路，一种时间复杂度为n²，即每次拿出一个结点，遍历已经完成排序的结点，找到其应在的位序，插入该结点。，因为头结点可以使所有可能涉及到首个结点的操作得到简化，如删除第一个结点，没有头结点则需要单独处理首个结点（因为首个结点是没有前驱的，普通结点都需要处理前驱，但首节点不需要）

2023-03-23 20:34:59 271

原创数据结构-绪论

数据结构备考笔记，根据学习进度随时修正

2023-03-16 09:48:32 325 1

qq_62063545的博客