- 博客(16)
- 收藏
- 关注
原创 深度学习>生成任务的初步认识
基于输入数据(文本/图像/语音)或特定条件(标签/风格描述),生成全新、连贯且有意义的内容典型场景:文生图、对话回复生成、语音合成等。
2025-03-14 09:39:16
502
原创 深度学习>无监督自学习实例
虽然 RNN 理论上可以记住长序列信息,但在实际训练过程中,由于梯度消失或梯度爆炸问题,通常只能有效记住短期信息,而长距离的信息容易遗忘。自注意力机制类似于一个“超强搜索引擎”,在写作时,作者不仅依赖上一句话的信息,还可以快速从全文中提取最相关的内容,而不必逐句回顾。在很多任务中,Transformer 架构会被用于监督学习的场景,如机器翻译任务中直接使用带有标签的训练数据进行训练。Transformer 是一种架构,可以用于多种学习任务,包括监督学习、无监督学习(或自监督学习)以及强化学习。
2025-02-19 15:45:39
899
原创 深度学习>初识无监督学习
无监督自学习即“自监督学习”。该方法无需外部提供的标注信息,而是通过设计“预任务”让数据自身生成监督信号,帮助模型学习数据的内在结构和特征。
2025-02-18 16:59:15
331
原创 深度学习>分类任务的初步认识
池化是一种降维操作,通过汇总小区域内的信息来压缩特征图(如下图),分为最大池化和平均值池化两种方式,最大池化用该区域的最大值代表所有数,准确性低于平均池化但实现简单的多,平均池化用该区域所有数的平均值代表该区域,准确性更低但实现会多出很多计算。),交叉熵用于衡量预测的概率分布(即上图右边的y')与真实标签分布(即上图右边的y^)的差异,如果模型把正确类别的概率预测得越高,损失就越小。2、输出图的通道数仅与卷积核的数量有关(注意区分卷积核的数量和卷积核的通道数,这是两个概念)三、卷积与全连接的关联。
2025-02-17 17:47:23
1313
原创 深度学习>回归问题实例
主成分分析(PCA,PrincipalComponentAnalysis)是一个常用于降维的统计技术,它通过线性变换将数据从原始空间投影到一个新的坐标系中,保留数据中最大的方差,去除冗余信息。例如,当输入数据是高分辨率图像时,可以通过PCA将图像的维度降低(如减少每张图像的像素数量),以减少模型的计算负担,同时保持大部分重要信息。可以训练的过程中要求loss越少越好,而正则化的损失函数可以保证loss越小的同时,参数w也尽量的小。假设原始的损失函数为L(θ),表示模型对训练数据的预测误差。
2025-01-19 10:51:00
265
原创 深度学习>回归问题的初步认识
对于一个单层模型,可以简化为如下矩阵表示。那么在设计模型时,就可以用张量w来表示各个参数,用张量x表示输入数据。这里用一个相当简单的模型展示回归问题的流程,用于简单理解回归问题。
2025-01-13 11:34:48
146
原创 深度学习>进一步理解神经网络
具体为用输出替换激活函数中的x,得到新的输出,这样输出不再是线性的,多层的神经网络也就有了意义。在上面的过程中,由输入得到输出的过程叫做前向过程即foward,由loss求出每个参数导数的过程叫做梯度回传过程即backward,更新参数的方法叫做梯度下降(即沿着梯度方向更新参数,即沿着方向导数最大的方向更新参数)。具体实现时,loss函数只会作用于最终的输出,即求最终输出的loss,再用loss对神经网络中所有的参数进行求导(是一个复杂的链式求导过程,但用计算机实现并不需要我们关心)。
2025-01-11 10:13:29
167
原创 深度学习>初识深度学习
其中KNN即k-nearest neighbors(k最近邻居算法),是一种监督学习算法,监督即每个输入数据都有一个已知的标签或答案,模型通过这些标签来学习如何做出正确的预测,本质上可以理解为用已知答案的问题去估计未知答案的问题(用于分类和回归);3、序列,即一组按顺序排列的数据集合,重点在于数据具有明确的前驱后继关系,同时要注意,序列中的单个元素可能很复杂(就像用队列存储结构体,每个结构体之间有明确的先后关系,且单个结构体内部包含很多变量)。2、分类,即结果要将数据分到给到的几个分类中的某个分类。
2024-12-30 21:58:18
813
原创 深度学习笔记>基础准备
直接在线安装下载速度可能很慢,可以考虑使用断点续传软件将所需包下载到本地再本地安装(conda install 文件绝对地址)略,注意将运行环境切换到上面配置的Anaconda环境中。一、安装Anaconda。二、安装touch等环境。三、安装Pycharm。
2024-12-30 20:56:42
86
原创 数据结构-图
1、线性表可以为空表,树可以是空树,但图不可以是空图,即图中不能一个顶点也没有,途中的顶点集V(Vertex)一定非空,但边集E(Edge)可以为空2、顶点集V和边集E中的元素数量必须是有限的3、任意一条边的两边必须连接着两个顶点。
2023-05-17 20:40:06
331
1
原创 数据结构-树与二叉树
1)二叉树是每个结点至多只有两棵子树的树,且二叉树存在左右之分,顺序不能任意颠倒,即使二叉树仅存在一个结点,也需要区分该结点的左右2)度为2的树至少有三个结点,但二叉树可以为空;度为2的树孩子的左右顺序是相对于另一个孩子而言的,当某个结点只有一个孩子时,也就不需要考虑孩子的左右顺序,但二叉树即使只有一个结点也需要考虑结点的左右顺序,即二叉树的左右顺序是绝对的,确定的3)满二叉树即指高h,结点数为2^h-1个的二叉树;完全二叉树即满二叉树少了最下层最右侧的部分叶结点的树;
2023-04-30 15:06:30
234
原创 数据结构-串
1)字符串简称串,计算机上非数值春丽的对象基本都是字符串数据。如信息检索系统,即搜索引擎,文本编辑系统,即Word等2)串是由零个或多个字符组成的有限序列,一般记为S=‘a1a2....an’ (n>=0),其中,S是串名,单引号括起来的字符序列是串的值,且ai可以是字母、数字或其他字符。串中字符的个数称为串的长度,n=0时称该串为空串3)串的逻辑结构和线性表极为相似,区别仅在于串的数据对象限定为字符集。
2023-04-12 20:28:13
221
1
原创 数据结构-栈、队列和数组
1)数组是由n个相同类型的数据元素构成的有限序列,每个数据元素称为一个数组元素,每个元素在n个线性关系中的序号称为该元素的下标,下标的取值范围称为数组的维界2)数组与线性表的关系,数组是线性表的推广。一维数组可视为一个线性表,二维数组可视为其元素也是定长线性表的线性表。数组一旦被定义,其维数和维界就不再改变,因此除结构的初始化和销毁外,数组只会有存取元素的操作。
2023-04-01 10:44:55
205
原创 数据结构-线性表
3)静态链表具有链表的部分优点,如在增删结点时不需要大量移动元素,而且可以利用数组中的碎片空间,但是其不如单链表灵活,失去了顺序表随机存取的特性,总的来说,是一种妥协的数据结构,可以使用在一些不支持指针的高级语言中。7)链表排序有两种思路,一种时间复杂度为n²,即每次拿出一个结点,遍历已经完成排序的结点,找到其应在的位序,插入该结点。,因为头结点可以使所有可能涉及到首个结点的操作得到简化,如删除第一个结点,没有头结点则需要单独处理首个结点(因为首个结点是没有前驱的,普通结点都需要处理前驱,但首节点不需要)
2023-03-23 20:34:59
271
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人