- 博客(20)
- 收藏
- 关注
原创 一起读论文-Dropout:一种防止神经网络过拟合的简单方法
深度神经网络(Deep Neural Networks, DNNs)因其大量参数而成为非常强大的机器学习系统。然而,过拟合在这类网络中是一个严重的问题。大型网络在使用时计算较慢,因此通过在测试时结合多个不同大型神经网络的预测来应对过拟合变得困难。Dropout 是一种用于解决该问题的技术,其核心思想是在训练过程中随机丢弃神经网络中的单元(包括它们的连接)。这种方法防止了单元之间过度共适应(Co-adaptation)。
2024-12-04 20:03:51
1019
原创 阻尼Newton方法-数值最优化方法-课程学习笔记-5
这篇文章我们继续来学习数值最优化方法第三章的后续内容这一章我们以及在之前了解过了:最速下降法,基本Newton方法,这一节我们来了解阻尼newton方法之前我们提到的基本Newton方法是以一固定步长和Newton方向进行迭代的,但是我们学习过线搜索,自然会想到这样的固定步长迭代是否会不合适, 所以对于此进行优化的方法阻尼 Newton 方法就产生了这样的方法能够保证对函数 Hassen矩阵正定的前提下函数值单调下降,于基本Newton方法不同的是,即使迭代点离x∗x^*x∗稍远这个方法也有可能收敛到最低点
2024-11-20 21:19:26
855
原创 Linear Algebra Done Right-线性代数应该这样学-学习笔记-3
继续第一章, 我们从第一章的最后一节开始这一节我们围绕子空间的概念展开, 下面我们给出子空间的定义比如说1.33 Example: {(x1,x2,0):x1,x2∈F}\{(x_1,x_2,0):x_1,x_2\in F\}{(x1,x2,0):x1,x2∈F}就是F3F^3F3的子空间有些数学家使用线性空间这样的术语, 这和子空间的意义相同由上一节学习到的概念我们可以知道, 如果我想判定一个集合是否是向量空间, 我们得从六个定义入手, 也就是我们所说的三率三元接下来我将给出方法来确定一个向量空间
2024-11-06 18:09:01
682
原创 Linear Algebra Done Right-线性代数应该这样学-学习笔记-1
今天开始复习线性代数, 我将以Linear Algebra Done Right(Sheldon Axler著)这本书为参考, 为大家分享线性代数的相关知识需要和大家强调的是, 这本书的原书, 即使是英文版也相当值得一读, 不仅写的简洁, 而且排版相当舒服, 英语不好的也只需要查阅数学专业词汇就能看懂。
2024-11-01 13:17:16
1113
原创 负梯度方法与Newton型方法-数值最优化方法-课程学习笔记-3
这一章开始我们将针对不同的最优化问题, 介绍各种各样不同的方法, 这一章的Newton型方法就是以Newton方法为基础建立起来的一系列最优化方法首先我们来了解一下, 最速下降法:假定在第k步迭代已得迭代点xkx_kxk, 为了得到xkx_kxk点最快的下降方向, 首先要满足的是数值下降, 所以先得满足公式∣gkTdk∣
2024-10-31 13:41:18
308
原创 无约束最优化方法基本结构-数值最优化方法-课程学习笔记-2
现在我们正式进入第二章的学习, 在开始学习无约束最优化方法之前我们先学习几个知识.在以后的章节, 如果没有特殊说明, 我们总假定目标函数f(x)f(x)f(x)的一阶导数存在, 当算法要求存在二阶导数时, 那就存在二阶导数, 并且一,二阶导数我们这里记作:通常我们记:之前在网上看到一个笑话:打开罐头前, 我们先学习一下如何打开罐头, 按照如下流程学习:罐头的定义,罐头的性质,罐头的特点,罐头的历史,罐头的…虽然这个是笑话, 但是在实际的学习中我们确实有必要学习完整的知识体系, 对于我们这个最优化问题求解这个
2024-10-30 17:00:29
541
原创 一起读论文-Universal Language Model Fine-tuning for Text Classification
对于归纳式迁移学习,一种简单的迁移技术(微调预训练的词嵌入)主要作用于模型的第一层,已经在实际应用中产生了巨大影响,并且在大多数最新的模型中被使用。论文提出了一个新的方法–通用语言模型微调(ULMFiT),该方法解决了这些问题,并使得任何 NLP 任务的归纳迁移学习更加稳健,这个方法使用类似于微调 ImageNet 模型相同的 3 层 LSTM 架构, 使用相同的超参数,除了微调了 dropout 超参数外没有其他改动, 这个方法在六个广泛研究的文本分类任务上表现优于高度工程化的模型和迁移学习方法。
2024-10-08 21:12:22
1132
1
原创 反证法原理
这下我们就可以把p=>q这个命题进行抽象了, 我们只需要知道, 当p是false的时候, 不用看q, 这句话一定是对的, 而如果p是true的话, 只有在q是false的时候整句话才是错的, 那么我们现在正式看看, 为什么可以使用反证法和来证明命题p=>q。既然只有四种情况, 我们不妨逐一排除, 首先, 我们有p = true成立, 那么就能先排除掉两种情况, 接着我们发现分别在~q=true和~q=false的不同情况中正好对应了"p。同样的, 我们按照这样的思路, 来理解一下p=>q。
2024-10-07 19:49:41
636
原创 引论-数值最优化方法-课程学习笔记-1
本课中我们只对非线性光滑最优化问题, 讨论求解无约束最优化问题和约束最优化问题的基本算法和基本理论。最优化问题(Optimization Problem)是数学和工程领域中的一种问题形式,这两种形式是最优化问题的最一般的形式, 其他形式的最优化问题都可以变换成这两种形式。在之后的2-5章内容我们将讨论无约束最优化问题,6-9章我们将讨论约束最优化问题。
2024-09-22 21:50:05
707
原创 专家系统-人工智能及其应用-课程学习记录-5
专家系统(Expert System)是一种人工智能程序,它利用专家知识和推理能力来解决特定领域中的复杂问题。接下来用python实现一个极简版医疗诊断专家系统,该系统将根据用户输入的症状进行简单的诊断。实际应用中,专家系统可以更复杂,包含更多的规则、复杂的推理逻辑和用户友好的接口。存储问题的初始数据和推理过程中得到的中间数据。
2024-06-17 17:27:25
450
原创 贝尔曼方程-人工智能及其应用-课程学习记录-4
贝尔曼方程(Bellman Equation)是动态规划和强化学习中的一个核心概念,用于描述一个状态的价值函数(Value Function)与其后续状态的价值函数之间的关系。它能够帮助我们递归地定义并求解每个状态的价值,从而找到最优策略。贝尔曼方程的基本形式在一个马尔可夫决策过程(MDP)中,贝尔曼方程的基本形式如下:Vsπ=E[Rt+γVπ(St+1)∣St=s]V^\pi_s=E[R_t+\gamma V^{\pi} (S_{t+1})|S_t=s]Vsπ=E[Rt+γVπ(St+1
2024-06-17 17:07:00
1148
原创 反向传播算法-人工智能及其应用-课程学习记录-3
但是,这样即使参数已经很多了,我们从头到尾对输入参数做的变换都只是线性变换,并没有非线性变换,这里我们就需要再加上一个步骤,那就是非线性变换,我们在每一个节点输入后,把输入的值带入一个函数,得到其非线性变换的输出,这里我们使用的函数有很多种,比如sigmoid函数,relu函数,tanh函数以及他们的变种等等…我们以[-2,-2]为方向,设定一个合适的值为步长前进一步,然后再次计算负梯度再前进,如果步长选取合适,在一定次数的迭代下我们就能走到损失函数变化量足够小的情况也就是达到了最小值点,得到了最优的。
2024-06-17 12:35:54
1063
原创 KMP-一种用于生成和优化运动轨迹的方法-人工智能及其应用-课程学习记录-2
KMP (Kernelised Movement Primitives) 是一种生成和优化运动轨迹的方法。想象一下,你要让一个机器人手臂从一点移动到另一点,同时避开障碍物。KMP就像一个聪明的导航系统,可以根据已经学到的示范动作生成平滑且安全的轨迹,这就是KMP的作用.由名字看来,可以理解为一种基于核的方法的运动基元,那么什么又是核方法什么又是运动基元呢?关键概念核方法 (Kernel Methods)
2024-06-16 17:16:23
1581
原创 PRM和RRT--用于机器人高维轨迹规划的算法-人工智能及其应用-课程学习记录-1
起始点和目标点的连接:理论上,如果 PRM 能够无限制地采样和连接,那么任何起始点和目标点都有可能在图中找到连接它们的路径。但在实际情况下,由于采样和连接的有限性,某些起始点和目标点可能无法直接连接,需要通过多步骤的路径来实现连接。但在实际情况下,由于采样数量的限制和连接策略的选择,可能需要较长的时间来找到路径,或者有些路径可能无法找到。总的来说,PRM 算法是一种强大的路径规划方法,可以在理论上保证在无限采样和连接的情况下找到路径,并且通常能够在实际场景中捕捉到自由空间的连通性。
2024-06-14 22:17:17
1831
原创 微处理器体系结构及关键技术-微处理器系统结构与嵌入式系统设计-课程学习记录-3
而控制器部分,质量数据也是先被暂存于指令寄存器,按照一定的规则,获取指令的操作片段和数据片段,通过译码器分析应该产生的控制信号,并根据分离出来的数据片段进行查找数据或者直接使用,而我们之前提到的CISC和RISC的指令系统的设计主要就在于控制器当中,同时,控制器当中也存在着必不可少的时序控制部件,可以控制指令周期、工作周期、时钟周期.如ADD Rd,Rs1,imm(Rs),表示在imm地址基础上加上Rs存储的位移得到的地址的数据和Rs1的数据相加放在Rd中,注意了,这里的位移要看计算机的字节长。
2024-06-14 21:39:39
1081
原创 计算机系统结构组成与工作原理-微处理器系统结构与嵌入式系统设计-课程学习记录-2
4.有了规定了标准的汇编指令,我们就可以统一进行编程了,那么为了可以构建一个计算机整体,我们需要一个软件来整体地管理所有功能,这样操作系统就诞生了,第四步我们来到了软件方面的系统软件,操作系统层也称操作系统虚拟机,这个层次中,我们用一个软件整体地管理全部的功能,在这个软件上我们可以继续写更分支的软件,也可以管理整体的计算机运行。一个好的体系结构可以给计算机带来良好的性能,早在埃尼亚克的年代,就有一种体系结构叫:冯诺依曼结构,这个结构中存在如下几个部分:输入,存储器,控制器,运算器,输出,总线.
2024-06-13 22:54:06
614
原创 概论-微处理器系统结构与嵌入式系统设计-课程学习记录-1
嵌入式系统设计技术是一门交叉学科,涉及计算机、微电子、网络、通信、信号处理、传感器等诸多领域。随着现代微电子技术、微机电系统MEMS、片上系统SoC、纳米材料、无线通信技术、信号处理技术、计算机网络技术等的进步以及互联网的迅猛发展,嵌入式系统向集成化、微型化,智能化、网络化方向发展。集成电路内可容纳晶体管的数目每18个月翻一番。
2024-06-13 21:36:47
181
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人