- 博客(53)
- 资源 (1)
- 收藏
- 关注

原创 笔记收藏系列--5分钟学会Markdown7大核心语法--最新简明版
Markdown7大核心语法--最新简明版什么是Markdown?Markdown是一种轻量级的「标记语言」,通常为程序员群体所用,目前它已是全球最大的技术分享网站GitHub和技术问答网站StackOverFlow的御用书写格式。就是这十个不到的标记符号,却能让人优雅地沉浸式记录,专注内容而不是纠结排版,达到「心中无尘,码字入神」的境界。Markdown 7大基础语法0标题标题是每篇文章必备而且最常用的格式。在Markdown中,如果想将一段文字定义为标题,只需要在...
2020-10-08 10:33:54
2380
6

原创 真香!百度网盘超级会员等级制度,等级越高,特权越多!容量,解压,转存上限,回收站保存时间,全都有!
百度网盘超级会员等级制度,等级越高,容量越大,你的网盘容量增加了多少?(手机端升级最新版本就可以查看哦)百度网盘免费用户容量是2T,超级会员可以扩容至5T,会员过期即收回空间和权限,由于工作的原因,哥哥已经陆陆续续购买超级会员几年了,也算是个百度网盘的忠实用户吧!不过今天哥哥在不经意间居然发现自己的容量涨到了10T,整整多出了5T,这是怎么回事呢?难道百度网盘将超级会员的容量增大了吗?最后经哥哥查询才得知原来百度网盘搞起了会员等级制度,在用户购买会员之后,会被...
2020-09-11 17:35:06
39973
2
原创 三种注意力机制: 多头注意力、分组多查询与多查询注意力(Multi-Head , Grouped Multi-Query , Multi-Query ):图书馆类比解读三种注意力机制的区别与优劣
用一个简单的生活场景来类比,帮助你理解图中的三种注意力机制(Multi-Head Attention, Grouped Multi-Query Attention, Multi-Query Attention)的区别。这就像在图书馆里,通过分组解决了成本高和效率低的问题,同时保留了较好的个性化服务。分组注意力机制在计算效率和结果质量之间找到了一个平衡点。多头注意力模型提供高质量的输出,但代价是计算速度慢。这种方法牺牲了质量来换取速度。
2024-11-20 21:26:01
909
原创 内积与点积,相对位置编码:RoPE(Rotary Position Embeddings)的奇妙结合:从向量相似度到位置信息的深度编码
RoPE通过旋转编码使得点积操作不仅能够计算向量的内容相似度,还能隐式地捕捉词语之间的相对位置关系。通过优化旋转矩阵的计算方式,它大大提升了效率,使得模型在处理序列数据时能够更加精准地理解上下文关系。RoPE的引入,就像是为模型加上了“位置感应器”,帮助它更智能地理解词语的相对关系。通过RoPE,点积操作变得更加聪明,能够更好地理解词语之间的顺序和相对关系,从而在自然语言处理任务中取得更好的效果。
2024-11-20 20:36:48
878
原创 破解深度学习难题:Batch Normalization 如何解决 Internal Covariate Shift (内部协变量偏移)问题
Internal Covariate Shift(内部协变量偏移)是指在深度神经网络训练过程中,由于前一层参数的更新导致后一层输入数据分布发生变化的问题。简单来说,随着模型的训练,网络的每一层都会接收到“不断变化的输入分布”,这会给训练过程带来挑战。
2024-11-20 19:56:52
401
原创 解锁AI文本生成奥秘:Greedy、Beam、Top-k、Top-p与温度控制策略全揭秘
推理策略(Inference Strategy)是指在生成模型(如 Transformer、GPT 等)进行文本生成或预测时,决定每一步选择的输出(Token)的方法。不同的推理策略对生成的结果有着显著影响,主要体现在输出的质量、多样性、生成速度等方面。以下将深入探讨常见的推理策略及其特点,帮助开发者理解如何在实际应用中选择合适的推理策略。假设从概率最高的开始累加,直到总概率 p(如 p=0.9)为止,选取这部分候选词进行随机采样。每一步生成时,从预测分布中选择概率最高的 k 个 Token(如词)。
2024-11-20 19:37:02
957
原创 在 Ubuntu 上安装 Whisper 支撑环境(ffmpeg、PyTorch)的教程(2024亲测可用)
以下是如何在 Ubuntu 系统上安装 Whisper 以进行视频转录的详细步骤。
2024-10-12 21:22:26
889
原创 Ubuntu环境使用 Whisper 与 ZhipuAI 实现本地批量视频转录与文本标点复原(本地亲测可用)
通过本项目,你可以了解到如何利用开源的自动语音识别工具(如 Whisper)和大语言模型(如 GLM4)来实现批量视频转录和文本处理。这些工具和技术的结合不仅简化了转录和标点添加的过程,还展示了多线程处理在实际项目中的应用。希望这个项目能帮助你更好地理解视频处理自动化的相关技术,欢迎大家留言讨论或提出改进建议!
2024-10-12 21:15:29
1543
原创 主流显卡和 CPU 进行 Whisper 转录性能 RTF 转录时间估算
本文对常见显卡和 CPU 在 Whisper 音频转录任务中的性能进行了比较,帮助读者选择适合的硬件。高端显卡如 RTX 4090 和数据中心级 GPU 如 H100 提供最佳的转录速度,而高端桌面 CPU 也是不错的选择。
2024-10-11 18:23:43
2346
原创 2024国内无法连接Hugging face无法下载预训练模型解决方案(Ubuntu亲测成功)
通过修改 Hugging Face Hub 的默认网址,可以使用镜像站点加速访问。首先,使用 `pip show` 命令找到 Hugging Face 包的位置,并在安装路径中的 `constants.py` 文件中修改 `_HF_DEFAULT_ENDPOINT` 为镜像网址。保存修改后,重启 Python 环境,测试 Hugging Face 是否能通过镜像站点正常加载资源,解决网络延迟问题。
2024-10-11 18:08:42
2795
原创 Linux(ubuntu18.04)安装GCC-9.3.0全指导--2021年尝试成功经验
安装GCC-9.3.0全指导一.安装准备*1_1下载GCC-9.3.0安装包**2 手动下载辅助包,自动下载太慢,咱直接自己动手解决二.安装编译1 设置配置信息2 编译3 安装三.成果检验一.安装准备本教程超贴心,只需要小伙伴们挑选一个目录开始即可,一条一条跟,不要掉队哦!下载源精选国内清华源,速度无敌!1_1下载GCC-9.3.0安装包*wget https://mirrors.tuna.tsinghua.edu.cn/gnu/gcc/gcc-9.3.0/gcc-9.3.0.tar.gz1_
2021-02-08 20:40:16
19614
20
原创 带你俯瞰经典CNN网络--AlexNet & VGG & GoogLeNet & ResNet一起和大佬们灵感互动
带你俯瞰经典CNN网络–AlexNet & VGG & GoogLeNet & ResNet一起和大佬们灵感互动 概述本文主要目的是带各位小伙伴畅游一下经典的CNN网络发展历程,感受一下大佬的灵感闪光点,让我们对目前深度学习CNN的最新前沿技术发展有个上帝视角的了解。毕竟,关注这篇文章的小伙伴都是深度学习的爱好者,为了赶上技术发展,我们必须站在巨人的肩膀,知道什么是好的,可以直接用,什么是可以再优化的。 友情提醒,阅读本文需要一定CNN基础哦,这样食用风
2020-11-18 20:45:51
378
原创 IDEA每天一个小技巧-try-catch快捷键
IDEA每天一个小技巧-try-catch快捷键我们为啥要用IDEA呢,当然是为了方便方便更方便啦o(´^`)o不多说,开始啦! 1.选定需要包裹的代码块 2.快捷键ctrl+alt+T就是这个效果还可以选择很多其他的选项哦 3. 完成...
2020-11-15 18:03:24
1046
原创 智能时代-大数据与智能革命重新定义未来(吴军)-核心书摘
智能时代-大数据与智能革命重新定义未来(吴军)-核心书摘本文主要摘录于全书正文,部分解释是博主根据自己生活体验增加的理解,欢迎大家共同讨论更正~机器学习爱好者交流QQ群:1023 119 142为新手提供机器学习资料,也欢迎大佬来分享知识。本书目录第一章:数据—人类创造文明的基石 现象、数据、信息、知识 数据的作用:文明的基石 相关性:使用数据的钥匙...
2020-11-05 18:22:00
1856
原创 5 NLP自然语言处理入门--词向量embedding&代码实现(百度架构师手把手带你零基础实践深度学习原版笔记系列)
5 NLP自然语言处理入门--词向量(百度架构师手把手带你零基础实践深度学习原版笔记系列)自然语言处理技术面临的挑战如何让机器像人一样,能够准确理解和使用自然语言?这是当前自然语言处理领域面临的最大挑战。为了解决这一问题,我们需要从语言学和计算两个角度思考。语言学角度自然语言数量多、形态各异,理解自然语言对人来说本身也是一件复杂的事情,如同义词、情感倾向、歧义性、长文本处理、语言惯性表达等。通过如下几个例子,我们一同感受一下。同义词问题请问下列词语是否为同义词...
2020-10-22 21:45:33
3275
2
原创 矩阵的点乘和叉乘--深度学习应用场景针对有矩阵基础的解惑版
矩阵的点乘和叉乘–深度学习应用场景针对有矩阵基础的解惑版 大学刚学完矩阵论,一搞深度学习,代码.dot 和 矩阵* 傻傻分不清了。这里就帮各位大佬区分一下. 先讲叉乘规则大家都知道,讲个记忆。叉乘吗,自然需要行列交叉相乘的形式才行的(^_−)☆ 学过矩阵运算的都知道,我们其实默认说的矩阵乘法就是这个所谓的叉乘就是两个矩阵形状对的上,才能正确就行叉乘运算,也就是行与列对应相乘最后相加,放在对应位置。举个栗子o(´^`)o:形状上:
2020-10-22 17:24:44
4343
2
原创 4.6 目标检测YOLO-V3算法--多尺度检测(百度架构师手把手带你零基础实践深度学习原版笔记系列)
4.6目标检测YOLO-V3算法--多尺度检测(百度架构师手把手带你零基础实践深度学习原版笔记系列)多尺度检测目前我们计算损失函数是在特征图P0的基础上进行的,它的步幅stride=32。特征图的尺寸比较小,像素点数目比较少,每个像素点的感受野很大,具有非常丰富的高层级语义信息,可能比较容易检测到较大的目标。为了能够检测到尺寸较小的那些目标,需要在尺寸较大的特征图上面建立预测输出。如果我们在C2或者C1这种层级的特征图上直接产生预测输出,可能面临新的问题,它们没有经过充分的特征提取,像...
2020-10-19 21:21:56
1428
原创 4.5 目标检测YOLO-V3算法--损失函数(百度架构师手把手带你零基础实践深度学习原版笔记系列)
4.4 目标检测YOLO-V3算法--损失函数(百度架构师手把手带你零基础实践深度学习原版笔记系列)损失函数上面从概念上将输出特征图上的像素点与预测框关联起来了,那么要对神经网络进行求解,还必须从数学上将网络输出和预测框关联起来,也就是要建立起损失函数跟网络输出之间的关系。下面讨论如何建立起YOLO-V3的损失函数。对于每个预测框,YOLO-V3模型会建立三种类型的损失函数: 表征是否包含目标物体的损失函数,通过pred_objectness和label_objectness计..
2020-10-19 21:11:21
2102
原创 4.4 目标检测YOLO-V3算法--主线二:卷积神经网络提取特征(百度架构师手把手带你零基础实践深度学习原版笔记系列)
4.4 目标检测YOLO-V3算法--主线二:卷积神经网络提取特征(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录4.4 目标检测YOLO-V3算法--主线二:卷积神经网络提取特征(百度架构师手把手带你零基础实践深度学习原版笔记系列)卷积神经网络提取特征根据输出特征图计算预测框位置和类别建立输出特征图与预测框之间的关联计算预测框是否包含物体的概率计算预测框位置坐标计算物体属于每个类别概率卷积神经网络提取特征在上一节图像分类的课程中,我们已经学习过..
2020-10-19 16:58:49
2062
原创 4.3 目标检测YOLO-V3算法--设计思想&主线一:产生候选区域(百度架构师手把手带你零基础实践深度学习原版笔记系列)
4.3 目标检测YOLO-V3算法--设计思想&主线一:产生候选区域(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录4.3 目标检测YOLO-V3算法--设计思想&主线一:产生候选区域(百度架构师手把手带你零基础实践深度学习原版笔记系列)单阶段目标检测模型YOLO-V3YOLO-V3 模型设计思想产生候选区域生成锚框生成预测框对候选区域进行标注标注锚框的具体程序单阶段目标检测模型YOLO-V3R-CNN系列算法需要先产生候选区域,再.
2020-10-19 08:57:35
1962
原创 4.2 目标检测YOLO-V3算法--数据预处理&数据增广(百度架构师手把手带你零基础实践深度学习原版笔记系列)
4.2 目标检测YOLO-V3算法--数据预处理&数据增广(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录4.2 目标检测YOLO-V3算法--数据预处理&数据增广(百度架构师手把手带你零基础实践深度学习原版笔记系列)数据预处理(数据增广目的)随机改变亮暗、对比度和颜色等随机填充随机裁剪随机缩放随机翻转随机打乱真实框排列顺序图像增广方法汇总批量数据读取与加速数据预处理(数据增广目的)在计算机视觉中,通常会对图像做一些随机的变.
2020-10-18 16:53:59
1779
1
原创 4.1 目标检测YOLO-V3算法--实验数据集介绍&数据处理(百度架构师手把手带你零基础实践深度学习原版笔记系列)
4.1 目标检测YOLO-V3算法--实验数据集介绍&数据处理(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录4.1 目标检测YOLO-V3算法--实验数据集介绍&数据处理(百度架构师手把手带你零基础实践深度学习原版笔记系列)读取AI识虫数据集标注信息数据读取数据流动框图在本课程中,将使用百度与林业大学合作开发的林业病虫害防治项目中用到昆虫数据集。(本实验数据平台及数据集均由百度AISTUDIO提供,欢迎各位小伙伴前往体验)读取AI识虫数据集标.
2020-10-18 16:28:17
1003
原创 笔记收藏系列--5分钟学会Python Jupyter Notebook快捷键--最新简明版
Notebook快捷键 快捷键分成两种状态下的. 一个是命令模式, 一个是编辑模式, 掌握之后事半功倍. 不多说直接上快捷命令图:都是核心,超核心操作呀!!!博主就是拿来当笔记收藏哒,欢迎各位小伙伴收起来 (σ゚∀゚)σ…:☆...
2020-10-17 10:02:07
840
原创 3.10 图像分类领域经典模型-GoogLeNet(百度架构师手把手带你零基础实践深度学习原版笔记系列)
3.10图像分类领域经典模型-GoogLeNet(百度架构师手把手带你零基础实践深度学习原版笔记系列)GoogLeNetGoogLeNet是2014年ImageNet比赛的冠军,它的主要特点是网络不仅有深度,还在横向上具有“宽度”。由于图像信息在空间尺寸上的巨大差异,如何选择合适的卷积核来提取特征就显得比较困难了。空间分布范围更广的图像信息适合用较大的卷积核来提取其特征;而空间分布范围较小的图像信息则适合用较小的卷积核来提取其特征。为了解决这个问题,GoogLeNet提出了一种被称为Ince..
2020-10-14 20:53:33
270
原创 3.9 图像分类领域经典模型-VGG(百度架构师手把手带你零基础实践深度学习原版笔记系列)
3.9图像分类领域经典模型-AlexNet(百度架构师手把手带你零基础实践深度学习原版笔记系列)VGGVGG是当前最流行的CNN模型之一,2014年由Simonyan和Zisserman提出,其命名来源于论文作者所在的实验室Visual Geometry Group。AlexNet模型通过构造多层网络,取得了较好的效果,但是并没有给出深度神经网络设计的方向。VGG通过使用一系列大小为3x3的小尺寸卷积核和池化层构造深度卷积神经网络,并取得了较好的效果。VGG模型因为结构简单、应用性极强而广受..
2020-10-14 20:16:51
374
1
原创 3.8 图像分类领域经典模型-AlexNet(百度架构师手把手带你零基础实践深度学习原版笔记系列)
3.8图像分类领域经典模型-概述&LeNet(百度架构师手把手带你零基础实践深度学习原版笔记系列)AlexNet通过上面的实际训练可以看到,虽然LeNet在手写数字识别数据集上取得了很好的结果,但在更大的数据集上表现却并不好。自从1998年LeNet问世以来,接下来十几年的时间里,神经网络并没有在计算机视觉领域取得很好的结果,反而一度被其它算法所超越。原因主要有两方面,一是神经网络的计算比较复杂,对当时计算机的算力来说,训练神经网络是件非常耗时的事情;另一方面,当时还没有专门针...
2020-10-14 19:45:03
529
原创 3.7 图像分类领域经典模型-概述&LeNet(百度架构师手把手带你零基础实践深度学习原版笔记系列)
3.7 图像分类领域经典模型-概述&LeNet(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录3.7 图像分类领域经典模型-概述&LeNet(百度架构师手把手带你零基础实践深度学习原版笔记系列)概述LeNetLeNet在手写数字识别上的应用LeNet在眼疾识别数据集iChallenge-PM上的应用数据集准备查看数据集图片定义数据读取器概述图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测、图像分割、.
2020-10-14 18:43:50
807
原创 3.6 CNN卷积神经网络基础知识-丢弃Dropout(百度架构师手把手带你零基础实践深度学习原版笔记系列)
3.6CNN卷积神经网络基础知识-丢弃Dropout(百度架构师手把手带你零基础实践深度学习原版笔记系列)丢弃法(Dropout)丢弃法(Dropout)是深度学习中一种常用的抑制过拟合的方法,其做法是在神经网络学习过程中,随机删除一部分神经元。训练时,随机选出一部分神经元,将其输出设置为0,这些神经元将不对外传递信号。图16是Dropout示意图,左边是完整的神经网络,右边是应用了Dropout之后的网络结构。应用Dropout之后,会将标了×的神经元从网络中删除,让它们不向后面的层...
2020-10-14 16:18:34
1845
原创 3.5 CNN卷积神经网络基础知识-批归一化Batch Normalization(百度架构师手把手带你零基础实践深度学习原版笔记系列)
3.5CNN卷积神经网络基础知识-批归一化Batch Normalization(百度架构师手把手带你零基础实践深度学习原版笔记系列)批归一化(Batch Normalization)批归一化方法方法(Batch Normalization,BatchNorm)是由Ioffe和Szegedy于2015年提出的,已被广泛应用在深度学习中,其目的是对神经网络中间层的输出进行标准化处理,使得中间层的输出更加稳定。通常我们会对神经网络的数据进行标准化处理,处理后的样本数据集满足均值为...
2020-10-14 16:10:14
1466
原创 3.4 CNN卷积神经网络基础知识-ReLU激活函数(百度架构师手把手带你零基础实践深度学习原版笔记系列)
3.4CNN卷积神经网络基础知识-ReLU激活函数(百度架构师手把手带你零基础实践深度学习原版笔记系列)ReLU激活函数前面介绍的网络结构中,普遍使用Sigmoid函数做激活函数。在神经网络发展的早期,Sigmoid函数用的比较多,而目前用的较多的激活函数是ReLU。这是因为Sigmoid函数在反向传播过程中,容易造成梯度的衰减。让我们仔细观察Sigmoid函数的形式,就能发现这一问题。Sigmoid激活函数定义如下:ReLU激活函数的定义如下:下面的程序画出了Sigmo..
2020-10-14 15:37:34
1438
原创 3.3 CNN卷积神经网络基础知识-Pooling池化(百度架构师手把手带你零基础实践深度学习原版笔记系列)
3.3CNN卷积神经网络基础知识-Pooling池化(百度架构师手把手带你零基础实践深度学习原版笔记系列)池化(Pooling)池化是使用某一位置的相邻输出的总体统计特征代替网络在该位置的输出,其好处是当输入数据做出少量平移时,经过池化函数后的大多数输出还能保持不变。比如:当识别一张图像是否是人脸时,我们需要知道人脸左边有一只眼睛,右边也有一只眼睛,而不需要知道眼睛的精确位置,这时候通过池化某一片区域的像素点来得到总体统计特征会显得很有用。由于池化之后特征图会变得更小,如果后面连接的是全连接..
2020-10-14 15:28:46
593
原创 3.2 CNN卷积神经网络基础知识-卷积操作(百度架构师手把手带你零基础实践深度学习原版笔记系列)
3.2卷积神经网络基础知识(百度架构师手把手带你零基础实践深度学习原版笔记系列)这一小节将为读者介绍卷积算法的原理和实现方案,并通过具体的案例展示如何使用卷积对图片进行操作,主要涵盖如下内容:目录3.2卷积神经网络基础知识(百度架构师手把手带你零基础实践深度学习原版笔记系列)卷积计算填充(padding)步幅(stride)感受野(Receptive Field)多输入通道、多输出通道和批量操作卷积计算卷积是数学分析中的一种积分变换的方法,在图像处理中...
2020-10-14 15:20:08
972
原创 3.1 计算机视觉的发展和卷积神经网络概要(百度架构师手把手带你零基础实践深度学习原版笔记系列)
3.1 计算机视觉的发展和卷积神经网络(百度架构师手把手带你零基础实践深度学习原版笔记系列)概要计算机视觉作为一门让机器学会如何去“看”的科学学科,具体的说,就是让机器去识别摄像机拍摄的图片或视频中的物体,检测出物体所在的位置,并对目标物体进行跟踪,从而理解并描述出图片或视频里的场景和故事,以此来模拟人脑视觉系统。因此,计算机视觉也通常被叫做机器视觉,其目的是建立能够从图像或者视频中“感知”信息的人工系统。计算机视觉技术经过几十年的发展,已经在交通(车牌识别、道路违章抓拍)、安防(人脸闸机.
2020-10-14 14:53:36
510
原创 python机器学习中random.shuffle奇技淫巧
python机器学习中random.shuffle奇技淫巧 random.shuffle()基础用法random.shuffle(list) 用来打乱这个list的顺序如图 在机器学习中的妙用玩过机器学习的大佬都知道数据集的珍贵性,我们对于训练集顺序不影响训练输出的情况,会有一个需求–打乱训练集反复使用,以榨干训练集的完整价值o(´^`)orandom.shuffle()函数完美帮助我们实现了这个功能,只需要把训练集的索引放入,出来自然就是乱
2020-10-12 16:00:57
1285
原创 2.8mnist手写数字识别之模型保存与恢复精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)
2.8mnist手写数字识别之模型保存与恢复精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录2.8mnist手写数字识别之模型保存与恢复精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)模型加载及恢复训练恢复训练模型加载及恢复训练在之前的章节已经向读者介绍了将训练好的模型保存到磁盘文件的方法。应用程序可以随时加载模型,完成预测任务。但是在日常训练工作中,我们会遇到一些突发情况,导致训练过程主动或被动的中断。如果训练一个模型需要花费几天的时间,中断后从..
2020-10-12 11:15:33
378
1
原创 2.7mnist手写数字识别之训练调试与优化精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)
2.7mnist手写数字识别之训练调试与优化精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录2.7mnist手写数字识别之训练调试与优化精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)概述计算模型的分类准确率检查模型训练过程,识别潜在训练问题加入校验或测试,更好评价模型效果加入正则化项,避免模型过拟合过拟合现象导致过拟合原因过拟合的成因与防控正则化项可视化分析使用Matplotlib库绘制损失随训练下降的曲线图使用Visu.
2020-10-12 11:05:15
1731
原创 2.6mnist手写数字识别之资源配置(含分布式)精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)
2.6mnist手写数字识别之资源配置(含分布式)精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录2.6mnist手写数字识别之资源配置精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)概述单GPU训练分布式训练模型并行数据并行PRC通信方式NCCL2通信方式(Collective)概述从前几节的训练看,无论是房价预测任务还是MNIST手写字数字识别任务,训练好一个模型不会超过十分钟,主要原因是我们所使用的神经网络比较简单。但实际..
2020-10-11 20:11:35
666
原创 2.5mnist手写数字识别之优化算法精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)
2.5mnist手写数字识别之优化算法精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录2.5mnist手写数字识别之优化算法精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)设置学习率学习率的主流优化算法设置学习率(学习率大小的选择严重影响着模型的效果,人为选择困难很大,目前已经有很好的优化学习率算法可以拿来直接用)在深度学习神经网络模型中,通常使用标准的随机梯度下降算法更新参数,学习率代表参数更新幅度的大小,即步长。当学习率最优时,模型的...
2020-10-11 19:55:07
736
1
原创 2.4mnist手写数字识别之损失函数精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)
2.4mnist手写数字识别之损失函数精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录2.4mnist手写数字识别之损失函数精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)概述分类任务的损失函数Softmax函数交叉熵交叉熵的代码实现概述损失函数是模型优化的目标,用于在众多的参数取值中,识别最理想的取值。损失函数的计算在训练过程的代码中,每一轮模型训练的过程都相同,分如下三步:先根据输入数据正向计算预测输出。 再根据预测值和真实值计算.
2020-10-11 19:25:06
2438
原创 2.3mnist手写数字识别之网络结构精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)
2.3mnist手写数字识别之网络结构精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录2.3mnist手写数字识别之网络结构精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)概述经典的全连接神经网络卷积神经网络概述前几节我们尝试使用与房价预测相同的简单神经网络解决手写数字识别问题,但是效果并不理想。原因是手写数字识别的输入是28 × 28的像素值,输出是0-9的数字标签。而线性回归模型无法捕捉二维图像数据中蕴含的复杂信息,如图1所示。无论是牛顿第二...
2020-10-11 19:05:28
919
1
Ubuntu环境使用 Whisper 与 ZhipuAI 实现本地批量视频转录与文本标点复原(本地亲测可用)
2024-10-12
基于Halcon的矿泉水瓶标签检测.zip
2020-07-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人