- 博客(15)
- 资源 (1)
- 收藏
- 关注
原创 解决训练模型时遇到的内存不足问题
你需要减少worker的数量或者让他们处理的任务简单一些,来降低对系统内存 (RAM) 的峰值需求。),他们同时从仓库(硬盘)里拿食材(图片),并进行复杂的处理(比如Mosaic数据增强,把四张图拼成一张大图)。是几个在厨房后台备菜的帮厨(在CPU上工作,使用RAM)。是一个非常典型的资源配置问题,通过调整这些参数就能让训练在你的硬件上顺利进行。想象一下,你的主程序是餐厅的大厨(在GPU上工作),而。,而你的CPU核心数很多,这里就会开启很多子进程,消耗大量RAM。,仅作为最后的排错手段。
2025-09-28 09:47:36
234
原创 语音识别基础系列一
在语音识别和说话者识别方面,最常用的语言特征就是梅尔倒谱系数(MFCC),MFCC提取过程包括预加帧(pre-emphasis)、分帧、加窗(windowing)、快速傅里叶变换、Mei滤波器组、对数运算(log)、离散余弦变换(DCT)等步骤。主要有PCM编码,MP3编码,A-law(A律)编码,AMR,WMA,AAC,M4A,FLAC。声波在空气中是一种纵波,它的振动方向和传播方向是一致的,声音在空气中的震动形成压力波动,产生压强通过传感器转换,变成时变的电压信号。关键步骤是将信号从时域转化到频域。
2025-09-27 19:43:09
355
原创 深度学习第五节(计算机视觉基础)
计算机视觉是指通过计算机系统对图像和视频进行处理和分析,利用计算机算法和方法,使计算机能够模拟和理解人类的视觉系统。
2025-09-18 11:16:58
531
原创 深度学习——数据增广
图像增广对训练数据进行一系列的随机变化,生成相似但不同的训练样本,从而扩大训练集的规模,让模型见过更多样的数据变化,减少过拟合,同时提高模型对光照、角度、噪声等变化的适应性。数据增广可以处理图片和文本和语音。对于图片的处理方式包括:覆盖掉一些像素、对颜色进行变换、对亮度进行变换,以及翻转旋转,切割。6.随机改变亮度,对比度,饱和度,色调 增加或者减少50%4.随机改变图片的亮度brightness。5.随机改变图片的色调hue。7.结合多种图像增广方法。
2025-09-18 11:00:40
400
原创 深度学习第四节(激活函数和损失函数)
在实际场景中,有时需要针对需要解决的问题子定义损失函数。return x1.定义自定义损失函数,将两个张量对象作为输入,计算他们的差的平方,并返回两者平方差的平均值。2.使用相同的输入和输出组合,调用内置的MSELoss函数。
2025-09-18 10:14:11
1719
原创 深度学习第三节(使用Pytorch构建神经网络)
神经网络通常包括输入层、隐藏层、输出层、激活函数、损失函数和学习率等基本组件。本节介绍在简单数据集上使用pytorch构建神经网络,利用张量对象操作和梯度值计算更新网络权重。
2025-09-16 16:19:46
2128
原创 NMS(非极大值抑制)在去除目标检测中重叠框的应用
目标检测模型往往对同一个物体产生多个重叠的检测框:同一个人可能被检测出2个框:┌─────┐│ ┌───┼──┐│ │ │ │ <- 2个重叠的检测框└─┼───┘ │└──────┘:NMS 保留置信度最高的框,抑制其他重叠框。
2025-09-16 16:18:26
831
原创 windows11中onnx转换为rknn文件的详细方法
用管理员身份打开powershell输入指令#下载完成后电脑重启#在(普通)PowerShell里依次执行:wsl --version # 看看是否能正常显示版本信息wsl --list --online # 看可用的发行版名称#安装 Ubuntu(首选 22.04)#尝试在线安装:WSL 的 Ubuntu 正在首启,屏幕上停在:输入用户名和密码创建linux账号。
2025-09-15 10:41:35
686
原创 解决 PyTorch “DLL load failed“ 顽疾:Windows Conda 环境下的完整指南
解决 PyTorch 在 Windows 上的 DLL 加载问题需要耐心和细致的排查。即使使用了cpuonly标志,Conda 的渠道优先级也可能导致意外安装 CUDA 版本的 PyTorch。使用可以强制 Conda 仅使用指定的渠道。当遇到顽固的依赖问题时,彻底删除并重建 Conda 环境,并清除缓存,是解决问题的最有效方法。PyTorch 的 C++ 核心库依赖于 Microsoft Visual C++ 可再发行组件包。确保安装了正确版本的这些运行时库是至关重要的。
2025-09-14 17:18:41
3058
1
原创 深度学习第二节(神经网络与模型训练过程)
训练神经网络主要通过两个关键步骤,即以给定的学习率进行前向传播和反向传播,最终神经网络架构得到最佳权重。需要注意的是第一次前向传播时,权重的值是随机初始化的。在反向传播中,通过在损失减少的方向上调整权重来减少损失值(误差),权重更新的幅度等于梯度乘以学习率。重复前向传播和反向传播的过程,知道获得尽可能小的损失,在训练结束时,神经网络已经将权重调整到近似最优值,以便获取期望的输出结果。
2025-09-13 17:32:39
787
1
原创 深度学习第一节
pytorch是广泛应用于机器学习领域的强大开源框架,因其易用性和高效性备受青睐。其中 pytorch的核心数据类型是张量对象。pytorch提供了许多帮助构建神经网络的高级方法及组件,并提供了利用GPU更快的训练神经网络的张量对象。张量类似于Numpy中的多为矩阵ndarrays,标量可以表示为零维张量,向量可以表示为一维张量,二维矩阵可以表示为二维矩阵,多维矩阵可以表示为多维张量。
2025-09-12 18:00:24
554
原创 python连接mysql 和sqlserver
1. import pymssql as sql connect = sql. connect ('host', 'user', 'password', 'database', charset= 'cp936') SQL Server中涉及到中文的缺省字符集是CP936,所以将charset配置为CP936,就解决了中文乱码的问题。conn=pymysql.connect(host = '127.0.0.1' # 连接名称,默认127.0.0.1。conn.close()# 关闭数据库连接。
2023-04-29 21:37:35
664
1
原创 mysql安装
在data里打开.err文件,root@localhost后面为初始密码。初始化(ps:这里用powershell也是可以的),出现data。mysql -uroot -p:原始密码。net start mysql启动服务。设置path路径为bin路径。现在来分享一下我的安装历程。以管理员身份打开cmd。然后修改密码,详细见图。
2023-03-13 18:59:09
152
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅