自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (1)
  • 收藏
  • 关注

原创 简单transform架构代码

【代码】简单transform架构代码。

2025-12-16 14:49:08 84

原创 解决训练模型时遇到的内存不足问题

你需要减少worker的数量或者让他们处理的任务简单一些,来降低对系统内存 (RAM) 的峰值需求。),他们同时从仓库(硬盘)里拿食材(图片),并进行复杂的处理(比如Mosaic数据增强,把四张图拼成一张大图)。是几个在厨房后台备菜的帮厨(在CPU上工作,使用RAM)。是一个非常典型的资源配置问题,通过调整这些参数就能让训练在你的硬件上顺利进行。想象一下,你的主程序是餐厅的大厨(在GPU上工作),而。,而你的CPU核心数很多,这里就会开启很多子进程,消耗大量RAM。,仅作为最后的排错手段。

2025-09-28 09:47:36 234

原创 语音识别基础系列一

在语音识别和说话者识别方面,最常用的语言特征就是梅尔倒谱系数(MFCC),MFCC提取过程包括预加帧(pre-emphasis)、分帧、加窗(windowing)、快速傅里叶变换、Mei滤波器组、对数运算(log)、离散余弦变换(DCT)等步骤。主要有PCM编码,MP3编码,A-law(A律)编码,AMR,WMA,AAC,M4A,FLAC。声波在空气中是一种纵波,它的振动方向和传播方向是一致的,声音在空气中的震动形成压力波动,产生压强通过传感器转换,变成时变的电压信号。关键步骤是将信号从时域转化到频域。

2025-09-27 19:43:09 355

原创 在itop-rk3588上部署deepseek-1.3b模型

cd ~/​# 更新系统包管理器。

2025-09-26 19:20:53 574

原创 深度学习第五节(计算机视觉基础)

计算机视觉是指通过计算机系统对图像和视频进行处理和分析,利用计算机算法和方法,使计算机能够模拟和理解人类的视觉系统。

2025-09-18 11:16:58 531

原创 深度学习——数据增广

图像增广对训练数据进行一系列的随机变化,生成相似但不同的训练样本,从而扩大训练集的规模,让模型见过更多样的数据变化,减少过拟合,同时提高模型对光照、角度、噪声等变化的适应性。数据增广可以处理图片和文本和语音。对于图片的处理方式包括:覆盖掉一些像素、对颜色进行变换、对亮度进行变换,以及翻转旋转,切割。6.随机改变亮度,对比度,饱和度,色调 增加或者减少50%4.随机改变图片的亮度brightness。5.随机改变图片的色调hue。7.结合多种图像增广方法。

2025-09-18 11:00:40 400

原创 深度学习第四节(激活函数和损失函数)

在实际场景中,有时需要针对需要解决的问题子定义损失函数。​​​​​return x1.定义自定义损失函数,将两个张量对象作为输入,计算他们的差的平方,并返回两者平方差的平均值。2.使用相同的输入和输出组合,调用内置的MSELoss函数。

2025-09-18 10:14:11 1719

原创 深度学习第三节(使用Pytorch构建神经网络)

神经网络通常包括输入层、隐藏层、输出层、激活函数、损失函数和学习率等基本组件。本节介绍在简单数据集上使用pytorch构建神经网络,利用张量对象操作和梯度值计算更新网络权重。

2025-09-16 16:19:46 2128

原创 NMS(非极大值抑制)在去除目标检测中重叠框的应用

目标检测模型往往对同一个物体产生多个重叠的检测框:同一个人可能被检测出2个框:┌─────┐│ ┌───┼──┐│ │ │ │ <- 2个重叠的检测框└─┼───┘ │└──────┘:NMS 保留置信度最高的框,抑制其他重叠框。

2025-09-16 16:18:26 831

原创 windows11中onnx转换为rknn文件的详细方法

用管理员身份打开powershell输入指令#下载完成后电脑重启​#在(普通)PowerShell里依次执行:wsl --version # 看看是否能正常显示版本信息wsl --list --online # 看可用的发行版名称#安装 Ubuntu(首选 22.04)#尝试在线安装:WSL 的 Ubuntu 正在首启,屏幕上停在:输入用户名和密码创建linux账号。

2025-09-15 10:41:35 686

原创 解决 PyTorch “DLL load failed“ 顽疾:Windows Conda 环境下的完整指南

解决 PyTorch 在 Windows 上的 DLL 加载问题需要耐心和细致的排查。即使使用了cpuonly标志,Conda 的渠道优先级也可能导致意外安装 CUDA 版本的 PyTorch。使用可以强制 Conda 仅使用指定的渠道。当遇到顽固的依赖问题时,彻底删除并重建 Conda 环境,并清除缓存,是解决问题的最有效方法。PyTorch 的 C++ 核心库依赖于 Microsoft Visual C++ 可再发行组件包。确保安装了正确版本的这些运行时库是至关重要的。

2025-09-14 17:18:41 3058 1

原创 深度学习第二节(神经网络与模型训练过程)

训练神经网络主要通过两个关键步骤,即以给定的学习率进行前向传播和反向传播,最终神经网络架构得到最佳权重。需要注意的是第一次前向传播时,权重的值是随机初始化的。在反向传播中,通过在损失减少的方向上调整权重来减少损失值(误差),权重更新的幅度等于梯度乘以学习率。重复前向传播和反向传播的过程,知道获得尽可能小的损失,在训练结束时,神经网络已经将权重调整到近似最优值,以便获取期望的输出结果。

2025-09-13 17:32:39 787 1

原创 深度学习第一节

pytorch是广泛应用于机器学习领域的强大开源框架,因其易用性和高效性备受青睐。其中 pytorch的核心数据类型是张量对象。pytorch提供了许多帮助构建神经网络的高级方法及组件,并提供了利用GPU更快的训练神经网络的张量对象。张量类似于Numpy中的多为矩阵ndarrays,标量可以表示为零维张量,向量可以表示为一维张量,二维矩阵可以表示为二维矩阵,多维矩阵可以表示为多维张量。

2025-09-12 18:00:24 554

原创 python连接mysql 和sqlserver

1. import pymssql as sql connect = sql. connect ('host', 'user', 'password', 'database', charset= 'cp936') SQL Server中涉及到中文的缺省字符集是CP936,所以将charset配置为CP936,就解决了中文乱码的问题。conn=pymysql.connect(host = '127.0.0.1' # 连接名称,默认127.0.0.1。conn.close()# 关闭数据库连接。

2023-04-29 21:37:35 664 1

原创 mysql安装

在data里打开.err文件,root@localhost后面为初始密码。初始化(ps:这里用powershell也是可以的),出现data。mysql -uroot -p:原始密码。net start mysql启动服务。设置path路径为bin路径。现在来分享一下我的安装历程。以管理员身份打开cmd。然后修改密码,详细见图。

2023-03-13 18:59:09 152 1

JavaSE笔记.md

JavaSE笔记.md

2022-05-02

数据结构历年试卷.zip

数据结构历年试卷.zip

2023-02-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除