BIBABULALA-优快云博客

原创简单transform架构代码

【代码】简单transform架构代码。

2025-12-16 14:49:08 84

你需要减少worker的数量或者让他们处理的任务简单一些，来降低对系统内存 (RAM) 的峰值需求。)，他们同时从仓库（硬盘）里拿食材（图片），并进行复杂的处理（比如Mosaic数据增强，把四张图拼成一张大图）。是几个在厨房后台备菜的帮厨（在CPU上工作，使用RAM）。是一个非常典型的资源配置问题，通过调整这些参数就能让训练在你的硬件上顺利进行。想象一下，你的主程序是餐厅的大厨（在GPU上工作），而。，而你的CPU核心数很多，这里就会开启很多子进程，消耗大量RAM。，仅作为最后的排错手段。

2025-09-28 09:47:36 234

原创语音识别基础系列一

在语音识别和说话者识别方面，最常用的语言特征就是梅尔倒谱系数（MFCC），MFCC提取过程包括预加帧（pre-emphasis）、分帧、加窗（windowing）、快速傅里叶变换、Mei滤波器组、对数运算（log）、离散余弦变换（DCT）等步骤。主要有PCM编码，MP3编码，A-law（A律)编码，AMR，WMA，AAC，M4A，FLAC。声波在空气中是一种纵波，它的振动方向和传播方向是一致的，声音在空气中的震动形成压力波动，产生压强通过传感器转换，变成时变的电压信号。关键步骤是将信号从时域转化到频域。

2025-09-27 19:43:09 355

原创在itop-rk3588上部署deepseek-1.3b模型

cd ~/# 更新系统包管理器。

2025-09-26 19:20:53 574

原创深度学习第五节（计算机视觉基础）

计算机视觉是指通过计算机系统对图像和视频进行处理和分析，利用计算机算法和方法，使计算机能够模拟和理解人类的视觉系统。

2025-09-18 11:16:58 531

原创深度学习——数据增广

图像增广对训练数据进行一系列的随机变化，生成相似但不同的训练样本，从而扩大训练集的规模，让模型见过更多样的数据变化，减少过拟合，同时提高模型对光照、角度、噪声等变化的适应性。数据增广可以处理图片和文本和语音。对于图片的处理方式包括：覆盖掉一些像素、对颜色进行变换、对亮度进行变换，以及翻转旋转，切割。6.随机改变亮度，对比度，饱和度，色调增加或者减少50%4.随机改变图片的亮度brightness。5.随机改变图片的色调hue。7.结合多种图像增广方法。

2025-09-18 11:00:40 400

原创深度学习第四节（激活函数和损失函数）

在实际场景中，有时需要针对需要解决的问题子定义损失函数。return x1.定义自定义损失函数，将两个张量对象作为输入，计算他们的差的平方，并返回两者平方差的平均值。2.使用相同的输入和输出组合，调用内置的MSELoss函数。

2025-09-18 10:14:11 1719

原创深度学习第三节（使用Pytorch构建神经网络）

神经网络通常包括输入层、隐藏层、输出层、激活函数、损失函数和学习率等基本组件。本节介绍在简单数据集上使用pytorch构建神经网络，利用张量对象操作和梯度值计算更新网络权重。

2025-09-16 16:19:46 2128

原创 NMS(非极大值抑制)在去除目标检测中重叠框的应用

目标检测模型往往对同一个物体产生多个重叠的检测框：同一个人可能被检测出2个框：┌─────┐│ ┌───┼──┐│ │ │ │ <- 2个重叠的检测框└─┼───┘ │└──────┘：NMS 保留置信度最高的框，抑制其他重叠框。

2025-09-16 16:18:26 831

原创 windows11中onnx转换为rknn文件的详细方法

用管理员身份打开powershell输入指令#下载完成后电脑重启#在（普通）PowerShell里依次执行：wsl --version # 看看是否能正常显示版本信息wsl --list --online # 看可用的发行版名称#安装 Ubuntu（首选 22.04）#尝试在线安装：WSL 的 Ubuntu 正在首启，屏幕上停在：输入用户名和密码创建linux账号。

2025-09-15 10:41:35 686

原创解决 PyTorch “DLL load failed“ 顽疾：Windows Conda 环境下的完整指南

解决 PyTorch 在 Windows 上的 DLL 加载问题需要耐心和细致的排查。即使使用了cpuonly标志，Conda 的渠道优先级也可能导致意外安装 CUDA 版本的 PyTorch。使用可以强制 Conda 仅使用指定的渠道。当遇到顽固的依赖问题时，彻底删除并重建 Conda 环境，并清除缓存，是解决问题的最有效方法。PyTorch 的 C++ 核心库依赖于 Microsoft Visual C++ 可再发行组件包。确保安装了正确版本的这些运行时库是至关重要的。

2025-09-14 17:18:41 3058 1

原创深度学习第二节（神经网络与模型训练过程）

训练神经网络主要通过两个关键步骤，即以给定的学习率进行前向传播和反向传播，最终神经网络架构得到最佳权重。需要注意的是第一次前向传播时，权重的值是随机初始化的。在反向传播中，通过在损失减少的方向上调整权重来减少损失值（误差），权重更新的幅度等于梯度乘以学习率。重复前向传播和反向传播的过程，知道获得尽可能小的损失，在训练结束时，神经网络已经将权重调整到近似最优值，以便获取期望的输出结果。

2025-09-13 17:32:39 787 1

原创深度学习第一节

pytorch是广泛应用于机器学习领域的强大开源框架，因其易用性和高效性备受青睐。其中 pytorch的核心数据类型是张量对象。pytorch提供了许多帮助构建神经网络的高级方法及组件，并提供了利用GPU更快的训练神经网络的张量对象。张量类似于Numpy中的多为矩阵ndarrays，标量可以表示为零维张量，向量可以表示为一维张量，二维矩阵可以表示为二维矩阵，多维矩阵可以表示为多维张量。

2025-09-12 18:00:24 554

原创 python连接mysql 和sqlserver

1. import pymssql as sql connect = sql. connect ('host', 'user', 'password', 'database', charset= 'cp936') SQL Server中涉及到中文的缺省字符集是CP936，所以将charset配置为CP936，就解决了中文乱码的问题。conn=pymysql.connect(host = '127.0.0.1' # 连接名称，默认127.0.0.1。conn.close()# 关闭数据库连接。

2023-04-29 21:37:35 664 1

原创 mysql安装

在data里打开.err文件，root@localhost后面为初始密码。初始化（ps：这里用powershell也是可以的），出现data。mysql -uroot -p：原始密码。net start mysql启动服务。设置path路径为bin路径。现在来分享一下我的安装历程。以管理员身份打开cmd。然后修改密码，详细见图。

2023-03-13 18:59:09 152 1

m0_60605453的博客