师范大学生-优快云博客

原创 anaconda笔记

‌（也称为 "root" 环境）。这是 Anaconda 的默认行为，主要有以下特点：‌‌：打开终端时命令行开头会显示‌‌：此时安装的任何包都会进入 base 环境通常我们不希望在base环境下开发，所以需要切换到某个开发环境下。

2025-06-22 16:02:55 214

原创基于CNN的FashionMNIST数据集识别6——DenseNet模型

需要注意的是，当批次数量太小时，使用bn层可能表现不稳定。当batch<16时，建议使用GroupNorm方法做替代。batchnorm2d是PyTorch中用于2D输入的批归一化(Batch Normalization)层。在DenseNet中，每个层都与其后续的所有层直接连接。通常只需要设置输入通道数即可。

2025-06-18 00:01:43 492

在这篇文章里我们实现了一套通用的图像分类技术方案。通常，我们的算法是部署在服务端的，服务端接受到客户端传来的数据，将该数据传入算法模型内，算法模型推理后，计算出结果再回传给服务端。因此在该工程的features/flask分支上，本人开发了一套基于python flask的服务端模型部署demo。可以帮助开发人员熟悉ai算法模型接入服务端的实现细节。相关工程目录如图所示，flask_client.py是模拟客户端的代码，flask_server.py是模拟服务端的代码。

2025-06-09 01:02:43 841

原创基于cnn的通用图像分类项目

项目上需要做一个图像分类的工程。本人希望这么一个工程可以帮助学习ai的新同学快速把代码跑起来，快速将自己的数据集投入到实战中！

2025-06-04 23:55:36 746 1

原创 OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.

2.envs/环境名称/Library/bin里，会发现有个libiomp5md.dll将其删除或者改名都可以。这里我为了留着该文件，就只改了名。注意红框里面的pytorch是我的环境名称。解决这个问题的关键，就是把当前环境内的libiomp5md.dll删除或者重命名。是在plt相关代码的调用中出现的，修改好之后再运行一下代码，不会再报这个错误了。1.先去anaconda目录下找到自己当前的环境。

2025-05-20 22:51:45 706 2

原创 Informer源码解析5——概率采样注意力机制解读

在Transformer模型中，自注意力机制的时间复杂度为O(L²)，这成为处理长序列时的瓶颈。ProbAttention是一种通过概率采样降低计算复杂度的创新方法，被应用于Informer等高效Transformer变体中。ProbAttention的核心思想是：大部分的查询q对最终结果的贡献很有限，等于是在摸鱼，所以不需要计算所有的q，取最重要的q参与计算即可。

2025-05-08 00:36:27 483

原创 Informer源码解析4——完整注意力机制解读

可以看到，三个张量的前三个值代表的含义是相同的，分别是批次数量，序列长度，注意力头数。queries (Tensor): 查询张量，形状为 [Batch, Length, Heads, d_k]。values (Tensor): 值张量，形状为 [Batch, Length, Heads, d_v]。可以看到，方法里的传参 blhe,bshe是指传入张量的各个维度，bhls是指输出张量的各个维度。A的形状是 [B, H, L, S]，和score的形状相同。首先看一下Q,K,V三个张量的形状。

2025-05-07 00:05:36 909

原创 Informer源码解析3——编码器与解码器解读

BatchNorm在同一特征维度上跨样本计算均值和方差（如处理一个batch中所有句子的第一个词），实际上在NLP任务中，‌长序列不同位置语义差异大（如句首和句尾词），跨样本统计无意义。BatchNorm在小batch size下统计量估计不准确（如GPU内存限制导致batch size较小），而LayerNorm无需跨样本统计，对batch size不敏感‌。由上面的表可以知道，直接使用python列表的话，子模块的参数不会被自动注册，导致训练时这些参数不会被更新。所以使用ModuleList是必要的。

2025-04-27 00:22:53 709

原创 Informer源码解析2——数据处理

数据是informer代码里自带的数据集。可以看到第一列是时间，以日期和小时为单位；后面的几列都是数据。我们要根据所有数据去预测最后一列的值，即WetBulbCelsius。

2025-04-24 00:50:19 1215

原创 Informer源码解析1——参数分析

知识蒸馏的方法，一般是先训练一个性能较好的教师模型（大模型），然后使用这个大模型的输出作为软标签，用数据的真实标签作为硬标签，两者联合起来去训练学生模型（小模型）。通过这种方法，可以把模型压缩到一个非常小的规模，而训练得到的小模型能够具有与复杂模型近似的性能效果，但是复杂度和计算量却要小很多。这里96是指训练时输入序列的长度，48是解码器从编码器中获取的序列长度（编码器做了下采样，所以序列变短了），24是最终预测出的新序列长度。如果--attn设置为full，那显然--factor就失效了。

2025-04-22 00:38:36 664

原创基于LSTM的文本分类3——模型训练

之前已经完成了模型搭建和文本数据处理，现在做一下模型训练。

2025-04-13 23:23:39 655

原创基于LSTM的文本分类2——文本数据处理

由于计算机无法认识到文字内容，因此在训练模型时需要将文字映射到计算机能够识别的编码内容。这篇文章的目的就是搞懂上面的代码如何实现，即如何构建文字数据集和迭代器。

2025-04-05 22:37:13 943 1

原创基于LSTM的文本分类1——模型搭建

经过embedding映射后可以看到，张量out里的数据变成128*32*300的维度，300的维度就是词向量维度，可以看到data里的数据都由原来的整数映射成了向量。由于我们的数据量较小，所以使用较低的词向量维度。另外，如果使用预训练模型，词向量维度的值需要和预训练模型的值相同。全连接的输入通道数是隐藏层维度的两倍，原因是我们的模型是双向的，双向的结果都需要输出给全连接层。前面的汉字部分是模型学习的文本，后面接一个tab键是对该文本的分类。配置的重点是模型的超参数，这里分析一下模型涉及的超参数。

2025-04-01 00:35:25 1186

原创 pytorch中dataloader自定义数据集

from PIL import Image # 从PIL库导入Image类"""花朵分类任务数据集类，继承自torch的Dataset类""""""初始化数据集实例Args:root_dir (str): 数据集根目录路径ann_file (str): 标注文件路径transform (callable, optional): 数据预处理变换函数"""# 加载图片路径与标签的映射字典 {文件名: 标签}# 构建完整图片路径列表 [root_dir/文件名1, ...]

2025-03-29 23:51:45 768

原创基于CNN的FashionMNIST数据集识别6——ResNet模型

在反向传播过程中，梯度通过链式法则逐层传递。对于包含 L 层的网络，第 l 层的梯度计算为：其中 a(k) 表示第 k层的激活值。当多个雅可比矩阵 ∂a(k+1)/∂a(k) 的乘积中出现大量小于1的特征值时（例如使用Sigmoid激活函数），梯度会指数级衰减（‌‌）；反之若特征值大于1，则梯度爆炸式增长（‌‌）。实验证明，VGG-19的训练损失曲线在后期趋于平缓，参数更新停滞。网络退化问题通常是过深的网络的表达力下降导致的，原始像素信息需经过所有层的非线性变换，关键特征可能在传递过程中被破坏。

2025-03-23 01:04:19 1132

原创基于CNN的FashionMNIST数据集识别5——GoogleNet模型

从整个链路上看，googlenet的复杂度相比于之前我们提到的cnn网络更复杂。仔细分析可以看到，googlenet的网络结构里面有多个核心模块inception。搞懂inception就基本搞清楚了googlenet。

2025-03-20 01:05:59 850

原创基于CNN的FashionMNIST数据集识别4——VGG-16模型

VGG-16 是牛津大学 ‌‌ 在 2014 年提出的经典卷积神经网络模型，发表于论文《Very Deep Convolutional Networks for Large-Scale Image Recognition》。它在 ImageNet 图像分类任务中取得了突破性成绩，核心贡献是证明了 ‌‌ 对模型性能的重要性（当然太深了也不好）。

2025-03-13 00:23:40 502

原创基于CNN的FashionMNIST数据集识别3——模型验证

和之前训练模型时的验证逻辑基本相同。只进行前向传播，将预测正确的样本个数进行累加。当模型训练完毕后，我们得到的是一组最优的参数配置。在代码运行时，需要将参数载入到模型里，再进行验证。最后要做的就是验证这组参数的表现。

2025-02-24 00:05:42 328

原创基于CNN的FashionMNIST数据集识别2——模型训练

从代码里可以看出，模型训练代码主要可以分为：数据加载，模型训练，可视化展示。

2025-02-23 14:49:15 769

原创基于CNN的FashionMNIST数据集识别1——模型搭建与数据准备

我们这次使用LeNet模型，LeNet是一个经典的卷积神经网络（Convolutional Neural Network, CNN）架构，最初由Yann LeCun等人在1998年提出，用于手写数字识别任务创建一个文件model.py。实现以下代码。

2025-02-16 22:35:37 989 5

原创 Fragment学习笔记

静态加载直接注册在布局的xml文件里。需要注意，要指定frament的类型<android:name>和id<android:id>。

2024-08-18 23:23:34 745

原创 Service入门笔记

Service 是 Android 系统中的一种组件，用于在后台执行长时间运行的操作或处理异步任务。Service 可以在不依赖于用户界面的情况下运行，并且可以在应用程序被关闭后继续运行。

2024-08-11 11:25:43 456

原创 android轮播图入门2——触摸停止与指示器

监听轮播图切换轮播视图事件，每次组件切换都遍历一次圆点，将对应当前数据位置的圆点改成选中态。触摸停播的设计思路是：监听实现轮播图的触摸事件，如果用户正在触摸就停止自动轮播。轮播图初始化时，创建数据个数相等的小圆点，默认为未选中状态。

2024-07-06 19:21:24 472

原创 android轮播图入门1——简单无限自动轮播图

自动定时轮播可以通过Handler的延时方式实现，首先要明确，在用户不可见的情况要停止自动轮播，因此要在上屏/移出屏幕时做处理。另外还有一个问题，就是我们希望轮播图一开始可以往左滑动，而不是只能向右滑动，这样可以给用户一种无限循环的感觉。改写getCount方法，返回的数值就是轮播图的组件数量，我们设置为int的最大值，视作无限多。因此在视图初始化时，应该手动给轮播图当前的组件设定一个足够大的值，使得用户可以不断地向左滑。需要注意，设定的值需要是数据数组长度的倍数，这样才能定位到第一个轮播组件。

2024-06-29 20:38:26 778

原创 Installed Build Tools revision xxx is corrupted. Remove and install again 解决

1.在buildTools文件下找到对应的sdk版本，首先将版本对应目录下的d8.bat改名为dx.bat。2.在lib文件下将d8.jar改名为dx.jar。3.重新编译工程即可。

2024-06-29 18:28:19 2705 2

原创 LORA学习笔记3——训练参数

模型训练时ai模型会根据标注生成一个图片，并与学习图片进行对比，通过对比的结果调整嵌入向量。这样的一个流程就被称为“一步”。如果一个训练集中有50张图片，每张图片设定为要训练10次，所以训练完这一组数据集需要50*10=500步。:一个训练集里面的全部图片按照规定的训练次数训练完一次，被称之为训练完“一轮”。参考刚才的例子，500步就是该训练集的一轮所需要的步数。通常我们使用这个概念来控制训练一个模型的总步数。模型训练的总步数=

2024-05-26 20:08:32 3266

原创 FileProvider与apk下载

我们这次把某个apk放在storage下的一个目录下，用一个FileProvider生成uri后，启动一个活动去安装。首先用apk所在的path生成一个uri。这里需要注意，external_path是storage/emulated/0这个目录，这个目录直接写入文件似乎是不可以的（创建文件夹可以），因此我们把apk存放在storage/emulated/0的子目录下，确保不发生权限问题。我们这里自定义了一个FileProvider，单纯继承自安卓提供的基类。

2024-05-26 17:55:51 10494

原创 LORA学习笔记2——训练集处理

对于ai训练来说，处理训练集是模型训练的重要环节。训练集的质量对最终模型的质量影响巨大。这里以二次元角色为例，记录下训练集处理的流程和一些心得。

2024-05-12 22:35:58 2509

原创 Lora训练笔记1——快速上手

AKI大佬的整合包，一键解压即可。提取码：p8uy。

2024-05-05 22:34:09 859

原创 Broadcast入门1

从示例中可以看出，如果仅实现动态注册——监听广播，需要实现的部分如下：1.实现一个receiver，继承自BroadcastReceiver。重写onReceive方法，在里面实现监听到具体广播后的逻辑。2.实例化并注册该receiver，在注册时通过在intentFilter里设置action来指定监听的广播类型。3.在销毁活动时取消注册。否则会导致内存泄漏。该示例展示的是动态注册方法。安卓系统的一些系统级别的广播是要求动态注册的。但是也可以发现动态注册存在的一个问题，就是在程序启动之后才会生效。

2024-04-21 20:36:08 335 1

gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz

qt-everywhere-src-5.14.1.tar.xz

CoinProject.zip

空空如也