- 博客(21)
- 收藏
- 关注
原创 网易云下载免费歌曲
4.点击播放歌曲,当出现下图所示的图标时,点击图标即可下载,若没有,则‘CTRL+R’刷新即可。2. 搜索将要下载的歌曲,再按‘F12’,打开‘开发工具’3. 找到‘媒体’图标,若没有,则点击‘➕’展开寻找。1. 登录网易云网页端,
2025-02-28 17:16:02
219
原创 FLops计算最全详解-理论分析
本文主要介绍深度学习模型的FLOPs计算和Pytorch中常见层的FLOPs计算。在此之前,我们先来理清一些容易混淆的概念。FLOPS 表示单位时间内的浮点运算次数,是衡量计算机系统或计算设备处理能力的一种指标。而浮点运算次数指的是乘法、除法、加法、减法等的次数。FLOPs 指的是模型中的浮点运算操作总数,也常称为计算量。主要用于衡量模型的计算复杂度。通常是衡量模型在一次前向传播过程中需要执行多少次浮点运算的总量。
2025-02-28 16:51:47
723
转载 量化技术详解
量化公式中的r表示原来的浮点值,Q表示量化后的整型数据,s表示缩放因子,是量化相关的参数。网络中值的分布往往是不均匀的,更多的是类似高斯分布的形式。非对称量化表示的范围没有严格的限制,可以根据浮点值的范围,选取任意的想要表示的范围。网络中的值往往不是均匀分布的,大部分是中间多两边少的“钟”型分布,此外还可能存在一些离群点,如果量化要表示所有的浮点值,反而可能会降低量化的精度。:对称量化中浮点值的零点直接映射到量化值的零点,因此不需要其他参数来调整零点的映射的位置,与量化相关的参数只有缩放因子s。
2024-10-08 18:01:11
945
原创 分辨率转换---将梅尔谱转变为适合图像神经网络的输入形状的方法
梅尔谱(Mel-spectrogram)是音频信号处理中的一种常用特征表示,特别是在语音识别和音乐处理领域。它在传统的声谱图(spectrogram)基础上进行了改进,更加符合人类的听觉感知特点。形状为(1, F, T),其中1表示单通道。F表示梅尔频率通道的数量。梅尔通道的数量取决于梅尔滤波器的个数,常见的有 40 或 128 个梅尔滤波器。T表示音频信号中帧的数量。帧的数量取决于音频信号的持续时间、帧长和帧移(frame shift)设置。详情可查看该篇博客。
2024-10-07 10:53:16
739
原创 【轻量化网络模型---CNN+Transformer类】Mobilevitv1论文解析
就轻量化网络模型来说,指标不再仅仅是准确率了,还要考虑到其他的指标(比如参数量、计算量、推理速度等等),因此在之后的学习中,我们要特别关注这些指标。论文题目:MOBILEVIT: LIGHT-WEIGHT, GENERAL-PURPOSE, AND MOBILE-FRIENDLY VISION TRANSFORMER(Mobilevit:轻量级,通用,和移动友好的视觉transformer)论文作者:Sachin Mehta(Apple), Mohammad Rastegari(Apple)
2024-07-09 19:00:55
711
原创 如何使用screen命令,创建多个python进程
2.6. 此时可以分离(detach)当前的screen会话,即从当前终端会话中断开连接,同时继续在后台运行。2.4. 若不能连接到会话(状态为Attached),需要先断开连接,在连接。一段时间后,若想查看脚本运行进度,重新连接model(进程好同理)会话即可(见2.3)2.3 连接到会话(状态为Detached才能连接)2. 创建单个进程(以进程名model为例,可用进程号代替)平台:Ubuntu,VScode,CPU。,创建1个新的窗口,然后重复2的步骤即可。创建新的screen会话,并命名。
2024-06-24 11:37:03
468
原创 效率化模型的发展和总结
轻量化网络模型:指在保持模型性能的同时,尽可能减小模型的尺寸和计算量的网络模型。这种类型的模型设计旨在在移动设备、嵌入式设备或计算资源有限的环境中实现高效的推理。构建轻量化网络模型可以进行如下分类:压缩已经训练好的模型:知识蒸馏、权值量化、剪枝(权重剪枝,通道剪枝)、注意力迁移。
2024-06-19 15:44:01
593
原创 卷积神经网络中,为什么加了BN层就不用加bias了呢
分子和分母中的bias完全不起作用,再加上BN本身有beta存在,完全不需要卷积的bias了。因为不起作用,而且设为True之后占显卡内存。x-mean 变成 (x+bias) - (mean + bias), 那就等于没加一样。这里面的Xi-X 和 分子 x-mean是同样的道理依然会导致bias相互抵消吊。
2024-05-27 16:22:43
266
原创 效率化模型的发展和总结
EfficientNet:2019年,EfficientNet提出了一种基于复合缩放(compound scaling)的方法,通过在网络深度、宽度和分辨率上进行均衡的缩放,实现了在有限的计算资源下取得更好的性能。AlexNet和VGG:在2012年,AlexNet的出现标志着深度学习的新时代,但它的大规模卷积层结构导致了大量的参数和计算量。这为后续轻量化网络模型的设计提供了启示。总的来说,轻量化网络模型的发展历程是一个不断追求在保持性能的同时减少参数数量和计算量的过程,以适应移动设备和嵌入式系统的需求。
2024-05-25 17:55:51
666
原创 用python实现音频格式转换(wav-mp3)
MP3(MPEG Audio Layer-3):MP3 是一种有损音频文件格式,它使用压缩算法来减小文件大小,同时保持较高的音质。WAV(Waveform Audio File Format):WAV 是一种无损音频文件格式,通常用于存储未经压缩的音频数据。
2024-05-05 18:41:17
1656
原创 使用Pytorch框架,训练ESC-50数据集
本文主要介绍在Pytorch框架下,利用K折交叉验证来训练ESC-50数据集,并保存最优模型。由于只有2000个样本音频,样本数量较少,故把训练集划分为训练集、测试集,且采用5折交叉验证法,同时加深网络层数。使得最终的准确率达到要求
2024-01-26 22:25:24
925
1
原创 基于Pytorch框架的CIFAR-10图像分类任务(附带完整代码)
本文主要实现在pytorch框架下,训练CIFAR数据集,通过观察训练和验证的误差、准确率图像来进一步改善。测试集打印整体准确率和每一类别的准确率,并生成混淆矩阵,将其中每一个错误的图片并保存下来。CIFAR-10数据集、Dataset和Dataloader、SummaryWriter画图、网络模型搭建、混淆矩阵、统计所有错误类别、Adam优化器。
2024-01-25 13:45:02
1050
原创 利用librosa,torchaudio分别实现梅尔语谱图(Mel spectrogram )音频特征提取的详细过程
用不同的方式实现音频到梅尔谱的转变,如torchaudio,librosa,直接调用和分步实现,把音频的特征值提取出来,可用于音频分类。
2024-01-23 11:33:18
6163
2
原创 蓝桥杯CT107D单片机24C02外设、PCF8591外设
一个A/D转换的周期的开始,总是在发送有效的读设备地址给PCF8591之后,A/D转换在应答时钟脉冲的后沿被触发。PCF8591的A/D转换程序设计流程,电位器Rb2接到AIN3,通道3;控制寄存器应写入:0x03。光敏传感器接到AIN1,通道1;控制寄存器应写入:0x01。1--发送写设备地址,选择IIC总线上的PCF8591器件。3--发送读设备地址,选择IIC总线上的PCF8591器件。2--发送控制字节,选择模拟量输入模式和通道。4--读取PCF8591中目标通道的数据。
2022-04-13 21:08:00
107
转载 蓝桥杯单片机总结
//DS18B20温度采样与结果处理参考代码void Read_Temperature(){ unsigned char LSB,MSB ; Init_DS18B20(); //DS18B20复位 Write_DS18B20(0xCC); //跳过ROM操作指令 Write_DS18B20(0x44); //开始温度转换 Delay(1000); //延时700ms左右,等待温度转换完成 Init_DS18.
2022-04-13 21:04:19
82
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人