- 博客(56)
- 收藏
- 关注
原创 【文献25/04/01】From Show to Tell: A Survey on Deep Learning-Based Image Captioning
连接视觉与语言在生成智能中发挥着重要作用。因此,大量研究工作已投入到图像描述中,即用语法和语义上有意义的句子来描述图像。从2015年开始,这一任务通常通过由视觉编码器和语言模型组成的管道来解决,后者用于文本生成。在这几年中,这两个组件通过对物体区域、属性的利用、多模态连接的引入、全注意力方法以及类似BERT的早期融合策略发生了显著演变。然而,尽管取得了令人瞩目的成果,图像描述的研究仍未得出确凿的答案。本研究旨在提供图像描述方法的全面概述,从视觉编码和文本生成到训练策略、数据集和评估指标。
2025-04-01 11:23:14
847
原创 【文献25/03/29】UPFormer:用于田间葡萄叶病害分割的U形感知轻量级Transformer
在智能农业领域,分割模型实际上是及时检测和识别植物病害的标准。然而,复杂的背景和小型病害使得对葡萄叶病的分割具有挑战性。现有模型性能提升的趋势伴随着模型大小和计算成本的代价,这阻碍了在资源受限硬件上的部署。为此,我们提出了一种针对田间葡萄叶病的定制轻量级分割架构,称为U形感知Transformer(UPFormer),该架构在性能和效率之间实现了更好的权衡。具体而言,我们利用U形层次结构获取具有优越成本效率的小型词元。
2025-03-30 16:45:47
1005
原创 【文献25/03/28】一种基于深度学习的VIT植物病害自动分类方法
植物病害可能会减少每个农场上相当一部分的农业产品。本研究的主要目标是为农民提供视觉信息,使他们能够采取必要的预防措施。我们提出了一种基于视觉Transformer(ViT)的轻量级深度学习方法,用于实时自动化植物病害分类。除了ViT之外,还实施了经典的卷积神经网络(CNN)方法以及CNN与ViT的结合用于植物病害分类。这些模型已在多个数据集上进行了训练和评估。根据获得结果的比较,得出的结论是,尽管注意力模块提高了准确率,但却减缓了预测速度。将注意力模块与CNN模块结合可以弥补速度上的不足。
2025-03-28 11:06:30
979
原创 【文献25/03/27】Transfer learning for versatile plant disease recognition with limited data
深度学习在近年来通过观察植物疾病对应的图像,显著提高了对植物疾病的识别能力。为了获得良好的性能,当前的深度学习模型往往需要大规模的数据集。然而,收集数据集既昂贵又耗时。因此,有限的数据是获得所需识别准确率的主要挑战之一。尽管迁移学习被广泛讨论并验证为一种有效且高效的方法来缓解这一挑战,但大多数提出的方法集中于一个或两个特定的数据集。在本文中,我们提出了一种新颖的迁移学习策略,以在多个植物疾病数据集上实现高性能的通用植物疾病识别。我们的迁移学习策略与当前流行的方法有所不同,主要体现在以下几个方面。
2025-03-27 19:19:29
981
原创 【文献25/03/26】Hyperspectral Image Transformer Classification Networks
通过这两个模块,HiT能够增强局部空间-光谱信息的捕获能力,并减少在深层网络中可能出现的局部信息丢失。最后,经过全局平均池化层和全连接层的处理,完成类别预测。
2025-03-26 15:53:16
977
原创 【18】文本与注意力
Seq2Seq模型能够用于很多任务,比如机器翻译,编码器对应的是源语言的文本序列,解码器对应的是目标语言的文本序列和文本归纳;也可用于文本摘要,编码器对应的是段落的文本序列解码器对应的是文本摘要。但是由于RNN的特性,对于很长的序列,RNN(包括LSTM和GRU,它们只是在设计上尽量减少遗忘的发生都不可避免地出现遗忘的状况。这个缺点可以使用引入注意力机制J(Attention Mechanism) 来解决。有了自注意力机制之后,就可以使用自注意力机制执行Seq2Seq任务。
2025-03-19 13:55:48
876
原创 【17-1】LSTM网络
Long Short Term 网络(LSTM)是一种 RNN 特殊的类型可以学习长期依赖信息在很多问题,LSTM 都取得相当巨大的成功,并得到了广泛的使用,它是RNN事实上的标准。LSTM的窍门在于拥有一个固定权值为1的自连接,以及一个线性激活函数,因此其局部偏导为1。这样的话,误差就能在时间步中传递,而不会消失或爆炸.LSTM通过门对通过的信息进行控制:门是一种让信息选择式通过的方法。LSTM通过门可以让信息不通过完全通过、通过一部份。
2025-03-14 16:16:33
371
原创 【17】RNN循环神经网络基础
RNN的主要用来处理序列数据。在传统的神经网络模型中,是从输入层到隐含层再到输出层层与层之间是全连接的,每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如,你要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独立的。RNN之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中。
2025-03-14 15:18:13
341
原创 【16】简单文本分类【词嵌入、文本向量化、文本分类模型】
我们将使用EmbeddingBag层对文本做词嵌入聚合这个层会对每一条评论中的文本单词做embeding词嵌入,并使用默认模式“mean”计算embeding的平均值,最后输出一个聚合结果。当我们输入一个文本序列词表到EmbedingBag层时,这个层会将序列中每一个单词作词嵌入表示,并将结果根据指定的聚和计算方法计算后作为最后的输出。我们只需将每一个批次的文本整合为一条长的文本序列,并记录其中每一条评论的偏移值。【文本分类模型,不需要创建同样长度的批次,将一个批次的文本,创建到一个序列中。
2025-03-13 17:02:34
1131
原创 使用LiveShare时,队友的浏览器一直转圈
你需要将 Vite 服务器绑定到所有网络接口,才能让其他设备通过网络访问。你可以启动 Vite 开发服务器时加上。,可能是因为 Vite 默认只在本地机器上绑定服务器,而没有开放给外部网络访问。队友正常加入,网址也进行了分享。但是队友那边的浏览器一直在转圈加载。如下:是我前端终端运行结果。连接到你的会话中,无法访问。
2024-11-30 16:31:37
331
原创 针对解决conda环境BUG的个人笔记
我的问题:1、torch.cuda.is_avaliable()在命令行里是true,但是pycharm是false2、pycharm选择pytorch所在的解释器,加载失败。3、pytorch所在的解释器加载成功,但是里边的torch包莫名消失。
2024-11-29 09:46:48
1410
原创 关于使用天地图、leaflet、ENVI、Vue工具实现 前端地图上覆盖上处理的农业地块图层任务
遥感处理文件夹下生成out_geotiff文件夹、前端的public下也生成out_geotiff文件夹。配置环境(其中 osgeo比较麻烦,单独给出),修改文件路径,运行脚本。运行(npm run serve),看到前端页面。配置基本信息(如:ip、port、账号、密码)。配置环境,安装必要依赖(不是conda环境)。配置读取路径(个人问题),点击运行脚本。1.api:定义接口,启动数据库服务。保存,连接(如下图:连接成功)。点击运行,创建表,提示连接成功。首先配置连接信息(如)。
2024-11-27 21:54:51
634
原创 根据实验试要求,打通隧道连接服务器上的数据库,前端进行数据调用。
数据库布置在了工大实验试K80服务器上,本地属于外网无法直接访问校园内网。需要打通隧道,通过堡垒机进行服务器的访问。获取到数据库数据进行前端展示。
2024-11-22 19:49:38
395
原创 针对解决前后端BUG的个人笔记
将https://start.spring.io/或者http://start.springboot.io/替换为 https://start.aliyun.com/更改执行策略会影响系统安全性,因此推荐仅在信任的环境中使用,且尽量选择 RemoteSigned 而非 Unrestricted 策略。原文链接:https://blog.youkuaiyun.com/qq_44231797/article/details/134630733。此命令仅对当前 PowerShell 会话有效,关闭后会恢复为原有策略。
2024-11-04 11:22:41
348
原创 针对实验试服务器的使用问题【安装anaconda+Vscode连接+jupyther远程连接】
打开Xshell软件,创建新的连接。根据①输入连接IP、端口。根据②输入连接的用户名、密码。然后点击“连接”。进入如下界面。
2024-09-04 08:37:29
443
原创 01- 收入数据集【Pytorch入门实战】
输入数据处理创建一个合适模型训练预测、评价--->机器学习:抽象出一条直线,来拟合现有的数据。【映射函数,输入映射输出】
2024-07-14 16:13:44
934
原创 Xshll连接服务器【过程记录】
开学老师提供了一款服务器,可以网页端打开,但是不可进行上传文件、复制黏贴指令。希望连接Xshll进行更有效的学习活动!
2024-07-05 15:14:30
498
1
原创 关于Wav2Lip配置&实现
Wav2Lip是一种先进的深度学习模型,旨在将音频波形直接转换为面部动画,尤其关注于唇部动作的生成与同步。这一技术的核心在于其能够利用输入的语音信号,生成与之高度匹配的嘴唇动作,从而实现逼真的语音驱动数字人物动画效果。Wav2Lip的开发不仅标志着在语音驱动的面部动画领域的一个重要进展,也为虚拟现实、游戏制作、智能语音助手等多个应用领域提供了新的技术手段。Wav2Lip模型基于生成对抗网络(GAN)设计,包含生成器和判别器两个主要部分。
2024-07-04 15:15:24
2680
3
原创 torch.cuda.is_avaliable()在命令行里是true,pycharm是false【省流:换Pycharm版本】
torch.cuda.is_avaliable()在命令行里是true,但是pycharm是false。换成了2021版,加载解释器便顺利了,torch.cuda.is_avaliable()结果True。3、pytorch所在的解释器加载成功,但是里边的torch包莫名消失。在调试了很多torch版本、python版本、cuda版本后,无计可施,开始用的2024版,命令行里是true,但是pycharm是false。2、pycharm选择pytorch所在的解释器,加载失败。
2024-04-25 18:25:49
731
1
原创 单片机05__串口USART通信__按键控制向上位机传输字符串
计算机与外界进行信息交换的过程称之为通信。在通信的过程中,通信双方都需要遵守的规则称之为通信协议。硬件协议:将数据以什么样的方式传输过去软件协议:将数据以什么样的顺序传输过去。
2024-02-25 19:06:02
2156
原创 单片机04__基本定时器__毫秒微秒延时
STM32F40X芯片一共包含14个定时器,这14个定时器分为3大类:通用定时器10个TIM9-TIM1和TIM2-TIM5具有基本定时器功能,还具有输入捕获,输出比较功能高级定时器2个。
2024-02-23 00:16:56
1717
2
原创 单片机_no target connected问题解决方法
④若以上为能解决问题,然后按住复位键,点击下图图标,然后快速松开复位键。此问题是在烧录呼吸灯程序时产生,可能因定时器配置错误导致。②长按复位键,执行以下步骤。③断开MCU电源,然后重新烧录程序即可。⑤按下图步骤恢复窗口设置,即可烧录程序。①确定通电后指示灯正常点亮。“SW-DP”(如下图)
2024-02-22 11:44:00
2156
原创 单片机03--按键--寄存器版
③设静态变量flag作为标志位,防止已有按键按下时,其他按键按下仍能进行操作。KEY1不导通时,PA0输入为低电平,KEY1导通时,PA0输入为高电平。//PB4低电平点亮。//PB5低电平点亮。获取PA0口的状态需要(GPIOA->IDR & 1<<0)。KEY1---PA0--->输入---->浮空输入/下拉输入。②if两次读取GIPA->IDR的第0位,实现消抖。②设置GPIO端口模式---->输入模式。
2024-02-21 23:07:37
712
原创 单片机02_寄存器_GPIO设置__点灯
如果想输出高电平,则需要配置为具有上拉功能的开漏输出(芯片内部的上拉电阻属于弱上拉,如果需要或者较强的驱动能力,则需要外接一个上拉电阻(硬件工程师设置))。寄存器作用:对AHB1系统总线上的片内外设模块进行时钟使能,在对应的位上写‘1’,则使能相对应的外设模块时钟。复用功能指的是GPIO端口的第二功能(除了默认的输入输出功能以外),也就是片内外设(芯片以内内核以外)模块功能管脚的专用功能。2.找出中文参考手册第六章系统总线对应的时钟使能寄存器,并且在相应的位上写‘1’使能外设模块时钟。
2024-02-20 20:09:14
1491
原创 单片机01天_stm32f407zg_创建新工程
④内核接口组:点击“ADD File”按钮,把存放在“Cortex系列内核接口驱动文件CMSIS”的文件夹下的“startup_stm32f40_41xxx.s(启动文件)”和“system_stm32f4xx.c(系统时钟文件)”添加到“内核接口组”中。①把固件库中“Libraries”文件夹下的“CMSIS”文件夹中的“Include”(Cortex系列内核接口驱动文件对应的头文件)文件夹复制到工程,存放到CMSIS文件夹下。“USER”文件夹内包含“Inc”&&“Src”。
2024-02-19 20:02:15
1126
原创 单片机01天---stm32基本信息了解
①工作电压:1.8V – 3.6V,VSS/GND(电源负极0)、VDD/VCC/V3.3(电源正极1),VREF(参考电压):内部高速时钟/内部低速时钟),但是精度不是很高,在需要测量比较精准的场合中,需要外加一个。晶振的大小范围:4 – 26 M(常用的大小为8M或25M).,搜索芯片型号,下载“数据手册”使用。:处于低电平,持续20μs(微秒)以STM32F407ZG为例。一般位于下图后面的位置。②STM32:芯片内部。(外部震荡电路),也叫。
2024-02-19 19:38:26
662
原创 C语言笔记简单版——【第12天】
xx.c(编译预处理) -> xx.i(编译) -> xx.s(汇编) -> xx.o(链接) -> xx.out。如果没有break,以后的case不再判断,直接执行后面的程序语句,直到遇到break停止or整个执行完毕。有结构体构成,所包含的结构体个数有任意个,但链表在内存中是不连续的(区别于结构体数组,真正释放空间)。过程:根据1且按照2的规则,判断满足就执行循环语句,循环体执行完后,根据3对循环变量进行操作。struct student ----stu ---- 结构体类型名。
2024-01-30 16:45:10
484
原创 【链表】————第九天
LinkList 为 LNode 类型的指针包含#include malloc函数:动态申请的空间,函数返回值均为void *类型,函数返回值: 成功:返回开辟好的空间首地址。失败:返回NULLfree函数:free函数释放,然后释放后得空间记得指向为空,否则会出现野指针。*/
2024-01-24 19:32:08
365
原创 结构体(2)【C语言】
结构体数组本质上是一个数组,数组中元素的类型是结构体类型。使用“结构体关键字 结构体类型 数组名[数组长度]”的格式来定义一个结构体数组。*/
2024-01-24 19:21:53
988
原创 指针练习题目
输入数组A中5个数值:1 2 3 4 5输入数组B中5个数值:2 3 4 5 6合并的BUFF为:3 5 7 9 11*//*编译结果:输入a,b的值:1 2a=2,b=1*//*总结:fun0方法只是改变了形参a,b的指向。没有改变a,b的值*/
2024-01-24 19:00:23
481
原创 【指针数组】【数组指针】【指针函数】【函数指针】——第八天
例如,int (*p)(int, int)定义了一个指向返回类型为int,参数列表为两个int的函数的指针变量p。例如,int result = (*p)(a, b)通过函数指针变量p调用函数,传递参数a和b,并将返回值赋给result变量。q为p的地址(&p),*q为p指向的地址(&a),**q为p指向地址的内容(a)(2)指针所指向的数据类型,决定了指针值(指针指向对象地址里的数值)的数据类型。p为a的地址(&a),&p为p的地址,*p为a地址保存的内容(a)q保存的内容为地址的内容:**q=10。
2024-01-24 16:03:10
485
原创 /*C语言字符串长度——sizeof与strlen——转译字符*/
/sizeof计算类型所占字节大小,转译字符'\n'算一个字符且计算'\0'。strlen计算字符串的有效长度,转译字符'\n'算一个字符且不计算'\0'。
2024-01-22 21:52:40
426
原创 /*输出参数【C语言指针】*/
buff为地址,形参改变,实参改变。p为buff的地址,head为buff的地址,dest为buff的地址。//输出参数——dest。
2024-01-22 21:51:12
499
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人