自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(64)
  • 收藏
  • 关注

原创 二维傅里叶变换理解

一维的傅里叶变换,将一个函数用多个正弦波进行表示。是一个一维的函数,他的图像是一条曲线,将其分解为多个正弦波叠加,学过傅里叶变换的基本上都懂是什么意思。如果把一维函数换成.这个函数就是一个曲面,对他进行傅里叶变换,不就相当于将其分解成多个正弦曲面的叠加。图片转换为的样子就是一个曲面,第一张图是俯视图,从上往下看,就是我们平时看到图片的样子,其他几张是不同角度的图片。程序如下:可以跑一跑,感受感受一张图片转换为f(x,y)的样子。

2025-01-11 16:47:01 266

原创 【无标题】多模态对齐

第一章 绪论1.1 研究背景和意义在现实生活中,人类往往是以事件为单位来认识和理解世界的,一个事件包 含了时间、地点、参与者等多个静态因素。将这些事件信息从非结构化数据中提 取出来,已逐渐成为信息抽取领域的关键任务之一。事件通常并非孤立存在,而 是彼此关联,它们之间可能存在时序、因果、条件等语义关系。事件关系识别便 是从非结构化数据中识别出事件之间的这种语义联系。因此,深入理解事件间的 相互关系,掌握事件发展的规律与逻辑,对后续突发事件的生态周期研究以及基 于事件的应用具有重要的研究价值。 近年来,在自然语

2024-11-29 18:21:43 683

原创 YOLO配合 PYQT做自定义虚拟电子围-自定义绘制多边形虚拟电子围栏

YOLO可以识别检测物体,这是众所周知的。使用YOLO来做目标检测,并获取坐标信息。

2024-09-08 17:46:57 976

原创 YOLO与PyQt5结合-增加论文工作量-实现一个目标检测的UI界面

1、在窗口打开视频或图片进行目标检测,具有中断检测功能:比如检测视频的时候突然打开图片检测,后台就会停止检测,而不是一直执行视频检测。2、可以输出目标类别,目标中心点,置信度等,此部分为动态生成,每一帧图片开始之前会清空。保存为ui文件,然后将其转换为py文件。打开Qt Designer。

2024-08-27 19:44:52 1176

原创 计算机类-本科毕业设计快速通关攻略-(选题-创新点-论文框架-论文绘图)

目标检测是每年深度学习毕业设计的主流,如Faster R-CNN、YOLO、SSD等算法的改进,以提高检测精度、速度或鲁棒性。目前比较火的YOLO,也比较建议用YOLO,简单易上手,一个周之内基本上就会学会写配置文件以及各种改进。

2024-08-26 11:11:43 1478

原创 pytorch 报错 Error loading\Lib\site-packages\torch\lib\fbgemm.dll

pytorch 报错 Error loading\\Lib\\site-packages\\torch\\lib\\fbgemm.dll,去下载一个dll文件解压后放到system32中即可。

2024-08-12 13:28:03 492

原创 基元检测-霍夫直线变换原理

假设我们有这样一个分布的数据:我们想用一条直线拟合数据,它的表达式为Y=kX+B关于最小二乘和梯度下降还不知道的可以去看以往的文章,这里就直接介绍霍夫变换了。

2024-08-07 20:55:24 788

原创 U2net论文复现-简单解读-以及奇奇怪怪的改进-测试roc以及pr

尽管我们的模型与其他最先进的方法相比取得了优越的结果,但在不久的将来,计算和内存有限的设备(例如手机、机器人等)需要更快和更小的模型,我们将探索不同的技术和架构以进一步提高速度并降低模型大小。此外,需要更大的多样化显着对象数据集来训练更准确和更稳健的模型。

2024-08-04 17:07:14 1278 2

原创 MATLAB多元函数梯度下降法找最小值-梯度演示-绘制梯度方向

如果在所有可能的参数值上都是的,则该函数是凸的;函数将呈现为光滑的碗状,使得训练过程相对简单。。沿着梯度方向,函数变化最快。x,y点的更新:x和y每次更新一点点,z根据公式可以计算出一个新的坐标点,但新的z不一定落在f(x,y)上,除非x,y的变化非常非常小。为了演示梯度的方向,我们将变化调大一些。

2024-07-29 19:55:21 670

原创 工程计算与分析课程报告-Matlab

而所有的初值条件为零,即 x(0)=dx(0)/dt=0, 应用MATLAB计算系统的动态响应x(t)=?(计算时间域为[0 5]秒)。时, 改变不同弹簧弹性系数k、阻尼系数c的值(见下述条件),计算系统的稳态响应x(t)=?并绘制图形,分析结果。(计算时间域为[0 5]秒)。时, 计算系统的稳态响应x(t)=?(计算时间域为[0 5]秒)。时, 计算系统的稳态响应x(t)=?(计算时间域为[0 5]秒)。为施加在重物上的外激励力量。即:F(t)=20 N。即:F(t)=20 N。坐标如上图所示,取其。

2024-07-29 16:02:05 484

原创 YOLOV8源码解读-C2f模块-以及总结c2模块、Bottleneck

下图中的模块可以在往期的文章中找到。注:引用该图请标明出处。

2024-07-28 20:04:30 2855 3

原创 YOLOV8源码解读-c2模块-以及Bottleneck

split可以指定大小划分了,比如上面split_list中定义了每个张量的大小,并通过split划分大小,不过这个split_list中的数加起来一定要等于那个维度上的数,例如1+3+2+4+10=20.如果不等于会报错。

2024-07-28 17:06:14 1376

原创 MATLAB怎么实现多条曲线共用一个图例

例子:如果我们有4条曲线,分布是cos类和sin类,我们的图例就想区分是cos类还是sin类。

2024-07-26 18:11:15 2766

原创 YOLOV8-源码解读-SPP-SPPF

YOLOV8-源码解读-SPP与SPPF,以及ModuleList函数

2024-07-25 08:00:00 2369

原创 从R-CNN到Faster-R-CNN的简单介绍

R-CNN中含有回归器,SVM,CNN,道路Faster中只有CNN了,回归器和分类器被接到了全连接层后面,到了FasterR-CNN,把SS算法换成了RPN,可以享受到GPU的加速,效果更快。

2024-07-24 15:37:59 344

原创 YOLOV8-源码解读-c1模块 以及nn.Sequential传参数带*的问题

YOLOv8源码解读-C1模块-以及传参数带*的问题

2024-07-24 15:01:05 609

原创 YOLOV8GPU训练报错:RuntimeError: expected scalar type Half but found Float

YOLOV8在cpu上运行没问题,一旦上GPU就会报错。

2024-07-22 15:19:36 645

原创 fMATLAB中fill函数填充不同区域

函数能够根据指定的顶点坐标和填充颜色来绘制多边形或曲线形状,并在其内部填充指定的颜色。这使得在MATLAB中创建具有视觉吸引力的图形变得简单而高效。只需获取填充区域的边缘信息,函数边缘越详细越好,然后调用fill函数。

2024-07-20 15:06:52 597

原创 图像分割-编码解码网络的训练-kreas实现

纯手工打造一个函数用来加载数据,数据分别为image和mask我们所需要的类型:(B数量,长,宽,通道数),只要将数据加载成这样并mask和image对应就行。

2024-07-09 20:04:07 436

原创 Matlab手搓线性回归-非正规方程法

原理:wx+b,x是输入,求得的结果与真实值y求均方误差。生成100个数据,并添加随机噪声。参数更新,梯度下降法(批量梯度下降)迭代1000次后的结果。

2024-07-08 21:12:37 261

原创 深度学习编码解码结构-以及kreas简单实现

图像分割中的编码解码结构(Encoder-Decoder Model)是一种广泛应用的网络架构,它有效地结合了特征提取(编码)和分割结果生成(解码)两个过程。

2024-07-08 18:31:08 540

原创 MATLAB制作一个简单的函数绘制APP

制作一个函数绘制APP,输入函数以及左右端点,绘制出函数图像。

2024-07-04 15:51:58 493

原创 信号与系统-实验6-离散时间系统的 Z 域分析

试用 MATLAB 绘出该系统的零、极点分布图及幅频特性曲线,并分析该系统 的频率特性。了解常用序列的 z 变换、逆 z 变换;3、掌握利用 MATLAB 绘制离散系统零、极点图的方法;4、掌握利用 MATLAB 分析离散系统零、极点的方法;5、掌握利用 MATLAB 分析离散系统频率响应的方法。2、掌握利用 MATLAB 的符号运算实现 z 变换;分析并绘制出离散系统的零、极点图。4、已知某一离散系统的系统函数为。5、已知某离散系统的系统函数为。7、已知某离散系统的系统函数为。

2024-06-30 12:34:08 701

原创 信号与系统-实验5 离散时间系统的时域分析

5、已知描述某离散系统的差分方程为 2y(k) - 2y(k -1) + y(k - 2) = f (k) + 3 f (k -1) + 2 f (k - 2) 试用 MATLAB 绘制出该系统在 0-50 时间范围内的单位响应的波形。3、已知某 LTI 离散系统,其单位响应h(k) = u(k) - u(k - 4),当系统的激励 为 f (k) = u(k) - u(k - 3) 时,求其零状态响应 y(k),并绘制其时域波形图。的时域宽度与序列 f (k) 的时域宽度的关系。1、编程实现下列序列。

2024-06-26 19:19:14 800

原创 信号与系统-实验4 连续时间系统的复频域分析

1、理解拉普拉斯变换、逆变换的定义,掌握利用MATLAB实现解拉普拉 斯变换、逆变换的的方法;2、掌握几种基本信号的拉普拉斯变换;3、掌握利用MATLAB绘制连续系统零、极点的方法;4、掌握系统函数H(s)的求解。

2024-06-16 12:35:58 684

原创 信号与系统-实验3 连续时间信号的频域分析

1、掌握傅立叶变换及其性质;2、掌握连续时间信号傅立叶变换的数值计算方法;3、掌握利用MATLAB实现信号的幅度调制的方法;4、掌握利用MATLAB实现傅立叶变换的方法;5、掌握利用MATLAB实现对周期信号的频谱分析。

2024-06-16 12:28:33 727

原创 信号与系统-实验2-连续时间系统的时域分析

实验二 连续时间系统的时域分析。

2024-06-14 18:32:55 1070

原创 信号与系统 实验1 信号的MATLAB表示及信号运算

实验1-信号的MATLAB表示及信号运算。

2024-06-14 18:20:06 381

原创 点云分割报告整理(未完成版-每天写一点)

体积占用网格表示对点进行体素化,然后使用3d卷积神经网络来学习体素级语义。由于点云的稀疏性,体素化效率低,为避免较高的计算成本而忽略了细节。此外,由于同一体素内的所有点都被赋予了相同的语义标签,因此精度受到限制。为了利用传统的那些2D分割框架,尝试将3D空间从多角度映射到二维空间,然后分割完成后再投影回去,然而,重新投影回3d空间也是一个重要的问题。非结构化点云的 3d 语义分割存在的问题:1.大规模点云数据2.不规则形状3.非均匀密度PointnetPointNet。

2024-06-11 22:55:28 1069

原创 matlab-2-simulink-小白教程-如何绘制电路图进行电路仿真

图形化建模与易读性:Simulink使用图形化的建模方式,通过鼠标拖放不同的模块库中的系统模块,并将它们连接起来,即可迅速建立动态系统模型。与传统的编程方式相比,这种图形化建模方法不需要编写大量代码,降低了建模的复杂度,提高了工作效率。Simulink模型比C代码具有更好的可读性,使得模型的管理和传承更为方便。即使在团队有人离职的情况下,由于模型的直观性,其他成员也能更容易地理解和接手工作。智能化仿真与高效性:Simulink的仿真建立和运行过程智能化。

2024-06-11 22:53:48 10573

原创 matlab-1-函数图像的绘制

绘制函数图像就3步,给出x的范围,给出y的定义,带入plot中。

2024-06-09 15:50:48 1559

原创 数据结构严蔚敏版精简版-栈和队列以及c语言代码实现

和栈相反,队列(queue)是一种先进先出(First In First Out, FIFO)的线性表。它只允许在表 的一端进行插入,而在另一端删除元素。如果入队序列为1,2,3,4出队序列也为1,2,3,4队列在程序设计中也经常出现。一个最典型的 例子就是操作系统中的作业排队。在允许多道程序 运行的计算机系统中,同时有几个作业运行。如果运行的结果都需要通过通道输出,那就要按请求 输入的先后次序排队。每当通道传输完毕可以接受新的输出任务时,队头的作业先从队列中退出 做输出操作。

2024-06-09 14:23:43 671

原创 数据结构严蔚敏版精简版-线性表以及c语言代码实现

如此类由n(n大于等于0)个数据特性相同的元素构成的有限序列称为线性表。线性表中元素的个数n定义为线性表的长度,n=0时称为空表。对千非空的线性表或线性结构,其特点是:(1)存在唯一的一个被称作“第一个"的数据元素;(2)存在唯一的一个被称作“最后一个"的数据元素;(3)除第一个之外,结构中的每个数据元素均只有一个前驱;(4)除最后一个之外,结构中的每个数据元素均只有一个后继。

2024-06-06 13:44:51 1209

原创 Pointnet学习以及对代码的实现

由于点云不是常规数据格式,通常将此类数据转换为规则的 3D 体素网格或图像集合,然后再用神经网络进行处理。数据表示转换使生成的数据过于庞大。PointNet是第一个直接处理原始点云的方法。只有全连接层和最大池化层,PointNet网络在推理速度上具有强大的领先优势,并且可以很容易地在CPU上并行化。

2024-06-02 23:40:08 1009

原创 数据结构严蔚敏版精简版-绪论

下列概念和术语将在以后各章节中多次出现,本节先对这些概念和术语赋予确定的含义。数据是客观事物的符号表示,是所有能输入到计算机中并被计算机程序处理的符号 的总称。:数据元素是数据的基本单位,在计算机中通常作为一个整体进行考虑和处理。在有些情况下,数据元素也称为元素、记录等。数据项是组成数据元素的、有独立含义的、不可分割的最小单位。数据对象是性质相同的数据元素的集合,是数据的一个子集。

2024-06-02 23:02:57 950

原创 10种排序算法总结-(c语言实现与动画演示)

十种常见排序算法可以分为:通过比较来决定元素间的相对次序,由于其时间复杂度不能突破,因此也称为非线性时间比较类排序。:不通过比较来决定元素间的相对次序,它可以突破基于比较排序的时间下界,以线性时间运行,因此也称为线性时间非比较类排序。:如果a原本在b前面,而a=b,排序之后a仍然在b的前面。:如果a原本在b的前面,而a=b,排序之后 a 可能会出现在 b 的后面。

2024-05-29 12:36:48 678

原创 空间注意力机制

空间注意力机制是指人脑或计算机在对外部环境进行观察时,通过集中注意力的方式来提高对特定区域信息的感知和处理能力。在人类的视觉系统中,这通常通过眼球的注视来实现,使大脑能够将注意力集中在目标物体上,从而更清晰地处理其信息。在计算机视觉领域,空间注意力机制通过算法实现,如目标检测和跟踪等技术,帮助模型定位并选择注意力的目标。

2024-05-26 22:49:00 546

原创 最小二乘法-超详细推导(转换为矩阵乘法推导,矩阵求导推导)

最小二乘法就是让均方误差最小。如何让其最小,。答:因为使用的是均方误差,他是一个凹函数,导数为0的点即为最小值和极小值。建议学习一下线性代数。

2024-05-26 15:00:30 1266 2

原创 数据结构-栈以及实现

栈是一种限定在表尾进行插入和删除操作的线性表。允许插入和删除的一端称为栈顶,另一端称为栈底。不含任何数据元素的栈称为空栈。栈又称为后进先出的线性表,简称LIFO结构。这意味着最后进入栈的元素会首先被删除或访问。栈作为一种重要的数据结构,具有独特的LIFO操作特点,广泛应用于各种编程场景和算法中。无论是顺序栈还是链栈,都提供了有效的数据存取和管理方式,为程序设计和算法实现提供了便利。

2024-05-25 13:58:21 441

原创 顺序栈的实现

我们只需要在Top的位置插入,然后Top加1,而Top每次总是指向下一次插入的位置。顺序栈是用数组实现的:(假设我们有8个位置(下标0-7)),因为下一次入栈这个位置就能被抵消掉。栈如果满了,Top应该是等于8的。

2024-05-25 13:55:43 261

线性回归的实现以及学习率对线性回归影响的可视化

实现了一元线性回归,输入为学习率以及数据真实分布,输出为 学习过程的动画以及log

2024-07-21

Matlab箱型图绘制

Matlab读取Excel数据,绘制箱型图

2024-07-11

Matlab实现一个按钮绘制函数的APP

Matlab实现一个按钮绘制函数的APP

2024-07-11

点云深度学习系列五: RSNet:Recurrent Slice Networks for 3D Segmentati

RSNet是在CVPR 2018上发表的一种网络架构,专为3D点云分割任务设计。它结合了递归神经网络(RNN)和切片池化操作,实现了快速且内存效率高的3D点云处理。RSNet的核心是其创新的“Recurrent Slice”机制,能够在点云数据的三维空间中进行有效的特征学习。

2024-07-04

深度相机数据集-一个箱子四周的深度相机数据集

围绕一个箱子的四周进行深度感知和物体识别。为了完成这个任务,我们将使用深度相机来捕获箱子的四周图像。这些图像将包含箱子的形状、尺寸以及它相对于相机的位置信息。 首先,我们将选择一个合适的深度相机,它具有较高的分辨率和准确的深度测量能力。然后,我们将相机放置在一个固定位置,或者使用某种方式(如机械臂或移动平台)来移动相机,以便能够捕获箱子的四面(前面、后面、两侧和顶部)的图像。 在数据采集过程中,我们需要确保相机与箱子之间的距离、角度和光照条件等因素的一致性,以便在后续的数据处理和分析中能够准确提取箱子的特征。此外,为了增加数据集的多样性和鲁棒性,我们还可以改变箱子的材质、颜色、纹理等属性,并在不同的环境条件下进行数据采集。

2024-06-29

图注意力网络tensorflow

图注意力网络将注意力机制引入到基于空间域的图神经网络中,与传统的基于谱域的图卷积神经网络(GCN)不同,GAT不需要使用拉普拉斯等矩阵进行复杂的计算,仅通过一阶邻居节点的表征来更新节点特征,因此算法原理相对简单。 GAT优化了图卷积神经网络的几个缺陷,特别是能够处理inductive任务(即训练、测试使用不同的图数据),而GCN通常只能处理transductive任务(即训练、测试使用同一个图数据)。 对所有节点训练一个共享权重矩阵W,用于将节点特征映射到新的空间。 计算注意力值时,将节点i和节点j的表示分别使用W做映射,并将结果向量拼接起来。 使用前馈神经网络a将拼接向量映射到实数上,并通过LeakyReLU激活函数和归一化操作得到最终的注意力系数。 根据注意力系数对邻居节点进行加权求和,得到节点i的输出特征。 引入多头注意力(multi-head attention)机制来提高模型的表征能力。

2024-06-17

信号与系统实验.rar

实验一 信号的MATLAB表示及信号运算 实验二 连续时间系统的时域分析 实验三 连续时间信号的频域分析 实验四 连续时间系统的复频域分析 实验五 离散时间系统的时域分析 实验六 离散时间系统的Z域分析 实验七 系统函数与系统特性 实验八 抽样定理及其MATLAB实现

2024-06-15

NL-LinkNet是一种改进的深度学习模型,主要用于从高分辨率卫星图像中提取道路信息

NL-LinkNet是一种改进的深度学习模型,主要用于从高分辨率卫星图像中提取道路信息。以下是对NL-LinkNet的详细解释: 模型背景 目的:解决高分辨率卫星图像中的道路分割问题,这是遥感领域的一个重要课题。 挑战:传统的卷积神经网络(CNN)方法在处理这类问题时,往往只能捕获局部特征,难以捕捉长距离依赖关系。 NL-LinkNet的特点 非局部操作:NL-LinkNet引入了非局部(Non-Local)操作,这使得模型能够捕获图像中的全局特征依赖关系。每个空间特征点都可以参考其他所有的上下文信息,从而提高了道路分割的准确性。 轻量级:相比其他先进的模型,NL-LinkNet在保持较高性能的同时,具有更少的参数和计算量。这使得模型在实际应用中更加高效和可行。 性能优越:在DeepGlobe 2018道路提取挑战数据集上,NL-LinkNet取得了65.00%的mIOU(平均交并比)分数。这一成绩超过了其他已发表的先进模型,包括D-LinkNet等。 模型结构 NL-LinkNet主要基于LinkNet架构,但引入了非局部操作模块。这些模块被插入到解码器部分,以捕获图像中的全局上下

2024-06-12

matlab课程大作业(试卷类型)-含有绘图、电路仿真、数据分析、矩阵处理等

问题分析: 分析问题的主要特点和难点。 确定解决问题的关键步骤和所需方法。 MATLAB编程实现: 使用MATLAB编写程序,实现问题求解的算法或方法。 程序应具有良好的可读性和可维护性,包括必要的注释和文档。 充分利用MATLAB的内置函数和工具箱,提高编程效率。 结果展示: 使用图表、图像等可视化方式展示结果。 对结果进行定性和定量分析,解释其意义和价值。 MATLAB(Matrix Laboratory)是一款功能强大的数学软件,它在许多领域都拥有广泛的应用。以下是MATLAB的一些主要好处: 易于学习和使用:MATLAB具有直观的编程环境和简单的语法,使得用户可以快速上手并高效地进行编程。它还提供了大量的内置函数和工具箱,可以方便地执行各种复杂的数学计算和分析。 强大的数值计算能力:MATLAB特别擅长处理矩阵运算和线性代数问题,这是许多科学和工程领域的基础。它提供了高效的矩阵运算函数和算法,可以大大简化复杂的数学计算过程。 丰富的可视化功能:MATLAB具有强大的数据可视化功能,可以将数据以图形、图表等形式展现出来,帮助用户更直观地理解数据和分析结果。它还支持创建交互式

2024-06-12

点云分割DSVT(Dynamic Sparse Voxel Transformer)

背景与动机: 在自动驾驶和机器人等领域,点云分割是理解和识别环境的关键技术。然而,传统的稀疏点云特征提取方法存在高计算力需求或表达能力受限的问题。DSVT的提出旨在解决这些问题,提供一个既高效又易于实现的解决方案。 DSVT的核心特点: 高效性:DSVT根据每个窗口中的稀疏性将一系列局部区域进行划分,并以完全并行的方式计算所有区域的特征,从而提高了处理效率。 易于部署:相比基于稀疏卷积的方法,DSVT无需自定义CUDA操作,能够高效地作为3D感知网络的主干,便于在实际应用中部署。 高性能:在大规模Waymo数据集上,DSVT在单次扫描3D物体检测上实现了最先进的性能(如78.2 mAPH L1、72.1 mAPH L2等),大幅领先于以往的方法。 DSVT的技术细节: 动态稀疏窗口注意力:DSVT包含动态稀疏窗口注意力机制,该机制能够在具有不同稀疏性的局部窗口内并行计算,提高建模能力。 可学习的3D池化操作:DSVT使用可学习的3D池化模块进行下采样,以更好地编码几何信息并压缩为BEV特征图输入任务头。

2024-06-06

KAN网络(Kolmogorov-Arnold Network)一种新型的神经网络架构

特点 权重替代:KANs中没有使用传统的线性权重,而是将每个权重参数替换为一个参数化的单变量函数,通常是用样条函数来表示。 性能优势:这种设计上的改变使得KANs在准确性和可解释性方面优于MLPs。在数据拟合和偏微分方程求解任务中,即使规模较小的KANs也能实现与规模更大的MLPs相当或更好的准确度。 可解释性:KANs可以直观地被可视化,并且能够容易地与人类用户交互,这提高了模型的可解释性。 数学理论基础 KANs的数学理论基础来自于Kolmogorov-Arnold表示定理。该定理表明每个多元连续函数都可以表示为单变量连续函数的两层嵌套叠加。在KAN网络中,这种结构通过可学习的单变量函数和加法运算来实现。 学习过程 MLP的边是线性权重,学习的是线性函数的系数(w*x+b)。而KAN的边是一维函数(原文中用且只用了B-Spline函数来进行参数化),该函数的系数是可以被学习的(类似于去不断弯曲木条的形状)。 KAN卷积神经网络 KAN卷积神经网络是KAN网络的一个扩展应用。KAN卷积(KAN Convolutions)是一种特殊的卷积操作,它在每个边缘上应用一个可学习的非线性函数

2024-06-06

CycleGan和Pix2Pix是两个在图像到图像转换领域常用的深度学习模型

Cycle GAN和Pix2Pix都是强大的图像到图像的转换模型,但它们在应用场景、技术特点和训练数据要求等方面有所不同。Cycle GAN无需成对数据即可进行训练,适用于更广泛的图像转换任务;而Pix2Pix则依赖于成对数据进行训练,在处理具有明确对应关系的图像对时表现较好。在实际应用中,应根据具体任务和数据集的特点选择合适的模型。Cycle GAN广泛应用于各种图像到图像的转换任务,如风格迁移、季节变换、对象变形等。 由于其不需要成对数据的特性,Cycle GAN能够处理更广泛的图像数据集,并产生更多样化的结果。Pix2Pix是一个基于条件生成对抗网络(Conditional Generative Adversarial Networks, cGANs)的图像到图像的转换模型。它利用成对数据(即一一对应的图像对)进行训练,以学习从输入图像到输出图像的映射。Pix2Pix的生成器通常采用U-Net结构,而判别器则使用PatchGAN结构。

2024-06-06

DeepGlobe数据集是一个专注于遥感图像分析的大型公开数据集,主要用于推动遥感图像分割和语义理解等领域的研

DeepGlobe数据集可以从官方网站上进行下载。在下载之前,可能需要注册账号。下载后的数据集需要进行一些必要的预处理操作,包括数据集的读取、图像预处理和标签预处理等。 一、数据集概述 DeepGlobe数据集由高分辨率的卫星图像以及相应的标注数据组成,旨在支持计算机视觉和遥感技术领域的科研人员开发更加先进的算法。该数据集涵盖了多个子任务,如道路分割、建筑物检测等,每个子任务都有其特定的数据集。 二、DeepGlobe Road数据集 数据来源:DeepGlobe Road数据集包含了来自6个国家的遥感影像,这些影像由高分辨率卫星拍摄。 数据规模:数据集中包含了训练集、验证集和测试集三部分,总共有20,000张图片。这些图片使用了像元尺寸为0.3米和0.05米的两种分辨率进行了测试。 标注信息:每张图片都配备了详细的道路轮廓线标注,用于支持道路分割任务的训练和评估。 三、DeepGlobe语义分割数据集 数据特点:该数据集专注于提供高分辨率的亚米卫星图像,特别关注农村地区。由于土地覆盖类型的多样性和注释的高密度,该数据集对算法的挑战性较高。 数据规模:数据集共包含1146幅卫星

2024-05-31

Kan网络pytorch的实现

权重替换:KAN网络通过将权重参数替换为可学习的单变量函数,提高了网络的性能和可解释性。这种设计使得KAN网络在准确性和可解释性方面优于传统的多层感知器(MLP)。 激活函数位置:与传统的MLP不同,KAN网络中的激活函数位于网络的“边”(即权重)上,而不是节点上。这使得KAN网络能够更灵活地调整每个连接上的激活函数,从而提高模型的表示能力。 非线性核函数:KAN网络可以使用非线性核函数来替代MLP“边”上的线性函数,进一步增强了模型的非线性处理能力。 逼近精度:KAN网络可以设定细粒度的结点(Knot)来提高逼近精度,这使得KAN网络在处理复杂任务时能够获得更高的准确度。 KAN网络的数学理论基础主要来自于Kolmogorov-Arnold表示定理。该定理指出,任意一个多变量连续函数都可以表示为有限数量的单变量连续函数的两层嵌套加法的形式。KAN网络正是基于这一定理,通过将多元函数的学习转化为对一组单变量函数的学习,提高了模型的表达能力和计算效率。

2024-05-31

遥感道路分割网络-包含U-net,D-Unet,Linknet等

遥感道路分割网络是图像处理领域中的一个重要研究方向,其目标是从遥感图像中准确提取道路信息。以下是关于U-net、D-Unet和Linknet等遥感道路分割网络的详细: 1. U-net U-net是一个基于卷积神经网络(CNN)的端到端图像分割模型,其结构特点主要体现在其对称的编码器-解码器结构上。还通过跳跃连接(skip connections)将编码器中的低级特征与解码器中的高级特征结合,从而使网络能够捕捉多尺度信息。U-net在遥感图像道路分割中因其高效且可靠的性能而广泛应用。 2. D-Unet D-Unet是U-net的一个变种,它在U-net的基础上做了一些改进,以更好地适应遥感图像道路分割的特定需求。改进点:D-Unet可能引入了残差块(residual blocks)或其他先进的网络结构,以增强网络的特征提取能力和训练稳定性。这些改进有助于网络更准确地捕捉遥感图像中的道路特征。 3. Linknet是另一种用于遥感图像分割的神经网络结构。Linknet在编码器和解码器之间建立了直接的连接(links),使得解码器在重建图像时可以直接利用编码器中的低级特征信息。

2024-05-25

遥感图像分割论文整理-道路分割等

遥感图像道路分割的目的:遥感图像道路分割的主要目的是从遥感影像中自动识别和提取道路信息,为城市规划、交通管理、环境监测等领域提供数据支持。 遥感图像道路分割的方法 基于阈值的分割:通过设定合适的阈值,将遥感图像中的像素分为道路和非道路两类。这种方法简单直观,但对于复杂的道路图像,效果可能不佳。 基于边缘检测的分割:利用边缘检测算法(如Canny算子、Sobel算子等)提取道路的边缘信息,从而实现道路分割。这种方法对于边缘明显的道路图像效果较好,但对于边缘模糊或断裂的情况可能存在问题。 基于区域生长的分割:从某个种子点开始,将具有相似特征的像素逐步合并成道路区域。这种方法需要选择合适的种子点和生长准则,对于复杂的道路图像可能需要多次尝试和调整。 基于深度学习的分割:利用深度学习模型(如卷积神经网络CNN、全卷积网络FCN等)对遥感图像进行训练和学习,自动提取道路特征并实现道路分割。这种方法具有强大的特征提取和学习能力,对于复杂的道路图像也能取得较好的效果。

2024-05-25

五折交叉验证绘制ROC曲线

五折交叉验证(5-fold cross-validation)和ROC曲线(Receiver Operating Characteristic Curve)在机器学习中是两个不同的概念,但通常可以结合使用来评估模型的性能。 五折交叉验证的基本思想是将原始数据集分成五个相等大小的子集(或折叠),其中四个子集用于训练模型,而剩下的一个子集用于测试模型。这个过程重复五次,每次选择不同的一个子集作为测试集,其余的作为训练集。最后,将五次的性能评估结果取平均值以得到最终评估结果。 当与ROC曲线结合使用时,我们可以在每次五折交叉验证的迭代中,使用训练集来训练模型,并在测试集上生成预测结果。对于每个测试集上的预测结果,我们可以计算真阳性率(True Positive Rate,TPR)和假阳性率(False Positive Rate,FPR),这是ROC曲线的关键输入值。

2024-05-24

tensorflow中VGG、mobienet、ResNet等预训练权重

在预训练过程中,深度学习模型通过学习数据中的特征和模式来调整其参数,使其能够更好地拟合数据。预训练结束后,会生成一组最优的模型参数(即权重矩阵和偏置向量),这些参数可以被用来初始化其他任务的模型参数,从而加速模型的训练过程和提高模型的性能。 预训练权重可以被转移到其他任务中,例如物体检测、图像分割、自然语言处理等。由于预训练权重已经学习到了一些通用的特征和模式,因此使用它们作为新任务的初始权重可以使模型更快地收敛到较好的性能。 然而,需要注意的是,预训练权重通常是基于先前的模型结构训练的。如果更改了模型结构,则可能需要重新训练模型或者微调预训练权重。此外,使用预训练权重时还需要注意数据集之间的差异,以确保预训练权重与新任务的数据集相适应。

2024-05-24

Sigmoid回归实现分类-带gui显示,下载就能使用

Sigmoid回归(Sigmoid Regression)实际上并不是一个标准的回归算法,它更常被用于解决二分类问题。Sigmoid函数(或称为逻辑函数)通常与线性回归结合使用,将线性回归的输出转换为一个介于0和1之间的概率值,从而进行二分类。

2024-05-24

峰值聚类实现分类算法,带GUI显示,以及数据集,下载就能运行

算法的基本思想是,当一个数据点的局部密度和相对距离都较大时,它就被定义为密度峰值(即类簇中心)。然后,剩余的数据点将被分配给密度比它们高的最近数据点所在的类簇。 在Python中,使用wxPython库来编写图形用户界面(GUI)应用是一种常见的方法。wxPython是一个跨平台的GUI工具包,它提供了丰富的控件和布局管理器,用于构建复杂的桌面应用程序。

2024-05-24

贵州大学840数据结构

包含博学课,真题,期末考试题

2024-05-21

严蔚敏数据结构全套C语言实现

严蔚敏数据结构全套C语言实现

2024-05-21

NL-Linkenet以及D-Linknet网络模型以及权重

卫星道路图像分割,含有模型以及权重,不含数据集。

2024-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除