- 博客(125)
- 收藏
- 关注
原创 visio怎么让一个图形转到指定角度
1.假设我们想让一个图转换成指定角度,需要怎么做呢?就像下面的这张图,我想让这个矩形旋转任意的角度。之后就会出现一个边框,这里就可以调节角度啦。点击任务窗格之后,选择大小和位置。cotrol选中指定图形。接下来我们看怎么做吧!
2025-04-03 11:16:16
130
原创 nnUNetv2代码跑通Kits23数据集流程(windows)
这个意思是task_id是220,2d分割,0代表第一轮交叉训练。5轮的意思是将数据集分为5个部分,其中一份用作验证集,另外四份作为训练集,训练五轮就是将每一份都作为一次验证集使用,最后将这五次训练取个平均,所以叫五轮交叉验证。新建之后将这个文件路径导入到这个项目里面,在paths.py文件中添加即可。5.之后将kits23数据集下载下来,我这里选择其中的前十个case。实际上这个项目也可以不用下载,直接输入。6.然后,我们训练就可以了,训练语句为。运行这个文件夹之后就转换成功了。1.首先跳到官方网站。
2025-02-22 16:58:07
245
原创 超图节点到边边到节点理解
例如,在图像分割任务中,一条边的特征可能表示某个区域的上下文信息,将这些信息传递回节点可以帮助节点更好地理解其上下文。例如,在图像分割任务中,一条边可能连接多个像素,聚合这些像素的特征可以得到这条边的特征。将节点的特征聚合到边上,目的是将多个节点的信息整合到一条边上,从而表示这条边的特征。在普通图中,一条边只能连接两个节点,而在超图中,一条边可以连接任意数量的节点。将边的特征聚合回节点,目的是将边的信息传递回节点,从而更新节点的特征。将边特征按照节点的连接关系聚合回节点,得到更新后的节点特征矩阵。
2025-01-20 20:45:37
415
原创 可视化自己的模块在模型中起积极还是消极作用
通过分析模块输出的特征对最终预测的贡献,判断模块的作用。:将目标模块与其他模块(如标准模块或替代模块)进行对比。:可视化模块的参数(如权重、偏置),分析其分布和变化。分析输出的分布和特征,判断模块是否提取了有用的信息。:通过反向传播计算模块的梯度,分析梯度的大小和分布。如果模块的输出显著降低了损失,说明模块起积极作用。:分析模块输出的激活值分布,判断模块是否正常工作。如果移除模块后性能显著下降,说明模块起积极作用。如果特征对预测有显著贡献,说明模块起积极作用。:通过分析模块对损失函数的影响,判断其作用。
2025-01-17 10:52:53
304
原创 将txt转成excel正则化公式的调整
将训练的结果转换成excel是送到画图的关键,但是在转的过程中出现了问题,发现是正则化公式的结果。上面是正则化公式,下面是他的txt文件中的格式,要对应好才能转换。最后调好了,是没加空格的问题。使用网站进行调试,最终可以转了。下面是调试的工具以及调试好的代码。
2025-01-08 14:03:10
406
原创 labelme转yolo格式
首先需要将labelme文件转成json文件,这个文件包含了所有的img的内容,之前的是好几个文件,时间太悠久了,不知道代码是引用的谁的了。之后需要将json转成yolo格式。
2025-01-06 10:41:40
162
原创 pr剪辑视频怎么解决界面不全问题
这是分辨率设置的问题,一般输入是大小1920,1080分辨率大小,但是剪辑之后变成了1420,760的情况,我们点击其中的序列。点击序列,选择序列设置,将帧大小的水平垂直改成16:9就可以了。这样界面就变成全部了。
2024-12-30 14:06:54
514
原创 大模型是否会根据你的礼貌程度来回答问题的好坏
当我们问同一个问题,而使用不同的礼貌用语时是否会影响答案的质量。我挺好奇的所以做一下实验。首先我们使用三台电脑,不同的账号,在同一个大模型下回答同一个问题。得出的结果令人意想不到,主机1是一位使用一星期的账号,而主机2和主机3是新的账号。我们发现不带语气词会解释的更加全面,而如果语气词不礼貌,会导致给的答案更加的简短。为此我们在主机2上面输入了不带语气词的问题,得出的答案是与主机1的答案是一样的。我们在问问题的时候尽量不要带有语气词,更不要带有不礼貌的语气词。主机2不带语气词结果。
2024-12-29 22:05:24
746
原创 debug奇遇
也不能说奇遇吧,只能说没见过,今天debug一个函数,步进之后发现不是这个函数的定义部分,后来发现需要步进步出三次,每一次是对条件的判断与处理。
2024-12-22 14:39:01
268
1
原创 关于缝合怪的一些看法
最后,我也是个缝合小怪,嘿嘿嘿!但是我相信慢慢来,会成为缝合大怪的,因为我之前见过一个缝合大怪,它只在yolo上缝合,也是够专一的。缝合怪没有错吧,对于我们刚入门的来说,缝合是最好入门的,缝合入门是真的好入门的,真简单,但是最好理解其中的原理再缝合。这样其实不太好,缝多了应该往更深的地方改进,这才是更好的目标吧。
2024-12-17 10:18:47
111
原创 语言模型使用心得
使用像文心一言这样的语言模型,在撰写文章时确实能提供极大的帮助。然而,重要的是我们要明确主次关系:自己的创意和内容应当是文章的核心,而语言模型则扮演着一个辅助角色,帮助我们梳理思路,使文章条理更加清晰,内容更加易于理解。从当前的应用情况来看,语言模型作为一种高效工具,确实能够提升我们的工作效率,但关键在于我们要始终保持对自己内容的主导,确保语言模型服务于我们的创作需求。
2024-12-09 10:41:58
428
原创 调研途径介绍(yolo为例)
对于这部分的资料,内容更加的参差不齐,大家更应该辩证的看这些内容,有的看不懂没有关系,没准作者也不明白其中的原理。yolo是有官网的,这里面介绍的是怎么用yolo去识别内容,我建议大家先了解清楚基本原理再来看代码,边看原理边看代码也可以加深理解。这里对于初学者要看的内容是综述,综述会把这个相关领域的所有内容进行整合,并较为详细的描述它的原理与结构,综述对理解相关领域内容起到很重要的作用。我建议大家自己做个文档,对看到的内容手敲下来重要的内容,而不是复制粘贴,通过边看边抄,加深自己的记忆。
2024-12-08 13:38:26
620
原创 README写作技巧
打开 README.md 文件。在 GitHub 仓库的页面上,README.md 文件会自动渲染为格式化的 HTML,展示在仓库的主页上。markdown语法也是需要学习的,它跟latex挺像的,只需要掌握一些用法就可以,这里以[2]作为模板,里面包含markdown的一些常用方法。一个#代表一级标题,两个#代表二级标题,没有就是正文,我们现在看没什么区别,下面我们右键选择预览,就会新弹出一个预览文件,这个预览文件就是最终的效果文件。README是对项目的一个说明,它对观看者来说是非常重要的一部分。
2024-12-07 17:27:34
1267
原创 drg人物交互主干网络代码解析
在这之前简要介绍一下resnet的网络结构,首先网络结构如下所示:18,34,50,101,152的区别就在中间的四层layer部分,差异如下面的第二张图所示。此文件中存放了三行代码,这三行代码分别代表训练的每部分,分别是,训练实例流,训练以人为中心流,训练以物为中心流。回到代码部分,设置一个输入,形状大小是(1,3,640,640)的张量,调用Resnet模型,设置断点,之后开始代码解析。e2e_faster_rcnn_R_50_FPN_1x_VCOCO_app_only.yaml为例。
2024-11-04 15:03:38
222
原创 plotNeuralNet绘制指南
创建新的文件夹,新建一个新的python文件,然后在这个python文件中添加代码,用于定义网络结构,主要是不同类型网络层的参数,包括输入输出数量、卷积核数量等。这个工具是基于latex代码实现的用于绘制网络结构。之后下载并安装windows的bash运行器,首先下载并安装MikTex,下载网站。不想写了,还有别的活,先这样吧。
2024-10-11 09:41:19
506
原创 stm32f411ceu6芯片学习
参考【第6讲、STM32F411最小系统原理图绘制-哔哩哔哩】 https://b23.tv/Fvpr0mk基本每个芯片,都可以在数据手册中找到厂家提供的参考电路图,这就是我们绘制这个芯片的原理图最基本的依据。可以在stm32f411ceu6的数据手册中找到该芯片的供电方案,外部晶振电路,复位电路,iic总线接口电路的参考电路分别如下图1、图2、图3、图4:图1:数据手册中的STM32F411CEU6 供电方案参考电路图2:数据手册中的STM32F411CEU6 外部晶振参考电路。
2024-09-17 23:19:44
1577
原创 模型中间部分的卷积可视化
我们取前向传播的第一个卷积输出,输出的大小为(1,64,112,112),将输出x定义为x1,并用squeeze将其batch_size去掉变成(64,112,112)到了这里还不能作为模型的输入,模型的输入是四维的(batch_size,input_channel,width,height)之后resize大小为(3,512,512)的形式。然后将图像转换为tensor,也就是数组的形式。创建一个包含多个通道子图的图形。让其封装到一些函数,方便调用。选择可视化的对应通道。之后遍历通道并显示出来。
2024-09-06 09:16:36
605
2
原创 visio画标注图
之后在更多形状-其他visio方案-尺寸度量-工程就可以进行标注了。首先在视图-显示-任务窗格-大小和位置。这样就可以设置形状的大小长度了。用的比较多的是水平和垂直。
2024-09-05 14:33:06
1128
原创 卷积可视化的一些想法
对于训练好后的模型,可否在一个图像输入到已经训练好的模型当中,然后在那个要输出的卷积下面将x输出可视化,这是可以实现的,并且保存到已经图像当中。首先输入图像进行处理并将其转换成数组的形式。之后将数组输入到训练好的模型中。下一步输出并反卷积回图像。
2024-09-04 21:47:21
146
1
原创 yaml文件查看模型的架构
下一步 判断文件是否存在如果存在就打开这个文件,并将这个文件定义为file,并用yaml加载这个文件,到这里会形成一个字典,你调用的话只能使用cfg[参数] 来进行访问,如果想要cfg.内容.内容的形式就需要使用OmegaConf创建这种访问方式。最近在看hrnet模型代码,想查看hrnet的模型架构,输出一下,但是模型参数需要cfg,我就想着怎么把yaml文件导进来然后打印模型呢,直接chat就可以了,下面解释一下每一部分,非常的好理解。之后在hrnet文件夹下输入代码。
2024-09-04 21:06:54
279
原创 word含有大量内容页数,如何快速截取部分内容
方法很简单,这里以wps为例,首先鼠标点到复制开始部分,之后滚动到结束部分,先按shift键,之后鼠标点击结束部分即可全选想要的内容。好啦又水了一篇,希望能帮到有缘人。
2024-08-28 16:02:17
710
2
原创 羊了个羊通关技巧
玩到下午3点了,55次都没有通关,看来这个方法只是成功的一部分,因为到了最后有很多隐藏的很深,根本不知道里面有什么,这个游戏真无语!就是为了接广告的吧。可以看一下这个他说通关的概率是百分之0.07,这东西就是转广告费的。先将下面的左右两行消除,然后再消上面大块的,也就是先消下方这部分。看这个是否应该放在槽子里,因为你放进去后面消不了。能帮助通关的另一块是看广告,增加几个位置。第一次,发现确实能够增加通关的概率。第二次,也有很大希望。
2024-08-18 22:26:00
486
1
原创 调研在深度学习中如何读代码
但是top-down执行到一定层次之后就不知道程序在干什么,这个时候需要转入down-top模式,给底层函数一个一个的写作用文档。阅读代码有两种模式,top-down模式是打开一个文件,静态的跟着代码读,每次实现调用函数的时候就把函数的执行层次记录下来。说真的,他在教代码的每一部分调用,最后怎么运行出来的,怎么跑通,对深度学习有一个大概的了解。想要掌握的好,光阅读是不够的,一定要动手写、训练模型,调参,调bug的过程也是吸收的过程。带有目标性的读某个项目的某个block,数量不在多,在于能够解决你的问题。
2024-08-15 22:20:22
482
原创 faster_rcnn锚框生成与原理
这个k是怎么来的呢,每个像素点对应原图的一个框,这个框需要进行预测,他应该长什么样子,所以设定k个框来对应这个锚点,并通过分类来判断这个框是前景还是背景,然后通过回归对锚框进行优化。定义生成框(总的),这段代码首先利用base_size生成base_anchor,是一个[0,0,15,15],之后生成一个以基础框长宽比生成的锚框,之后通过结合以尺度生成的锚框来得出最终的锚框。通过一个3*3的卷积核对输入特征进行卷积,不改变输入特征的长宽,只改变通道数,卷积操作之后,输出的每一个特征点都会映射k个锚框。
2024-07-18 21:02:04
267
原创 resnet50网络搭建
它分成两个基本模块,一个是basic block,另一个是bottle neck模块,一般层数较低的用basicblock搭建,层数较深的用bottle neck模块,resnet50用的是bottleneck搭建的,两个模块的网络结构如图下。为什么有多余的一个边,通俗讲就是为了可以搭建更深的网络,采用F(X)+X求它的梯度比F(X)的梯度更不容易导致梯度下降。另一种说法是当这一层的卷积权重不那么重要的时候就可以直接连接下一部分,也就是那条多的线,而忽略掉卷积权重这一部分。结果与图2的网络结构是一致的。
2024-07-15 15:54:24
8255
原创 faster-rcnn代码解析
cfgs/args.net_ls.yml”,如果不是则设置cfgs/args.net_yml,这个large_scale是在前面的命令行参数设置的。这个代码是在配置文件中的,判断是否为大尺度图像,如果是,则执行前面的文件设置为,以字典的方式访问对象的属性。
2024-07-15 15:08:04
249
原创 three.js添加多个画布
多个场景的渲染需要多个画布,但是这样会导致加载模型纹理次数变多,基本方法是用一张canvas在整个背景中填充视口,利用其它元素作为每个虚拟画布,只在canvas中加载一个渲染器renderer,并为每个虚拟画布创建一个场景,这样只需要确保每个虚拟画布的位置,three.ja就会将他们渲染在整个屏幕中指定的位置。这样我们只添加了一个canvas,仅使用了一个webgl contexts,解决了webgl上下文数量限制问题。
2024-07-14 21:20:06
314
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人