自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(179)
  • 收藏
  • 关注

原创 14.1 人脸的三维重构(PRNet算法)

我们在写了colmap的三维重构的环境搭建与使用,该算法可以重构任意的物体,但对拍照要求比较高,本文介绍的PRNet算法专门用来三维重构人脸,并且单张图片就可以重构。

2025-12-24 14:31:35 134

原创 14.三维重建colmap环境安装与使用

1.1 conda 环境下的colmap安装。若 conda 环境持续冲突,直接从源码编译。

2025-12-23 12:16:32 158

原创 13.长视频和短视频的目标追踪(yolo_insightface模型)

在视频中提取出了5个id,而视频中实际上只有这5个人,我另外运行了3个视频,最后追踪的结果没有重复的头像,也没有漏掉的头像。运行时间和图片中的人头个数成正比,insightface检测每个头像的时间约为0.08s~0.2s之间。(Anaconda/Miniconda)创建独立环境,也可使用。在2.1搭建环境里运行以下代码即可。InsightFace 依赖。

2025-12-16 14:32:11 406

原创 10.识别视频中的场景切换

这个代码能识别视频中的场景切换。

2025-12-03 10:49:15 76

原创 12.rf-detr目标检测模型的环境搭建、数据集制作、模型训练和预测

这是测试结果,3个类的置信度都大于0.9,我用yolov8以相同的数据集训练模型,测试的置信度都小于0.8,可见该模型的效果更好,但该模型的pth文件500M左右,而yolo模型的pth文件只有6M左右。上面图片是images和labels文件夹,分别放图片和标签,最下面的txt文件里面是标签的所有类别,类别的存放方式如上图中打开的txt文件,这个文件有3个类别。,然后下拉页面,可以看到如下图的一个.zip文件的源代码下载,点击后得到一个zip的压缩文件,并解压zip文件。至此,模型训练完成。

2025-11-28 16:01:38 407

原创 11.2 yolov8用自己的数据集训练语义分割模型

本文看了博客和博客,将两个博客的内容串着操作了一遍,这里作为笔记用。1.下载下载后打开labelme.exe文件得到如下图:2.新建label保存标签上图中,images是图片的文件夹,json文件是标注后存放json文件的文件夹,然后打开数据集文件进行标注。

2025-07-24 16:39:08 878

原创 3.3 WPF读取txt文件画折线图

Grid> ...</Grid>之间的所有代码复制到里面就行。

2025-07-14 14:27:31 318

原创 3.2 WPF 画散点图

Grid> ...</Grid>之间的所有代码复制到里面就行。

2025-07-14 11:12:02 354

原创 3.1 WPF画折线图、直方图、饼状图

本文看了博客,这里作为笔记用。

2025-07-14 10:29:31 402

原创 4.Stable Diffusion WebUI 模型训练

本文看了知乎的文章,这篇文章写的很详细,可能是我的SDW版本升级了,有的地方和这篇文章的不同,所以内容有部分的改动,但最后还是可以正常训练了,这里作为笔记用。如果要更全面了解Stable Diffusion WebUI 的使用,建议大家看上面那篇知乎的文章,文章写的很全,包括文生图、图生图的细节及模型训练、模型合并的细节,都讲的很详细。

2025-07-01 11:17:39 981

原创 3.Stable Diffusion WebUI本地部署和实践

本文看了和,本人根据它们部署了一遍,中间遇到一些报错,但根据报错提示解决了问题,最后部署成功,这里主要作为笔记用。

2025-06-27 10:52:21 927

原创 9.微调训练大模型Qwen2.5-0.5B

本文看了博客,该博客写的很详细,安装该博客操作时在我的电脑上报错时做了细微的代码变化,这里作为笔记用。

2025-06-24 15:06:09 498

原创 8. ollama 常用的Python使用命令

上一节写了ollama本地部署大模型,这里主要写ollama用python调用大模型。这里主要看了博客,这里作为笔记用,以下代码都能在python环境下跑通。

2025-06-19 17:20:37 454

原创 7. Ollama: 大模型本地部署和Python接口

Ollama 是一个开源的大型语言模型(LLM)服务工具,旨在简化在本地机器上部署和运行大型语言模型的过程。本地部署:Ollama 允许用户在本地机器上部署和运行大型语言模型,无需依赖外部服务器或云服务。这使得用户可以在私有环境中使用强大的语言模型功能,保护数据隐私和安全性.简化部署过程:通过提供一键安装和配置的脚本,Ollama 大幅简化了在 Docker 容器中部署大型语言模型的过程。用户只需运行简单的命令,即可快速搭建起模型运行环境,无需手动配置复杂的依赖和参数.

2025-06-18 11:15:06 1109

原创 6.多项式拟合原理

本文的多项式拟合原理看了博客,该博客写的很详细,这里只是作为笔记用。

2025-06-12 14:46:29 1716

原创 5.leecode的回溯算法求解排列组合问题

这些题都可以用回溯算法解决。这里先说回溯算法的框架,然后根据这个框架求解每个问题。

2025-05-10 15:30:53 287

原创 12. RANSAC点云多平面拟合分割

本文看了博客的文章,该博客将多平面拟合分割讲的很详细了,这里只是作为笔记用。

2025-04-28 14:06:55 1168

原创 5.yolov5目标检测的transfomer模型介绍(python)

trunc_normal是截断正态分布,用来初始化权重张量(用截断正态分布填充张量,a是下限,b是上限,mean是均值,正态分布的标准差,tensor要初始化的张量)。# 1.截断正态分布,用来初始化权重张量(用截断正态分布填充张量,a是下限,b是上限,mean是均值,正态分布的标准差,tensor要初始化的张量)运行结果如下:显然,该模块建立了一个3X3的tensor张量,且填充的数据符合均值为0,方差为1,最大值为2,最小值为-2的正态分布。

2025-03-26 17:20:26 1073

原创 2.1 transformer模型原理及代码(python)

本文参考了其他一些博客,在这里作了一个汇总,参考最多的是博客、博客和博客,也看了其他博客,在这里不详细的说了,作为笔记用。

2025-03-16 13:06:28 1278

原创 2. qt写带有槽的登录界面(c++)

我们在中写了个简单的登录界面,但没有槽,在这里写一个带有槽的界面。

2025-03-15 13:32:56 572

原创 1.Qt写简单的登录界面(c++)

Qt是我们设计界面最常用的方法,当然,Qt也可以画图等,所以Qt很常用,在这里首先介绍简单的界面设计。其实Qt也有其他语言的,前面我用Qt的designer做过python的简单界面设计,可以看博客4. designer建立关于目标检测的简单界面(python)_qt designer 目标检测-优快云博客,今天在这里用vs的c++实现Qt的简单界面设计,qt在vs的环境配置可以看我的另一篇博客9.8 Visual Studio 2022安装Qt 和安装graphic-优快云博客。

2025-03-02 12:47:31 1087

原创 9.8 Visual Studio 2022安装Qt 和安装graphic

点击扩展-QT VS Tools-Qt Versions,然后点击右侧绿色加号,选择QT的安装目录。然后双击这个文件,如果没有注册账户,需要用自己的邮箱注册账户,然后根据提示操作即可。至此,在visual studio 2022中安装QT完毕。再在右边QT右边有个“在浏览器中查看”,打开后出现如下画面。添加完毕之后点击确定,这时候我们重新创建QT项目测试一下。安装之后,进入到vs主界面,我们发现扩展菜单中多了一行。然后双击该文件,依次点击直到安装完成即可。这里作为笔记用,也很重要。单击“下载EasyX”

2025-03-01 12:44:55 1217

原创 1_4.最大括号深度(python)

代码很简单,直接看代码就可以了解思路。数字 8 在嵌套的 3 层括号中。数字 3 在嵌套的 3 层括号中。嵌套深度是嵌套括号的。

2025-02-28 14:47:24 199

原创 1_3. 跳格子2_动态规划(python)

动态规划算法会对每一个子问题只计算一次,然后将其计算结果保存在一个表格中,当再次需要计算已经计算过的子问题时,只是在表格中简单地查看一下结果,从而获得较高的效率。动态规划算法解决了“子问题重叠性质”问题,子问题重叠性质是指在用递归算法自顶向下对问题进行求解时,每次产生的子问题并不总是新问题,有些子问题会被重复计算多次。小明和朋友玩跳格子游戏,有n个连续格子组成的圆圈,每个格子有不同的分数,小朋友可以选择从任意格子起跳,但是不能跳连续的格子,不能回头跳,也不能超过一圈。输出能够得到的最高分,比如:3。

2025-02-23 15:12:10 374

原创 1_2 流浪地球(python)

发动机启动的方式分为“手动启动”和“关联启动”两种方式如果在时刻1一个发动机被启动,下一个时刻 2与之相邻的两个发动机就会被“关联启动”。如果准备启动某个发动机时,它已经被启动了,则什么都不用做。发动机0与发动机 N-1是相邻的。流浪地球计划在赤道上均匀部署了N个转向发动机,按位置顺序编号为0~N-1。N 代表部署发动机的总个数,E 代表计划手动启动的发动机总个数。T 代表发动机的手动启动时刻,P 代表此发动机的位置编号。的思路,代码也是,这里作为笔记用。N 代表最后被启动的发动机个数。

2025-02-23 14:32:08 389

原创 9.回文数(python)

将输入转换为字符串,然后比较字符串的前半部分与后半部分反转,若相同,则返回true,否则返回false.从左向右读, 为 -121。从右向左读, 为 121-。因此它不是一个回文数。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。从右向左读, 为 01。因此它不是一个回文数。是一个回文整数,返回。

2025-02-22 17:22:20 279

原创 4. designer建立关于目标检测的简单界面(python)

首先建立的界面效果如下:以上界面中,检测图1是yolov8模型检测得到的图片显示,检测图2是deeplabv3模型检测处理后得到的图片;下面检测数量是两个模型分别检测到的目标数量(图片中人的个数);右上角的相同是指两个模型的检测数量是否相同,若相同则显示"true",否则显示“false”。下面简单介绍该功能实现的步骤。

2025-02-22 16:17:48 1278

原创 7.整数反转

思路:1.先将整数转换为字符串,再反转字符串,循环字符串的第一位,若第一位是“0”时则裁剪掉,直到第一位不是0为止。3.整数为负值时,对其绝对值做步骤1的操作,最后转回整数后乘以-1即可。2.绝对值小于10的整数返回整数本身。如果反转后整数超过 32 位的有符号整数的范围。给你一个 32 位的有符号整数。中的数字部分反转后的结果。外的整数单独返回为0.

2025-02-21 15:11:46 472 1

原创 6.z字形变换(python)

如3行时,我们建立一个数组res,数组包含3个“”元素,则在遍历s = "PAYPALISHIRING"的过程中,对res根据index依次由前到后和由后到前的加入s的元素,最后再把res的各元素拼接即可。,以从上往下、从左到右进行 Z 字形排列。

2025-02-21 14:25:04 529 1

原创 5.最长回文字(python)

结合代码看解题思路,代码已经注明解题思路。"aba" 同样是符合题意的答案。中最长的 回文 子串。

2025-02-20 17:38:38 279

原创 3.1 actor基本框架(c#的Akka.Actor模式)

Actor A:完成任务后发送消息给Actor B。Actor B:接收到消息后执行自己的任务。// Actor A// 模拟任务完成// 模拟耗时操作// 通知 Actor B});// Actor B// 模拟任务完成// 模拟耗时操作});//创建 ActorSystem// 创建 Actor B// 创建 Actor A,并传入 Actor B 的引用// 触发 Actor A 开始工作。

2025-02-20 15:20:52 546

原创 3.actor模型的基本搭建(c#代码)

本文看了博客,这里作为笔记用,该博客内容写的很详细,这里基本上没有改动。

2025-02-19 17:55:44 513 1

原创 11.1 yolov8模型自制数据集

本文是看了博客,没有抄袭的意思,这里主要作为笔记用。

2025-02-18 10:28:23 1864 1

原创 1_1. 二维数组

2.遍历字典,若len(dic["value"] == 1],nums2[i][j] = -1若长度大于1,则遍历dic["value"],求每个(i, j)与其他(i, j)的最小距离mindistance,得到nums2[i][j] = mindistance。需要为数组中的每个元素找到距离最近的、值相等的元素,并计算它们的坐标差值之和。若某个元素没有值相等的元素,则返回-1。1.用字典将值相同的坐标放在一起 dic = { “value": [(i, j), (l, m) ,......]}

2025-02-16 14:16:19 289 1

原创 12. c++调用类对象和结构体

这里主要了解如何引用类对象和this的含义,具体可以看。这里主要了解如何引用类对象和this的含义,具体可以看。

2025-02-12 14:35:02 317 1

原创 2.基于transformer的语言模型(python)

该模型看了别人的博客,是谁的忘记了,这里只是作为笔记用(transform和注意力机制的原理后续有时间了会结合代码详细解释,在这里先上训练和预测代码)。

2025-02-11 14:01:36 236 1

原创 1.Deepseekv3论文的部分解释

1. DeepSeek-V3是一个强大的专家混合 (MoE) 语言模型,总共有 671B 个参数,每个令牌激活了 37B。2. DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构,实现了高效的推理和具有成本效益的训练。3. DeepSeek-V3 开创了一种用于负载均衡的辅助无损策略,目的是最大限度地减少鼓励负载均衡对模型性能的不利影响。并设定了多标记预测训练目标以获得更强的评估基准的整体性能。

2025-02-07 17:32:01 1086

原创 4.寻找两个正序数组的中位数

合并数组 = [1,2,3,4] ,中位数 (2 + 3) / 2 = 2.5。合并数组 = [1,2,3] ,中位数 2。请你找出并返回这两个正序数组的。的正序(从小到大)数组。算法的时间复杂度应该为。

2025-02-06 18:00:07 178

原创 11.八叉树的创建

(Octree)是一种空间分割数据结构,用于在三维空间中对对象进行高效的存储和查询。的扩展,将三维空间划分为八个相等大小的子立方体(八个子节点),每个。可以进一步细分为八个子节点,以此类推。

2025-02-06 17:05:28 319

原创 3.无重复字的最长字串(python和c++)

(2)如果地产dic中有s[i],说明temp中有s[i],这时候对temp进行从头遍历删除temp的元素和dic的键,直到删除到遇到s[i]这个元素和dic的键(遍历的是temp而不是dic),并刚好将该元素删除为止.(1)比较temp的长度与outs的大小,若outs小于temp的长度,则outs = temp的长度;,请你找出其中不含有重复字符的。请注意,你的答案必须是。因为无重复字符的最长子串是。因为无重复字符的最长子串是。因为无重复字符的最长子串是。,所以其长度为 3。,所以其长度为 3。

2025-01-24 11:11:44 409

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除