自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 从零开始的三维重建(五)——单视图测量

首先我们面对的就是单视图测量的问题。常理来说我们进行三维重建是需要多个视角的摄像机得到的图片的,但在一些特殊情况下,我们也可以通过单一视角完成对于图片的三维重建,这就需要我们用到有关无穷远的知识。

2025-03-30 13:30:00 768

原创 从零开始的三维重建(四)——相机标定(补充)

好的本节内容中我们彻底把相机标定剩余的最后一点尾巴说完了,本节内容中我们对SVD的由来和求解进行了一些补充说明,也是因为在这个地方SVD的求解用的频率过多,感觉不说一下的话不容易讲明白,然后有关畸形的相机标定也是相机标定内容中最后一点补充部分,这部分结束以后,下个部分我们将正式开始进行三维重建。Okk,那我们下期再见,拜拜。

2025-03-25 10:30:00 1565

原创 从零开始的三维重建(三)—— 相机标定(下)

我们已经可以实现通过现实世界和像素平面中6对以上的点,通过计算SVD奇异值分解,得到投影矩阵M,再根据ρM=K[R T]具体计算出12个参数的值(内参数5个、外参数6个、还有一个ρ),值得注意的是,我们选点的时候6对点不要选取在三维世界中同一个平面上的点,这样会导致不同点之间存在线性关系,导致数据退化,无法求解。

2025-03-20 10:30:00 946

原创 leetcode(力扣)挑战五,最长回文子串

这次代码真的很短,主要是因为我们采取了一个字符串的黑科技操作,我们使用s[i:i+j][::-1]成功获取了s[i:i+j]字符串的倒序形式。这极大地简化了我们对于字符串回文形式的处理,直接对每种可能输出的字符串进行遍历然后通过和他们自身的回文形式进行对比,如果完全一直就输出比长短,选取最长的一个作为结果就完成了。还是那句话,我只关心怎么解决问题,对优化没兴趣,如果各位有更好的方法可以提出来我再补充。

2025-03-07 14:22:52 90

原创 从零开始的三维重建(二)—— 相机标定(上)

如果说矩阵变换是三维重建中的数学基础,那么相机标定就是三维重建实际操作中的应用基础。我们在解决单视图重建、MVS、SFM、SLAM等问题时相机标定是必要的一步。简单来说,相机标定就是要把我们在正常三维世界下的坐标转换成为相机坐标,从而进行进一步的计算,没有这一步我们就无法获得物体在三维世界中的信息。当然如果是我们想进行三维重建的话,正常来说应该是做逆运算,从相机坐标还原到世界坐标。

2025-03-07 13:30:00 1008

原创 从零开始的三维重建(一)—— 矩阵变换

想了很久应该从哪里开始说这三维重建的故事,其实最早人们都是用一些类似几何变换和投影技术来实现三维物体的重建,后来才逐渐有了光栅化、点云、网格等等表示方式,再到现在基于计算机算力的高速发展,又有了基于神经网络的种种方法。随便哪个挑出来说都是很长的一期。三维重建本身就是一个囊括了计算机视觉、计算机图形学、图像处理等多个领域的工作,因此想了很久以后我决定先从矩阵的变换开始说起。因为无论是三维空间中物体的变换还是相机标定等等,包括后期的算法都是从一开始的矩阵变换开始的,因此打好一开始矩阵变换的基础我想才是最重要的。

2025-02-28 09:30:00 764

原创 leetcode(力扣)挑战三,无重复字符的最长子串

简单说一下,就是我们设置了一个检测是否重复的特殊值,然后对于输入字符串,我们采用类似冒泡排序的方法进行重复检测,在每一次冒泡排序中,我们都对已经得到的字符串和下一个排序要用到的字符进行重复检测,如果重复就break并记录下来和已有的字符串进行长度比较,如果不重复就将该字符加入到字符串然后对下一个字符进行重复检测,直到所有的字符串组合全部检测完,最后保留的就是最长的不重复字符串。

2025-02-13 23:58:20 105

原创 基于pytorch的DCGAN代码演练(DCGAN原论文复现)

而GANs真正的应用则是在之后的DCGAN(Deep Convolutional GAN),由Alec Radford等人在2015年的论文《Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks》中提出,是GAN的改进版本,首次将卷积神经网络(CNN)成功引入GAN框架,显著提升了生成图像的质量和稳定性。这次我们就根据论文原文的描述来复现论文模型,进行DCGAN的代码演练。

2025-02-13 10:00:00 1159

原创 读个论文(二)—— Generative Adversarial Nets

一个判别模型,学习确定样本是来自模型分布还是数据分布。生成模型可以被认为类似于一个伪造者团队,试图生产假币并在不被检测的情况下使用它,而判别模型类似于警察,试图检测假币。这个游戏中的竞争促使两队改进他们的方法,直到假冒商品与正品无法区分。

2025-02-05 10:00:00 1011

原创 读个论文(一)—— 3D Representation Methods: A Survey

这是一篇三维表示方法领域的综述,介绍了体素网格、点云、SDF、NeRF、3D Gaussian Splatting、Tri-Plane、DMTet等方法,和一些数据集,以及未来可能的发展方向

2025-01-09 09:00:00 1114

原创 基于pytorch对mnist数据集进行图片分类训练(一)

我们使用GPU进行训练,其中batch_size、epochs的大小可以自己规定,之后我们定义训练模型,先用最基础的LeNet-4模型,根据MNIST数据集特点我们知道每张图片大小均为28*28。(当然我不是说这个模型好,这个模型里面各种参数啥的都可以调整,而且也有很多我看着不顺眼的地方,但就是为了尊重这个模型,所以维持了模型原貌,还有就是理论上我们应该分为训练集、验证集、测试集,但这个数据集也没有给这个区分,我也就没有再调整,直接就是一个训练,之后可能会给出优化版本)

2024-12-30 16:15:01 1030

原创 leetcode(力扣)挑战二,两数相加

这里我暂定了输入数组的长度,这个长度可以看自己心情改或者优化一下。当然题目要求用链表,我猜可能是要用list的意思(我觉得python用链表解决这个问题真没必要而且示例给的也是数组的样子)。还是那句话,我只关心怎么解决问题,对优化没兴趣,如果各位有更好的方法可以提出来我再补充。

2024-12-03 22:47:52 281

原创 leetcode(力扣)挑战一,两数之和

这里我暂定了输入数组中包含的数字数量为4,这个数量可以根据具体情况做出调整,并且这里也没考虑是不是一定有答案以及算法优化等问题,毕竟从我个人出发,我并不关心如何优化,我只关心能解决出来问题就可以,如果各位有更好的优化方法,我可以另外进行补充。

2024-12-03 04:59:07 235

原创 Python爬虫讲解及示范代码——多个url下的多种目标信息

简单概括一下,Python爬虫是一种自动化抓取网页内容的程序,它通过模拟浏览器行为,向服务器,并从中有用的信息。当然这是比较笼统的概括方式,就我个人理解而言,我们可以形象化地理解为,爬虫就好像是我们一次一次输入不同的网址,在对应的网址中找到对应的信息记录下来,然后重复这个操作直到所有网址全部搜索完毕。具体到Python代码中,就涉及到发送请求,解析网址,检索标签等步骤。

2024-11-29 10:00:00 908

原创 基于Python实现3*3井字棋游戏(使用numpy的优化版本)

基于Python的3*3井字棋游戏,使用numpy优化的版本

2024-11-13 01:57:34 336

原创 基于Python实现3*3井字棋游戏

基于Python的3*3井字棋游戏,简单版本

2024-11-11 17:06:00 184

原创 Python代码冒泡排序

输入20个数字,通过冒泡排序得到其中最大的三个数字并输出

2024-11-09 17:24:58 97 1

人工智能+RVC+进击的巨人三笠训练人声模型+AI变声

模型通过RVC1006Nvidia进行训练得到,用途为提供给想通过RVC训练声源的人一个成型的声源,可以大幅度减少训练时间,直接使用模型推理即可,目前只放出了三笠的训练声源,后续还会放出其它的声源,如果有其它的模型需要或者优化也可以跟我说。(因为上传的资源不能太大,所以相比原本训练结果里面删掉了一些训练过程中的模型,但不会影响最终推理的效果) 总共包含四个文件 1.推理音色sanli03.pth文件, 使用时放在RVC1006Nvidia\assets\weights文件夹下 2.特征检索文件夹sanli03,使用时放在RVC1006Nvidia\logs文件夹下 3.一个待处理的音频wav文件, 可以播放试听. 4.一个将待处理音频变声结束后得到的音频wav文件, 也就是最终输出的结果 仅限于学习交流,不可用于商用,不可用于实施违法犯罪活动,如有违反,后果自负!!

2025-02-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除