- 博客(17)
- 收藏
- 关注
原创 从零开始的三维重建(五)——单视图测量
首先我们面对的就是单视图测量的问题。常理来说我们进行三维重建是需要多个视角的摄像机得到的图片的,但在一些特殊情况下,我们也可以通过单一视角完成对于图片的三维重建,这就需要我们用到有关无穷远的知识。
2025-03-30 13:30:00
768
原创 从零开始的三维重建(四)——相机标定(补充)
好的本节内容中我们彻底把相机标定剩余的最后一点尾巴说完了,本节内容中我们对SVD的由来和求解进行了一些补充说明,也是因为在这个地方SVD的求解用的频率过多,感觉不说一下的话不容易讲明白,然后有关畸形的相机标定也是相机标定内容中最后一点补充部分,这部分结束以后,下个部分我们将正式开始进行三维重建。Okk,那我们下期再见,拜拜。
2025-03-25 10:30:00
1565
原创 从零开始的三维重建(三)—— 相机标定(下)
我们已经可以实现通过现实世界和像素平面中6对以上的点,通过计算SVD奇异值分解,得到投影矩阵M,再根据ρM=K[R T]具体计算出12个参数的值(内参数5个、外参数6个、还有一个ρ),值得注意的是,我们选点的时候6对点不要选取在三维世界中同一个平面上的点,这样会导致不同点之间存在线性关系,导致数据退化,无法求解。
2025-03-20 10:30:00
946
原创 leetcode(力扣)挑战五,最长回文子串
这次代码真的很短,主要是因为我们采取了一个字符串的黑科技操作,我们使用s[i:i+j][::-1]成功获取了s[i:i+j]字符串的倒序形式。这极大地简化了我们对于字符串回文形式的处理,直接对每种可能输出的字符串进行遍历然后通过和他们自身的回文形式进行对比,如果完全一直就输出比长短,选取最长的一个作为结果就完成了。还是那句话,我只关心怎么解决问题,对优化没兴趣,如果各位有更好的方法可以提出来我再补充。
2025-03-07 14:22:52
90
原创 从零开始的三维重建(二)—— 相机标定(上)
如果说矩阵变换是三维重建中的数学基础,那么相机标定就是三维重建实际操作中的应用基础。我们在解决单视图重建、MVS、SFM、SLAM等问题时相机标定是必要的一步。简单来说,相机标定就是要把我们在正常三维世界下的坐标转换成为相机坐标,从而进行进一步的计算,没有这一步我们就无法获得物体在三维世界中的信息。当然如果是我们想进行三维重建的话,正常来说应该是做逆运算,从相机坐标还原到世界坐标。
2025-03-07 13:30:00
1008
原创 从零开始的三维重建(一)—— 矩阵变换
想了很久应该从哪里开始说这三维重建的故事,其实最早人们都是用一些类似几何变换和投影技术来实现三维物体的重建,后来才逐渐有了光栅化、点云、网格等等表示方式,再到现在基于计算机算力的高速发展,又有了基于神经网络的种种方法。随便哪个挑出来说都是很长的一期。三维重建本身就是一个囊括了计算机视觉、计算机图形学、图像处理等多个领域的工作,因此想了很久以后我决定先从矩阵的变换开始说起。因为无论是三维空间中物体的变换还是相机标定等等,包括后期的算法都是从一开始的矩阵变换开始的,因此打好一开始矩阵变换的基础我想才是最重要的。
2025-02-28 09:30:00
764
原创 leetcode(力扣)挑战三,无重复字符的最长子串
简单说一下,就是我们设置了一个检测是否重复的特殊值,然后对于输入字符串,我们采用类似冒泡排序的方法进行重复检测,在每一次冒泡排序中,我们都对已经得到的字符串和下一个排序要用到的字符进行重复检测,如果重复就break并记录下来和已有的字符串进行长度比较,如果不重复就将该字符加入到字符串然后对下一个字符进行重复检测,直到所有的字符串组合全部检测完,最后保留的就是最长的不重复字符串。
2025-02-13 23:58:20
105
原创 基于pytorch的DCGAN代码演练(DCGAN原论文复现)
而GANs真正的应用则是在之后的DCGAN(Deep Convolutional GAN),由Alec Radford等人在2015年的论文《Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks》中提出,是GAN的改进版本,首次将卷积神经网络(CNN)成功引入GAN框架,显著提升了生成图像的质量和稳定性。这次我们就根据论文原文的描述来复现论文模型,进行DCGAN的代码演练。
2025-02-13 10:00:00
1159
原创 读个论文(二)—— Generative Adversarial Nets
一个判别模型,学习确定样本是来自模型分布还是数据分布。生成模型可以被认为类似于一个伪造者团队,试图生产假币并在不被检测的情况下使用它,而判别模型类似于警察,试图检测假币。这个游戏中的竞争促使两队改进他们的方法,直到假冒商品与正品无法区分。
2025-02-05 10:00:00
1011
原创 读个论文(一)—— 3D Representation Methods: A Survey
这是一篇三维表示方法领域的综述,介绍了体素网格、点云、SDF、NeRF、3D Gaussian Splatting、Tri-Plane、DMTet等方法,和一些数据集,以及未来可能的发展方向
2025-01-09 09:00:00
1114
原创 基于pytorch对mnist数据集进行图片分类训练(一)
我们使用GPU进行训练,其中batch_size、epochs的大小可以自己规定,之后我们定义训练模型,先用最基础的LeNet-4模型,根据MNIST数据集特点我们知道每张图片大小均为28*28。(当然我不是说这个模型好,这个模型里面各种参数啥的都可以调整,而且也有很多我看着不顺眼的地方,但就是为了尊重这个模型,所以维持了模型原貌,还有就是理论上我们应该分为训练集、验证集、测试集,但这个数据集也没有给这个区分,我也就没有再调整,直接就是一个训练,之后可能会给出优化版本)
2024-12-30 16:15:01
1030
原创 leetcode(力扣)挑战二,两数相加
这里我暂定了输入数组的长度,这个长度可以看自己心情改或者优化一下。当然题目要求用链表,我猜可能是要用list的意思(我觉得python用链表解决这个问题真没必要而且示例给的也是数组的样子)。还是那句话,我只关心怎么解决问题,对优化没兴趣,如果各位有更好的方法可以提出来我再补充。
2024-12-03 22:47:52
281
原创 leetcode(力扣)挑战一,两数之和
这里我暂定了输入数组中包含的数字数量为4,这个数量可以根据具体情况做出调整,并且这里也没考虑是不是一定有答案以及算法优化等问题,毕竟从我个人出发,我并不关心如何优化,我只关心能解决出来问题就可以,如果各位有更好的优化方法,我可以另外进行补充。
2024-12-03 04:59:07
235
原创 Python爬虫讲解及示范代码——多个url下的多种目标信息
简单概括一下,Python爬虫是一种自动化抓取网页内容的程序,它通过模拟浏览器行为,向服务器,并从中有用的信息。当然这是比较笼统的概括方式,就我个人理解而言,我们可以形象化地理解为,爬虫就好像是我们一次一次输入不同的网址,在对应的网址中找到对应的信息记录下来,然后重复这个操作直到所有网址全部搜索完毕。具体到Python代码中,就涉及到发送请求,解析网址,检索标签等步骤。
2024-11-29 10:00:00
908
人工智能+RVC+进击的巨人三笠训练人声模型+AI变声
2025-02-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人