自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 资源 (1)
  • 收藏
  • 关注

原创 vscode中找不到某个文件夹,但终端中能查到(非files.exclude的问题)

因此我猜测是工作区的问题,因为今早突发奇想偷懒打开了以前的工作区,发现有一整个子文件夹都没了,但其他的都有。于是关了vscode重新开重新配置工作区就好了。stackoverflow说是vscode默认启用.gitignore的原因,我得到的教训是以后不要突发奇想了。如题,查过files.exclude,没有问题。在stackoverflow上查到。遇到了同样的问题,但是提问者提到,只有之前打开过这个文件,才会在工作区中显示。

2024-06-24 11:15:45 671

原创 zip文件上传到linux服务器文件大小发生变化

再在服务器上使用md5sum,同样得到1dcd3bd5884bcc1fce2951bf7c909275,文件解压也没有问题,因此就是在上传过程中进行了一次额外的压缩。在传一个文件到服务器的时候,第一次传完看见大小不一样(服务器中du命令查看大小796596MB)就重传了一下,还是大小不一样,就查了下。感觉应该是因为ftp协议额外压缩了文件,因此用md5进行校验。在macos上打开终端。

2024-06-20 12:08:53 456

原创 长文预警:九头蛇的进化——Tesla AutoPilot 纯视觉方案解析

Tesla AutoPilot 纯视觉方案解析

2024-06-07 18:05:14 1112

原创 长文预警:自动驾驶の核燃料库!Tesla数据标注系统解析

Tesla的数据标注系统解析

2024-06-07 17:49:37 1381

原创 RMS归一化

比较简单但是没听过,记录一下。

2024-05-30 18:15:40 1941

原创 激光雷达技术详解:机械式、半固态(MEMS)和固态激光雷达(Flash)

激光雷达(LiDAR)是一种通过发射激光脉冲并测量其返回时间(飞行时间,ToF)来计算目标距离的传感技术。激光雷达广泛应用于自动驾驶、机器人、工业自动化等领域。本文将详细介绍机械式激光雷达、半固态激光雷达和固态激光雷达的区别及其实现原理。

2024-05-30 18:10:51 6344 1

原创 Tesla Occupancy 网络和 Voxel 方法的区别

Occupancy 网络和 Voxel 方法在三维表示和重建中各有优缺点。Occupancy 网络具有高分辨率、高效表示和灵活性强的优势,而 Voxel 方法则简单直观、适用广泛。Occupancy 网络不限制其空间表示单位的大小,可以在任意精度下进行预测和建模。在实际应用中,可以根据具体需求选择合适的方法。版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

2024-05-30 17:12:04 1006

原创 自动驾驶中的长尾问题

长尾问题(Long-Tail Problem)是指在数据分布中,大部分的数据集中在少数类别上,而剩下的大多数类别却只有少量的数据。这种数据分布不平衡的现象在许多实际应用中广泛存在,特别是在自动驾驶领域。在自动驾驶中,长尾问题意味着车辆在大多数情况下会遇到常见的驾驶场景和物体,如普通车辆、行人、交通信号灯等,而一些不常见的、极端的驾驶情况和物体则很少出现。异常交通行为(如逆行车辆)稀有的物体(如路上的动物、飞行的无人机)极端天气条件(如暴雪、暴雨、沙尘暴)复杂的道路环境(如施工区、狭窄巷道)

2024-05-30 17:05:31 2486

原创 DINOv2中的Sinkhorn-Knopp,收敛原理以及EMD距离

对于矩阵MMM,目标是找到一个矩阵PPP矩阵PPP的行和等于向量uuu。矩阵PPP的列和等于向量vvv。PPnp.outerusumPaxis1Pnp.outerusumPaxis1))P​PPnp.outersumPaxis0vPnp.outersumPaxis0vP​EMD 距离,又叫做推土机距离,也叫作 Wasserstein 距离。

2024-05-30 12:10:29 2764

原创 DINO结构中的exponential moving average (ema)和stop-gradient (sg)

在 DINO 中,教师和学生网络分别预测一个一维的嵌入。为了训练学生模型,我们需要选取一个损失函数,不断地让学生的输出向教师的输出靠近。softmax 结合交叉熵损失函数是一种常用的做法,来让学生模型的输出与教师模型的输出匹配。具体地,通过 softmax 函数把教师和学生的嵌入向量尺度压缩到 0 到 1 之间,并计算两个向量的交叉熵损失。这样,在训练过程中,学生模型可以通过模仿教师模型的输出来学习更好的特征表示,从而提高模型的性能和泛化能力。

2024-05-28 19:10:34 2395

原创 DINO中为什么教师模型用大图,学生模型用小图

在 DINO(可以理解为由DIstillation和NO labels的缩写)中,使用不同的图像裁剪策略对教师模型和学生模型进行训练有其特定的原因。具体来说,教师模型使用大图(global views),学生模型则同时使用大图(global views)和小图(local views)。

2024-05-28 18:39:22 527

原创 BEVFusion中特征融合模块是如何应用通道注意力机制的?

在这里融合模块其实可以一定程度上体现 BEVFusion 的作者在 Motivation中阐述的一个想法,那就是点云和图像是没有主次之分的,

2024-05-24 18:16:44 999

原创 空间注意力、通道注意力、混合注意力和 Self-Attention

空间注意力:关注特征图的空间位置。CBAM通道注意力:关注特征图的通道信息。混合注意力:结合空间和通道注意力。CBAM:在全局范围内建模元素之间的关系,广泛应用于 Transformer 模型。每种注意力机制都有其独特的优势和应用场景,根据具体需求可以选择合适的注意力机制以提升模型性能。

2024-05-24 17:54:32 1752

原创 PointPillars, CenterPoint,和TransFusion

例如,PointPillars 在实时性要求较高的场景中表现出色,而 TransFusion 在复杂场景下能够提供更高的检测精度。其核心思想是将稀疏的点云数据转换为规则的柱状结构,从而使得 2D 卷积神经网络(CNN)能够处理这些数据。它利用 Transformer 的强大特征建模能力来提升点云数据的特征表达。:结合了 Transformer 的优势,能够在点云数据中捕捉更长程的依赖关系,从而提升检测的准确性和鲁棒性。:通过中心点检测,能够更加精准地定位物体,尤其适用于稠密场景下的多目标检测。

2024-05-24 17:50:28 539

原创 BEVFusion的相机工作流中,图像编码之后FPN+ADP网络的作用

FPN+ADP的作用

2024-05-23 18:14:18 580

原创 2D-3D 转换中,为什么世界坐标要扩充成四维, 图像坐标要扩充成三维?

在计算机视觉和图形学中,将世界坐标扩充成四维,以及图像坐标扩充成三维,是为了便于运用齐次坐标(homogeneous coordinates)进行坐标变换。这样的做法简化了投影变换的数学表示和计算,特别是在三维场景和二维图像间的转换中。

2024-05-11 14:39:12 960

原创 2022.3引用报错requires TensorBoard with Python summary writer installed. available in 1.14

原引用from torch.utils.tensorboard import SummaryWriter。torch.utils.tensorboard.writer或tensorboard都不行。已经正确安装tensorboard2.10和future, 能够排除是版本问题。答案是需要另外安装tensorboardX。此外,实测把引用改为。

2023-02-20 10:51:30 206

原创 Android开发笔记1:Android Studio 2021.3.1.17 Toolbar工具栏调整

设置好之后可以看到完整的工具栏。并且我直接把导航栏扔了。旧版直接会显示,新版在appearance里。不同版本的调整方式不同,但都在view里。

2022-11-21 21:50:17 1397 3

原创 2022/10语音识别大作业:基于HMM(隐马尔可夫模型)的Matlab孤立数字语音识别

支持自己录制音频训练自己的模型

2022-10-17 02:48:15 2019 10

原创 2022/7 用python批量将.mat文件转为.jpg/.png/.bmp格式图片

2022/7 用python批量将.mat文件转为.jpg/.png/.bmp格式图片

2022-07-06 11:43:30 5139 27

原创 周志华机器学习第八到第十四章考纲

周志华机器学习第八到第十四章考纲

2022-06-23 22:29:02 323

原创 周志华《机器学习》第十章复习(带例题)

老师让我帮他出卷,就自己做了细纲出了点题。可以参考着复习。

2022-06-23 22:24:42 1498

原创 周志华《机器学习》第九章复习(带例题)

老师让我帮他出卷,就自己做了细纲出了点题。可以参考着复习。

2022-06-23 22:20:42 1298

原创 周志华《机器学习》第八章复习(带例题)

老师让我帮他出卷哈,就自己做了细纲出了点题。可以参考着复习。

2022-06-23 22:09:50 1161

原创 用python和flask框架写MongoDB数据库网页(通院大三软件设计)运营商信息管理系统(5)优化

以下是我做的优化,更多的可以自己去bootstrap官网去查,想要什么就自己改。实在不会的话我也接代做,500一个,不过你都看到这了应该就不用了吧。简介 - Bootstrap框架我应该没有漏什么,整个的源代码可以私信问我要。其他东西的优化比较繁琐,分了不少文件,说不清。还是直接拿走文件的好。功能优化与UI优化在查询中做了智能聚合查询,输入手机号、姓名、身份证号都可以查到2、异地操作:与主机保持同一网络环境即可远程登录,所提供的修改会返回至数据库UI优化..

2022-05-07 17:16:08 489 3

原创 用python和flask框架写MongoDB数据库网页(通院大三软件设计)运营商信息管理系统(4)修改成依赖于mongodb(增删改查)操作的网页

希望你已经看完了这个视频并自己动手做过一遍了。​​​​​​web版学生信息后台管理系统(Python+flask框架+Bootstrap5)期末毕设必备_哔哩哔哩_bilibili如果没有,我诚挚的建议你去看完再回来。由于我做的时候没有留基础版,所以代码都是进阶版,但是进阶主要都在外观上,所以对功能没什么影响,应该也不影响理解,因为大多都是模板。除了我做的“高级功能聚合查找”。后面会讲到。接下来我会把增删改查部分的函数如何改用mongodb操作完成讲掉,至于更高级的功能改进(比如登录验证之类

2022-05-07 17:06:49 1548 4

原创 用python和flask框架写MongoDB数据库网页(通院大三软件设计)运营商信息管理系统(3)连接数据库和第一个网页

从这篇文章开始将会对我的题目进行讲解1 连接数据库如果你是按照我前面发的文章配置的mongodb的环境,那mongodb应该是自动启动的。不用点两个配置文件启动。打开studio3t,connect——new connection——起个名(这步之前好像做过,已经做好可以跳过)点下面那个testconnection ,如果没问题的话那就没问题,有问题的话肯定前面出错了,环境没配置好之类。可以去看之前发的。好了点save,你就新建了一个localhost:我这边有这么...

2022-05-07 16:35:01 1803

原创 用python和flask框架写MongoDB数据库网页(通院大三软件设计)运营商信息管理系统(1)环境配置

两周的软件设计结束,也该做个总结了,可谓是折磨,所幸结果是极好的。老师会建议用java,但是事实是班里最后用java做出web的全是买的代做,价格500-1000不等。我应该会多分几篇文章把它写完。会贴出大部分源代码,剩下的代码可以私信直接问我要整个压缩包,不收费,点赞就行。绝大多数人的题目都可以根据这一份改。如果足够幸运够早看到这篇的话,三天就能把网页改的很符合你的心意了。学习路线我也会在后面的文章给出。这篇会先讲环境配置之类的。老师给的vue、eclipse和汤姆猫可以不装,用不上。给个登录

2022-05-07 15:06:50 2349 3

原创 用python和flask框架写MongoDB数据库网页(通院大三软件设计)运营商信息管理系统(2)需求分析

上一节已经讲完了环境配置,接下来的内容就与题目有关了。本节会先进行需求分析。先进行需求分析然后才知道你想要的是什么。我的题目: 设计题目 运营商信息系统 任务要求 任务:模拟运营商信息系统,写一个客户账单查询系统 要求:能够通过一门语言来操作MongoDB数据库,要求建立一个项目,有完整的项目需求和功能设计,通过编码实现该项目应用,项目语言不限,推荐使用Java、python等语言。对上述软件项目都要求写出需求分析、总

2022-05-07 14:43:40 873

原创 MongoDB软件设计(一) 万事开头难

软件设计周。第一次接触数据库,第一次接触java,煎熬。又梦回大一装VS了,上一次这么痛苦是搭tensorflow和pytorch的环境。人学着学者着就会发现自己其实什么都不会。今天的任务主要是安装各种所需的软件,并配置环境。比较叛逆,基本没怎么用老师给的软件版本,主要是不喜欢太过时的UI。列个目录,并记录一下帮助比较大的博客。目录MongoDB安装注意:MongoVUEJAVA 安装然后是Eclipse安装Eclipse汉化Tomcat安装细枝.

2022-04-18 23:42:04 824 2

原创 Tomcat安装(给出了安装包)和绑定Eclipse,以及报错:“Cannot locate document”的处理

本文来源于老师给出的文档,加粗部分为Tomcat所需。 安装Tomcat 环境背景:Windows和已安装的JDK8.0(JDK1.8)、Mysqlapache-tomcat-8.0.53-windows-x64.zip解压到:C:\tools\tool\apache-tomcat-8.0.53,路径可自己定,这个是免安装版,也有可安装版的。安装版的不需要手动设置环境变量境。apache-tomcat-8.0.53-windows-x64.zip版本需要自己设置环境变量。下面是我的

2022-04-18 23:39:11 2609 1

原创 2022/4 Eclipse设置中文(不用翻墙)

1.打开浏览器找到语言包下载地址。点击Eclipse Babel Project Downloads | The Eclipse Foundation找到最新的语言包,复制第二行网址。选最新的基本不用考虑兼容,哪怕是22/3版本的eclipse也可以用21年的语言包(只是有一小部分翻译不过来)。22年看到这篇文章的可以直接复制下面这个https://download.eclipse.org/technology/babel/update-site/R0.19.2/2021-12/2.打

2022-04-18 17:19:21 7958 19

翻译 深度学习正在碰壁:人工智能需要什么才能取得真正的进步?

原文链接Deep Learning Is Hitting a Wall - Nautilus | Science Connectedhttps://nautil.us/deep-learning-is-hitting-a-wall-14467/GARY MARCUSMarch 10, 2022在 2016 年多伦多举行的一场人工智能会议上,深度学习“教父” Geoffrey Hinton 曾说过,“如果你是一名放射科医生,那么你的处境就像一只已身在悬崖边缘却毫不自知的郊狼。”他认为,深度学习非常

2022-04-07 15:19:46 232

原创 机器学习西瓜书第十一章答案11.3,11.4

这两种算法都是常见的随机算法,但在思路和目的上存在区别详情可以移步:蒙特卡罗算法与拉斯维加斯算法 (西瓜书第十一章11.4题补充)

2022-04-06 23:52:03 1335 2

原创 随机算法优缺点

随机算法的优缺点优点:1、简单性:通常非常容易实现(Usually very easy to implement)2、性能:通常以高概率产生(接近)最佳解决方案(Usually produce (near-) optimum solutions with high probability)缺点:1、以有限的概率得到错误的答案(Getting a wrong answer with a finite probability.)解决方案:重复算法2、难以分析运行时间和获得错误解决方案的概率

2022-04-06 20:47:01 2977

原创 蒙特卡罗算法与拉斯维加斯算法 (西瓜书第十一章11.4题补充)

书上侧边栏给出了关于蒙特卡罗方法和拉斯维加斯方法的提示:拉斯维加斯方法和蒙特卡罗方法是两个以著名赌城名字命名的随机化方法两者的主要区别是:若有时间限制,以拉斯维加斯方法或者给出满足要求的解,或者不给出解,而蒙特卡罗方法一定会给出解,虽然给出的解未必满足要求;若无时间限制,则两者都能给出满足要求的解.蒙特卡罗算法与拉斯维加斯算法都是随机算法,在采样不全时,通常不能保证找到最优解,只能说是尽量找。那么根据怎么个“尽量”法儿,我们我们把随机算法分成两类:蒙特卡罗算法:采样越多,越接近最优解;(强调每一

2022-04-06 20:38:27 1152

原创 InvalidArgumentError: You must feed a value for placeholder tensor ‘conv2d_12_input‘ with dtype floa

在jupyter notebook中如果重复运行某一cell可能会出现这个错误;点右边这个重启服务就可以,不是大事。

2022-02-04 19:29:37 408

原创 No module named ‘torchsummary‘报错解决

输出模型数据的一个模块,很奇怪在conda里是没有这个包的,只能pip安装。此外在vscode的控制终端里安装也会失败,因为vscode检查是否有这个包会检查全局,而不是当前环境。因此还是要打开原始的控制台。pip install torchsummary再运行就可以啦...

2021-10-28 22:44:29 7508 7

原创 cv2.imwrite()保存图像是黑色(偶现)

纯黑意味着图片的各项值都很小是因为前面imread之后一般会把读取的图像除255做一次归一化便于处理img_f = img / 255.0因此在imwrite的时候要做一次反归一化,*255即可cv2.imwrite( 'fogged_photo'+'/'+filename, img_f*255)...

2021-10-25 20:43:46 5645 2

原创 Python用cv2图像处理基础操作imread、imwrite、imshow、flip、copy

1. 读取图片使用函数cv2.imread(filepath,flags)读入一副图片filepath:要读入图片的完整路径flags:图片标志cv2.IMREAD_COLOR:默认参数,读入一副彩色图片,忽略alpha通道cv2.IMREAD_GRAYSCALE:读入灰度图片cv2.IMREAD_UNCHANGED:顾名思义,读入完整图片,包括alpha通道 import numpy as npimport cv2img1 = cv2.imread('1.jpg',cv2

2021-10-25 18:42:37 3589 1

JD用户购买预测数据.txt

JD用户购买预测数据比赛数据

2021-05-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除