- 博客(47)
- 资源 (2)
- 收藏
- 关注
原创 [技术总结] C++ 使用经验
const 和 constexpr 有什么区别.const 一般是设置一个只读的属性, 在运行时还有可能通过cast变成一个可修改的. 但是constexpr是告诉编译器这就是一个常亮, 在编译时就可以计算出来然后进行替换.static 修饰的成员函数 & 成员变量static 修饰的成员函数只能访问 static 修饰的成员变量. static 修饰后再所有实例中都是共享的.以 const 修饰成员函数const 修饰的成员函数不能对成员变量进行修改, 但是有个特例就是 mutable
2024-07-21 21:43:32
502
原创 [技术总结]: Pytorch加速和省内存
使用perfectch, pin_memmory, 或者增加worker数。关键在于将data_list序列化。或者使用lmdb数据库也可以。或者使用lmdb数据库。
2024-04-29 11:38:04
679
原创 [Paper Notes]: Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
swin transformer 是基于transformer的视觉骨干网络. 在此之前已经有了ViT, 首个提出用Transformer在视觉领域的论文. 然而ViT没有解决的一个问题是Attention机制用在图像上的计算量大的问题. 对此 swin transformer 提出了一种级联的架构, 配合上shifted windows这种trick实现了新的视觉骨干网络的sota. 其中论文中最重要的也就是 shifted windows这个精巧的设计和实现.可以运行一下, 看看可视化的结果.
2024-04-14 17:19:17
869
原创 【技术总结】常用指标mAP, mIoU, mDice, mFscore, aAcc 实现
mAP 全称是eanveragerecision. 其中 mean 这个操作是在 class 级别上, 因此只需要将所有类别平均即可. 所有需要关注的就是 AP. AP 是 Precision-Recall 曲线和坐标轴围成的面积. 提到曲线可能会感觉比较懵 – 模型的预测对或者不对都是确定的, 哪里来的曲线呢?想要搞明白为什么有曲线, 得看模型的预测结果. 一般来说, 模型在给出类别的预测的时候, 都会有一个置信度p表示属于这一类的概率. 因此我们就可以设定一个阈值t, 如果pt。
2024-03-25 23:37:08
1487
原创 技术总结: 基于http3的动态网页图片爬虫设计
作为一名算法工程师, 收集处理数据的能力也是比较重要的. 能够充分利用好互联网的数据资源, 加上优秀的算法能力, 就如虎添翼. 这次就以著名的 pixabay.com 为例子, 讲解一下如何写一个简单的爬虫程序.
2024-03-21 19:14:04
1504
原创 技术总结: PPT绘图
能绘制好一个好看的示意图非常重要, 在科研和工作中好的示意图能精准表达出自己的想法, 减少沟通的成本, 可视化的呈现也可以加强自身对系统的理解, 时间很久后只需要翻看一次就能get到要点. 因此本篇文章主要记录一下使用PPT绘图的一些要点和技巧.PPT可以让元素之间构建连接关系, 即使移动某个元素, 链接关系也可以保持不变.如上所示, PPT中的元素都有一些吸附点, 可以创建好直线后, 点击直线两端的空心圆, 拖动到吸附点附近, 就会自动吸附.
2024-03-03 23:52:18
1428
原创 【算法思考】端到端实例分割模型 SOLO
总的来说,SOLO这个模型稍微有些复杂,目前在实例分割方面已经有了一些更好的基于transformer的工作,比如mask2former等。SOLO的缺点很明显,其生硬地认为不同的实例中心位置应该不一样,并不适用于某些情况。另外,SOLO在处理不同大小实例的时候不够灵活,不同的分支只能输出固定范围内的实例mask,非常耗费计算力。
2023-10-11 23:21:57
747
1
原创 【实践经验】Latex 表格列间距调整
有时候表格列之间的空白区域很大,超出了页面宽度。这时候如果调整表格列与列之间的间隔,无需调整字体大小就能解决这个问题。注意,需要将以上命令,插入到。
2023-06-04 02:21:07
4196
原创 【实践经验】PPT导出SVG格式通过Inkscape转化为pdf
在写论文过程中不可避免需要作图,常用的工具就是PPT。但是在导出图片的过程中通常会遇到一个问题,图片导出为png格式不够清晰,放大后比较模糊影响观感。那么有没有解决方案呢?是有的,可以将PPT中的作图不导入为png格式,导出为svg格式。svg格式是一种矢量图的格式,可以保证线条的锐利,放大后也不会模糊。但是这时候又会遇到另一种情况,latex中includegraphics命令不能识别出svg这种格式。includegraphics识别的格式有jpg,png,pdf。这几种格式中只有pdf支持矢量的图形。
2023-05-21 16:53:09
3866
1
原创 【技术总结】python-register机制解析
注册机制的核心是注册表 REGISTRY。这个注册表本质是一个字典结构,存储名称到类/函数的映射。这样,我们就可以用配置文件中不同的字段切换不同的类实现或者函数实现,增加项目的兼容性和易用性。举一个最简单的例子,假设动物园有很多动物,每种动物都有不同的活动习性。那么动物园每添加一种新的动物,我们就需要实现一个新的“类”。为了知道动物园一共有多少种动物,并且某种动物的习性是什么,就会用到注册表 REGISTRY, 来存储这种动物名称到“类”的映射。
2023-05-03 20:01:09
4416
3
原创 【算法思考】双目视差求像素深度公式理解
以上得到的关系都是以像素为单位,如果要切换到物理世界的长度单位,需要知道每个像素的长度。, 注意经过极线校正后的双目相机,左眼和右眼互相匹配的像素有相同的纵轴坐标(纵轴坐标都是。我们首先规定,以上的变量的单位都是(像素)。而两个像素之间的视差呢,可以理解为。另外从上述公式我们可以看出来,视差越小,深度越大,也符合我们的直觉。双目相机可以通过左右目图像的匹配得到每个像素的视差,即左眼像素。因此我们可以得到深度和视差的关系,其中。如上图所示,我们要求解的像素深度就是。假设我们知道左眼某个像素的视差。
2023-03-29 23:20:50
1905
原创 【实践经验】pip更改源加速下载
该篇文章介绍了使用国内镜像来加速pip软件包下载和安装的方法。通过使用国内镜像,可以提高下载和安装软件包的速度,尤其是pip的默认源下载速度较慢的情况下。文章提供了几个国内镜像的地址,并介绍了两种使用国内镜像的方法:临时使用和永久更换。临时使用可以在pip命令后添加-i选项和国内镜像地址,而永久更换则需要修改pip配置文件,将index-url选项修改为国内镜像地址。
2023-03-03 10:50:51
725
原创 【实践经验】Latex 使用PPT导出的图片的渲染灰边问题解决
出现该问题的原因在PPT上,在PPT中导出png图片的时候会自动在图片周围加上一个像素宽度的透明像素。但是Latex中无法有效的渲染这透明的一个像素,因此就会出现灰色边界。想要解决此问题,只能把所有的透明像素换成白色像素。在科研作图中如果使用PPT进行绘图,在导出图片后放在Latex环境下渲染会出现灰色边线问题。在导出图片的时候,先导出为.bmp格式, 然后将改格式重新转化成 png格式即可。左边是Latex的渲染结果,右边是实际的图片。
2023-02-25 20:17:40
1306
原创 深度学习主机配置问题总结
有一些 Z690 主板虽然有两个 5.0 x16的 PCIe插槽,但是如果都插上就都会降速到 x8。这种都会注明 “2 x PCIe 5.0 x16 slots (support x16 or x8/x8 modes)”。
2023-02-24 10:00:25
471
原创 【实践经验】linux 开机执行 python脚本
注意 defaults 后的数字100表示这是开机后第100个需要执行的任务,通常可以设置的大一点,保证该任务不要干扰到系统其他启动任务的执行。设定好之后系统就可以识别这个任务了,可以通过下面的命令,启动该任务。首先,为了实现这个需求,我们需要准备如下,第一个是 需要执行启动的python脚本,我们可以暂且命名为 run.py。注意,对于注释部分,我们可以修改的只有脚本名字, 如果你的脚本名字是 xxx.sh, 那么可以将上述脚本中的 internet_connnector.sh 替换成 xxx.sh。
2023-02-17 20:30:40
2266
2
原创 【算法思考】Radial basis function interpolation (RBF)插值法
Radial Basis Function Interpolation (RBF 插值)算法是一种可以进行非线性插值的算法,并且算法不局限于结构化的数据,对于分布不均匀的数据同样有很好的插值效果。这篇文章将概述其原理,并赋有高性能版本的numpy实现,有需要的同学可以自取。
2023-02-13 20:30:21
2171
原创 【实践经验】Metashape 使用 Python 脚本无GUI自动化重建流程
Metashape之间叫做 photoscan,是一款商业化的三维重建软件,可以利用拍摄的多视角图像重建出场景的三维模型。这款商业化软件在多个平台都适用,包括Windows,MacOS,Linux这些。同时这款软件也提供了变成语言接口比如Python API,Java API。该软件的官网首页是agisoft, 感兴趣可以了解一下。需要注意,该软件需要收取费用,但可以申请30天的免费试用。
2023-02-06 18:52:44
2760
1
原创 【算法思考】Pytorch Align Corners 用法总结
Pytorch的许多接口都需要提供align_corners=True/False。为了更好的使用pytorch提供的接口,有必要了解这个参数所表示的具体含义。下面我们会通过图形化的方式展示。
2023-01-29 00:06:31
1929
原创 【技术总结】Pytorch 复现性设置
有时候我们需要保证程序的可复现性,比如需要提交可复现代码的比赛。因此需要学习如何保证pytorch的代码可以复现。
2023-01-15 22:52:55
377
原创 【技术总结】python 调试方法 pdb
在构建python项目的过程中,debug的时间往往要超出编写代码的时间,因此有必要了解一些常用的python调试工具。如果在有IDE的情况下,比如Pycharm,Vscode这些软件,我们可以很方便地进行打断点来debug。但是有些时候,我们的调试环境没有安装这些图形化的软件,为了一个bug重新配置又显得过于麻烦,因此就需要仅依靠命令行的调试工具。今天就来介绍这样一个工具 pdb。pdb 是 ThePythonDebugger 的缩写。属于python原生的package,不需要额外安装。
2023-01-15 10:31:40
1053
原创 【技术总结】本地项目初始化到Github
很多时候,我们需要现在本地开发项目。等项目完善后再创建Github项目,进行开源。那么如果本地的项目已经用git管理了,如何初始化到github上呢?这篇文章就来解决这个问题。
2023-01-14 13:59:41
538
原创 【Paper Notes】Instant Neural Graphics Primitives with a Multiresolution Hash Encoding
本文章发表在 ACM Transactions on Graphics (ToG) 上,是图形学的顶刊之一。文章的作者都来自于Nvidia。这篇文章是NeRF方法提出后的一个改进工作(虽然文章提出可以应用于多种三维表示任务,但是主要评测还是在NeRF上),能够快速重建出复杂的三维场景。
2023-01-12 12:25:07
1637
原创 【技术总结】Pytorch 多卡训练例程解析
在Pytorch中,DDP训练模式可以利用单机上的多块显卡进行训练,能够保证训练时所有显卡的显存消耗相同(如果分配的数据量相同)。在多卡训练过程中,原理上时启动多进程训练,进程之间依赖网络通讯共享梯度。
2023-01-08 12:19:50
1082
原创 【实践经验】cp 错误:cannot create regular file ‘../../src/ood1.jpg‘: No such file or directory
但是我执行cp所在的文件夹是位于软链接的目录上的,因此…/就会访问原始目录的上两层文件,当然不会找到src。其实出现这个问题的原因是,你所看到的目录结构可能不是真正的目录结构。今日在linux拷贝文件的时候,出现这个错误感觉很奇快,命名目录是存在的,但是为什么会报错呢?解决办法就是,拷贝的时候用绝对路径拷贝,或者在软链接目录外执行拷贝命令。
2023-01-06 15:06:23
4289
原创 【实践经验】华为云AI应用在线服务部署custom_service写法
在参加华为云AI大赛的过程中,经常遇到的就是要编写custom_service.py, 今天来总结一下编写这个文件的一些注意事项。下面给出了一个例程进行分析。
2023-01-05 23:44:15
651
原创 【技术总结】常用Linux命令
如上所示是常见的fstab的格式,我们可以用UUID或者硬盘名来挂载,但是通常建议使用UUID,因为UUID无论如何插拔都保持不变。Ubuntu使用systemctl来管理开机启动服务。因此首先得准备服务文件,后缀为.service。lib/systemd/system/ 下面。硬盘的名字,可以通过fdisk -l 查看。查看各个目录得占用空间大小。有了该文件后,将该文件方法。如何查看UUID等信息呢?每个分卷大小 2048M。查看所有service。
2022-12-29 20:58:44
163
原创 【Paper Notes】Deep Anomaly Detection With Outlier Exposure
OOD检测文章 Outlier Exposure 总结和思考。
2022-12-21 11:59:53
1075
原创 【算法思考】Transformer中的Mask的使用方法和注意事项
Transformer 这个架构中,在Encoder 和 Decoder 部分多次用到各种不同的mask,本文着重探讨Encoder 和 Decoder 入参中的 mask 的使用方法。
2022-12-14 12:26:44
3409
原创 【Paper Notes】TensoRF: Tensorial Radiance Fields
TensoRF: Tensorial Radiance Fields 是上海科技大学和Adobe合作发表的一篇文章。最终发表于ECCV 2022上。
2022-12-09 16:34:03
985
原创 【Paper Notes】DiffusionCLIP: Text-Guided Diffusion Models for Robust Image Manipulation
DiffusionCLIP的主要任务就是利用CLIP和Diffusion模型做图像处理
2022-11-21 21:15:09
4934
4
原创 【Paper Notes】CLIP: Learning Transferable Visual Models From Natural Language Supervision
CLIP 论文笔记,思考和总结
2022-11-13 23:30:10
935
原创 【Paper Notes】Denoising Diffusion Probabilistic Models
Diffusion Model 简要理解学习,不需要复杂的数学过程。
2022-11-07 12:16:26
1044
正则表达式必知必会pdf
2018-10-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人