自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

头狼博客

计算机专业学习

  • 博客(80)
  • 资源 (1)
  • 收藏
  • 关注

原创 [AI 算法] PointPillar算法

pointpillar最主要的特点是检测速度和精度的平衡1. 研究出发点现有的一些研究喜欢将不规则、稀疏的点云数据按照以下两种方式进行处理,然后引入RPN层进行3D Bbox Proposal,这两种方法为:(1)将点云数据划纳入一个个体素(Voxel)中,构成规则的、密集分布的体素集。常见的有VoxelNet和SECOND,这在之前的文章中已经解析过了;(2)从俯视角度将点云数据进行处理,获得一个个伪图片的数据。常见的模型有MV3D和AVOD,这也说过了。. 主要是将点云透射到俯视图上,然后

2025-02-12 11:40:19 211

原创 [LLM] LLM性能的衡量指标有哪些?

介绍LLM的一些衡量指标的作用和原理,以及应用场景

2025-02-10 10:53:08 474

原创 [AI算法-激光感知] 激光点云分割系列-Multi-View系列

主要整理多种视图融合的点云语义分割架构paper

2025-02-08 17:51:34 466

原创 [AI算法-激光感知] 激光点云物体检测-PointView系列

主要介绍Point-Based的语义分割系列算法,以及这方面算法主要的一些核心

2025-02-08 17:34:36 656

原创 [AI算法-激光感知] 激光点云分割系列-PointView系列

主要介绍一些Point-Based的点云分割模型

2025-02-08 10:20:47 574

原创 [C++] pthread and std::thread区别

pthread和std::thread的一些基本区别

2025-02-05 15:50:43 341

原创 [PCL] pcl 可视化工具viewer使用

【代码】[PCL] pcl 可视化工具viewer使用。

2025-01-23 14:22:18 502

原创 [AI部署-tensorRT] customlayer定义添加过程解析

基于tensorRT开发plugin过程

2025-01-15 14:57:56 703

原创 [CUDA] gemm优化之mma

主要说明cuda gemm中使用mma的两个方式

2025-01-15 14:54:48 293

原创 [CUDA] cuda开发之misalign address问题

cuda申请过程中首地址对齐问题

2025-01-15 14:49:18 302

原创 [CUDA] cuda编程实践

cuda编程实战: 用于总汇所有cuda优化和开发相关的知识记录

2025-01-15 14:44:24 643 1

原创 [算法基础] hash算法

主要讲解目前主流的一些hash算法和应用场景

2025-01-15 14:26:04 718

原创 [C++] perf工具评测耗时

perf对一些应用的监控使用记录

2024-12-09 15:50:06 360

原创 [pytorch|AI算法] 用mpirun同时跑多个模型推理

用mpirun 并行多个model,在8卡上进行同步推理,增加gpu使用率

2024-12-09 15:36:06 429

原创 [CUDA] 编译调试工具objdump使用查看某些cuda函数汇编代码

调研cublas等cuda库函数的一些底层代码实现逻辑,通过汇编逻辑来看具体实现,推断可能的耗时异常原因

2024-12-09 14:54:56 263

原创 [CUDA] cuda程序编译注意事项

cuda的一些编译问题的记录

2024-11-11 22:45:00 383

原创 [CUDA] cuda kernel开发记录

包括kernel的一些使用注意事项, launch_bound, __device__, debug排查技巧

2024-11-11 20:45:00 995

原创 [CUDA] 设置sync模式cudaSetDeviceFlags

可以设置cuda Stream synchorinze时是释放cpu资源还是把持cpu资源;根据官方说明默认当gpu 个数大于cpu的时候,因为cpu紧张所以会yield时间片;cuda的 synchronize等待模式分为: Yield方式, busy waiting方式(spin), blocking方式。- gpu context切换更加频繁了,应该是block阻塞导致的。- block恢复存在延迟,导致一些空白gpu时间,如下图红色框。采用blocking模式后,nsight观察的现象有几个。

2024-11-07 20:01:19 996

原创 [CUDA] 将已有的地址空间设置为pinned memory

使用cudaHostRegister将已有的地址空间设置为pinned memory。

2024-11-07 19:50:05 503

原创 [CUDA] 判断一个指针是GPU还是CPU

如何判断地址是device的还是host的?

2024-11-07 19:42:39 466

原创 [CUDA] launch_bounds的使用记录

记录cuda kernel中使用的launch bound的作用和使用方式

2024-11-07 19:37:30 534

原创 [C++] GDB的调试和自动化检测

gdb的一些基本使用说明

2024-11-06 15:52:28 665

原创 [python] 如何debug python脚本中C++后端的core dump

记录debug python和C++混合编程时的一些技巧

2024-11-06 15:47:33 591

原创 [CUDA] ptx使用笔记

介绍cuda的底层编程语言ptx的一些使用笔记

2024-11-04 20:31:52 2167

原创 [系统优化] 系统调度策略调整笔记

讲解主要的linux系统常用的一些调度策略,用于优化复杂应用中的线程调度,对整体性能有很大影响,需要综合考虑

2024-11-01 20:18:49 589

原创 [CUDA] stream使用笔记

一些cudaMemcpyAsync, 不一定是异步的,比如当host和device之间传输数据的时候,虽然使用异步copy,但是会内含同步,从而导致一些block或spin行为。

2024-11-01 16:18:54 445

原创 [CUDA] kernel归约注意事项

本文记录了一下cuda kernel在进行归约时,需要注意idx > size对后续代码的阻断问题

2024-11-01 15:53:09 186

原创 [CUDA] atomic函数闭坑技巧

记录cuda kernel中使用atomicfunc时的一些注意事项

2024-11-01 15:40:43 433

原创 [C++] 获取进程资源使用情况

介绍rusage的使用,来获取当前进程或者当前线程对系统资源的使用情况

2024-09-04 10:46:10 398 1

原创 [C++] 程序耗时统计函数的使用指南

本文总汇了clock, clock_gettime, getimeofday, times四种时间获取方法,用于debug C++代码时使用,通过他们的特性和自己使用场景来选择

2024-09-03 17:43:25 878

原创 [多线程] linux中的线程调度策略

主要介绍linux下多线程调度策略 有哪些?如何使用?

2024-08-26 19:39:48 860

原创 [C++] std::copy&std::memcpy&forloop assign的使用说明

std::copy/ std::memcpy/ for loop assign 操作使用对比和区分

2024-08-22 17:58:06 349

原创 [CUDA编程] cuda graph优化心得

【代码】[CUDA编程] cuda graph优化心得。

2024-06-12 11:36:01 2151

原创 [C++] C++基础之inline的使用

inline的使用

2024-04-15 20:45:30 1049

原创 [C++] 分支优化

主要介绍unlikely和likely的使用,用于提高分支预测的概率,提高执行效率

2024-02-18 14:53:57 762

原创 [C++]模板与std::conditional使用

记录了std::conditional_t的一些使用场景

2024-01-30 10:21:32 603

原创 [C++] mutable的使用

mutable关键字的使用思考

2024-01-23 10:44:26 601

原创 [C++] 多线程编程-thread::yield()-sleep_for()

介绍了this_thread::yield和this_thread::sleep_for的使用场景和区别。

2024-01-23 10:27:59 1445

原创 [C++] delete关键字的妙用

==**优先使用delete函数,而不是private未定义函数**====**任何函数都可以删除,包括非成员函数和模板具现**==

2023-08-11 10:16:31 427

原创 [论文阅读] 激光时序分割-MarS3D: A Plug-and-Play Motion-Aware Model for Semantic Segmentation on Multi-Scan 3D

本文主要核心是联合两中view(BEV-based, 3D-based-输出N,C的模型,不一定是point-based)branch,来对多帧点云进行时序分割,不同于传统的是:它不是只将多帧点云拼接后进行识别,因为这样会损失时序信息;而是增加了bev branch来提升时序信息的感知

2023-08-06 12:41:25 415 1

BIOS和DOS中断大全

非常全面的DOS和BIOS中断功能描述,

2013-04-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除