自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 从自动驾驶到大模型,我的第一步

大模型统治深度学习的趋势不可阻挡,抱着“打不过就加入,多学点东西没坏处”的想法,博主利用下班时间摸索了些大模型相关的技术,蹭了蹭国产之光《黑神话:悟空》的热度,做了个有关黑神话的AI助手,初版功能可以聊天查询游戏内容、攻略、背景故事等,后续会继续加入多模态、Agent等功能。因为是刚入门(大佬们请跳过😂)涉及的技术主要是llm的数据制作、训练、微调、量化、rag部署等。以上结果都离不开书生*浦语以及他们开发的InternLM!!悟了悟了的模型使用xtuner在微调得到, 首先在一些网络数据上进行。

2024-11-07 22:52:10 848 2

原创 端到端自动驾驶nuPlan数据集-入门使用

最近在了解端到端自动驾驶,接触到了nuPlan数据集,在跑官方demo时遇到些坑,发现相关的资料不多,记录一下。最直接就是看nuplan官网的介绍,和paper。如果只想大概扫一眼这里还有篇中文翻译的自动驾驶轨迹规划之nuplan数据集。一句话总结就是:和nuScenes同一家公司发布的,nuPlan是首个面向planning的大规模自动驾驶基准数据集,不仅包括大量的1200小时多城市的实车驾驶数据,还提供了一整套开环/闭环仿真、多种评价标准、ML规划器开发工具及可视化工具。

2024-09-25 18:37:47 5091 10

原创 3D占用预测(Occupancy Prediction)算法学习

Occupancy算法基础知识和Occ3d数据集制作方法的介绍。简单介绍了Occupancy网络框架,参考一篇综述介绍主流的几种Occ算法;介绍Occ3d数据集制作的一般流程

2024-08-19 00:06:22 3093 1

原创 Segment-anything学习到微调系列3_SAM微调decoder

SAM初步理解,简单介绍模型框架,不涉及细节和代码SAM细节理解,对各模块结合代码进一步分析SAM微调实例,原始代码涉及隐私,此部分使用公开的VOC2007数据集,Point和Box作为提示进行mask decoder微调讲解本篇是第3部分,基于voc2007数据集对SAM decoder进行微调。代码已上传至github。

2024-07-29 14:45:40 2311 2

原创 Segment-anything学习到微调系列2_SAM细节理解和部分代码

SAM初步理解,简单介绍模型框架,不涉及细节和代码SAM细节理解,对各模块结合代码进一步分析SAM微调实例,原始代码涉及隐私,此部分使用公开的VOC2007数据集,Point和Box作为提示进行mask decoder微调讲解此篇为第二部分,如果已看过第一部分的,可以跳过下文的模型总览中介绍输入输出和流程及最后的数据引擎part,和第一篇一致。本篇很多图和部分内容参考自【大模型系列】一文看懂SAM大模型。

2024-07-29 01:00:38 2209

原创 Segment-anything学习到微调系列1_SAM初步了解

SAM初步理解,简单介绍模型框架,不涉及细节和代码SAM细节理解,对各模块结合代码进一步分析SAM微调实例,原始代码涉及隐私,此部分使用公开的VOC2007数据集,Point和Box作为提示进行mask decoder微调讲解。

2024-07-28 23:54:07 1432

原创 模型batch推理会更快吗?

当模型在推理阶段使用batch inference时,推理速度并无明显提升,相比单帧多次推理收益不大

2023-10-24 23:05:14 3141 1

原创 opencv 视频处理相关

包含视频格式知识(编解码和封装格式);如何获取视频信息及视频编解码格式;opencv读取及保存视频,及opencv fourcc编码格式一、基础知识视频的编解码格式和封装格式参考如山似水 视频编码与封装⽅式详解参考迷之程序员 opencv视频编码格式参考Alex Chung 视频的编解码格式 - 知乎常⻅的AVI、RMVB、MKV、ASF、WMV、MP4、3GP、FLV等⽂件(.后缀)其实只能算是⼀种封装标准。 ⼀个完整的视频⽂件是由⾳频和视频两部分组成的,例如H264、Xvid等就是视频编码格

2021-11-22 18:26:48 4956

原创 文字识别,mmcor的个人使用记录

mmocr官方代码 : https://github.com/open-mmlab/mmocr首先感谢一波大佬们的无私,把代码都开源了,还有辛勤的商汤的大佬们一直维护更新。这次写点自己的使用记录,给同我一样刚入门的萌新们。一、mmocr的使用环境配置常规的配置参考官网的教程Getting Started(再次感谢大佬们搞的这么仔细的教程),然后如果是30系列的显卡,因为只支持cuda11,所以环境配置有点麻烦,我这边是3070,就把自己的配置过程放上来:# mmocr for 3070co

2021-06-01 19:41:25 5112 34

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除