自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Qwen2.5-VL及Qwen3-VL关于default coordinate system的问题

本文对比了Qwen2.5-VL和Qwen3-VL在目标检测任务中坐标转换方法的差异。Qwen2.5-VL需要先获取预处理后的图片尺寸,再将模型输出的绝对坐标转换回原图坐标;而Qwen3-VL改用相对坐标系统(0-1000范围),可直接将输出坐标映射到原图尺寸,无需处理图片resize问题。主要区别在于Qwen3-VL采用了归一化的坐标表示方法,这有助于模型在不同分辨率和比例的图像上表现更稳定。文中提供了两种模型的具体实现代码示例,并解释了Qwen3-VL采用1000参考网格的设计原理。

2025-11-13 19:57:20 720

原创 Failed to build transformer-engine/cudann位置

在Ubuntu的conda虚拟环境中安装transformer-engine时出现CMake错误,主要原因是未正确配置CUDNN路径。解决方案是:首先确认已安装cudnn(可通过pip list查看),然后设置环境变量CUDNN_PATH和CPLUS_INCLUDE_PATH,指向cudnn的安装路径(通常在conda环境目录下的nvidia/cudnn中)。具体步骤参考GitHub issue #1506,设置这两个环境变量后重新安装即可解决问题。

2025-10-09 20:54:23 181

原创 书生大模型全链路开源开放体系的笔记

基于规划和搜索结局复杂问题的路径。微调框架XTuner(兼容性好)书生浦语大模型开源开放体系。部署LMDeploy。

2024-08-19 16:50:35 306

原创 书生大模型闯关-Task 2 python

请使用本地vscode连接远程开发机,将上面你写的wordcount函数在开发机上进行debug,体验debug的全流程,并完成一份debug笔记(需要截图)。请实现一个wordcount函数,统计英文字符串中每个单词出现的次数。返回一个字典,key为单词,value为对应单词出现的次数。

2024-08-01 17:20:57 416

原创 书生大模型闯关-Task 1

【代码】书生大模型闯关-Task 1。

2024-08-01 16:50:13 313

原创 多场景下的Pandas使用技巧

Pandas一些问题的解决方案

2022-11-20 10:00:02 378

原创 Python3 map函数调用后内存释放问题

Python map

2022-10-14 15:56:06 632 1

原创 从零开始导入(imp),导出(dmp)Oracle数据

具体任务:现有一个300+ G的dmp文件需要将其导入到Oracle数据库中,并且将其切分为若干的小的dmp文件。

2022-08-08 14:50:18 4626

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除