自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

kurumigao的博客

原创 Qwen2.5-VL及Qwen3-VL关于default coordinate system的问题

本文对比了Qwen2.5-VL和Qwen3-VL在目标检测任务中坐标转换方法的差异。Qwen2.5-VL需要先获取预处理后的图片尺寸，再将模型输出的绝对坐标转换回原图坐标；而Qwen3-VL改用相对坐标系统（0-1000范围），可直接将输出坐标映射到原图尺寸，无需处理图片resize问题。主要区别在于Qwen3-VL采用了归一化的坐标表示方法，这有助于模型在不同分辨率和比例的图像上表现更稳定。文中提供了两种模型的具体实现代码示例，并解释了Qwen3-VL采用1000参考网格的设计原理。

2025-11-13 19:57:20 720

原创 Failed to build transformer-engine/cudann位置

在Ubuntu的conda虚拟环境中安装transformer-engine时出现CMake错误，主要原因是未正确配置CUDNN路径。解决方案是：首先确认已安装cudnn（可通过pip list查看），然后设置环境变量CUDNN_PATH和CPLUS_INCLUDE_PATH，指向cudnn的安装路径（通常在conda环境目录下的nvidia/cudnn中）。具体步骤参考GitHub issue #1506，设置这两个环境变量后重新安装即可解决问题。

2025-10-09 20:54:23 181

原创书生大模型全链路开源开放体系的笔记

基于规划和搜索结局复杂问题的路径。微调框架XTuner（兼容性好）书生浦语大模型开源开放体系。部署LMDeploy。

2024-08-19 16:50:35 306

原创书生大模型闯关-Task 2 python

请使用本地vscode连接远程开发机，将上面你写的wordcount函数在开发机上进行debug，体验debug的全流程，并完成一份debug笔记(需要截图)。请实现一个wordcount函数，统计英文字符串中每个单词出现的次数。返回一个字典，key为单词，value为对应单词出现的次数。

2024-08-01 17:20:57 416

原创书生大模型闯关-Task 1

【代码】书生大模型闯关-Task 1。

2024-08-01 16:50:13 313

原创多场景下的Pandas使用技巧

Pandas一些问题的解决方案

2022-11-20 10:00:02 378

原创 Python3 map函数调用后内存释放问题

Python map

2022-10-14 15:56:06 632 1

原创从零开始导入(imp),导出(dmp)Oracle数据

具体任务：现有一个300+ G的dmp文件需要将其导入到Oracle数据库中，并且将其切分为若干的小的dmp文件。

2022-08-08 14:50:18 4626

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除