- 博客(8)
- 收藏
- 关注
原创 Qwen2.5-VL及Qwen3-VL关于default coordinate system的问题
本文对比了Qwen2.5-VL和Qwen3-VL在目标检测任务中坐标转换方法的差异。Qwen2.5-VL需要先获取预处理后的图片尺寸,再将模型输出的绝对坐标转换回原图坐标;而Qwen3-VL改用相对坐标系统(0-1000范围),可直接将输出坐标映射到原图尺寸,无需处理图片resize问题。主要区别在于Qwen3-VL采用了归一化的坐标表示方法,这有助于模型在不同分辨率和比例的图像上表现更稳定。文中提供了两种模型的具体实现代码示例,并解释了Qwen3-VL采用1000参考网格的设计原理。
2025-11-13 19:57:20
720
原创 Failed to build transformer-engine/cudann位置
在Ubuntu的conda虚拟环境中安装transformer-engine时出现CMake错误,主要原因是未正确配置CUDNN路径。解决方案是:首先确认已安装cudnn(可通过pip list查看),然后设置环境变量CUDNN_PATH和CPLUS_INCLUDE_PATH,指向cudnn的安装路径(通常在conda环境目录下的nvidia/cudnn中)。具体步骤参考GitHub issue #1506,设置这两个环境变量后重新安装即可解决问题。
2025-10-09 20:54:23
181
原创 书生大模型全链路开源开放体系的笔记
基于规划和搜索结局复杂问题的路径。微调框架XTuner(兼容性好)书生浦语大模型开源开放体系。部署LMDeploy。
2024-08-19 16:50:35
306
原创 书生大模型闯关-Task 2 python
请使用本地vscode连接远程开发机,将上面你写的wordcount函数在开发机上进行debug,体验debug的全流程,并完成一份debug笔记(需要截图)。请实现一个wordcount函数,统计英文字符串中每个单词出现的次数。返回一个字典,key为单词,value为对应单词出现的次数。
2024-08-01 17:20:57
416
原创 从零开始导入(imp),导出(dmp)Oracle数据
具体任务:现有一个300+ G的dmp文件需要将其导入到Oracle数据库中,并且将其切分为若干的小的dmp文件。
2022-08-08 14:50:18
4626
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1