自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

盛世芳华

人工智能、机器学习爱好者

盛世芳华优快云认证博客专家优快云认证企业博客

码龄14年

95: 原创

2606: 周排名

1万+: 总排名

14万+: 访问

: 等级

1718: 积分

4454: 粉丝

546: 获赞

237: 评论

1187: 收藏

私信

关注

热门文章

分类专栏

大模型 3篇
模型微调 3篇
deepseek 1篇
mmtracking 1篇
mmdetection 3篇
mmdeploy 1篇
TensorRT 2篇
LLM 5篇
香橙派 1篇
目标跟踪 1篇
机器学习 2篇
树莓派 1篇
目标识别 2篇
mmpose 1篇
姿态分析 1篇
行为识别 1篇
slowfast 1篇
信用卡
docker 1篇
多目标跟踪 2篇

最新评论

DeepSeek-VL2多显卡运行Gradio Demo
weixin_45954367: 遇到同样的问题
DeepSeek-VL2多显卡运行Gradio Demo
qq_54441903: ../aten/src/ATen/native/cuda/IndexKernel.cu:92: operator(): block: [34,0,0], thread: [94,0,0] Assertion `index >= -sizes[i] && index < sizes[i] && "index out of bounds"` failed. ../aten/src/ATen/native/cuda/IndexKernel.cu:92: operator(): block: [34,0,0], thread: [95,0,0] Assertion `index >= -sizes[i] && index < sizes[i] && "index out of bounds"` failed.RuntimeError: CUDA error: device-side assert triggered CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1. Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.请问按照您这样改了之后会报这样的错误是为什么呢
openwebui二改界面环境搭建
GRC_TEC: 兄弟，跨域问题解决了吗
swift自定义数据集微调Qwen-7B大模型，转换模型后使用ollama跑起来
LUCKY-JUN: 你好，请教一下，我用的是 swift3 ，微调后，问问题不是我想要的？按你的例子，问贝贝是谁，回答不是给定的答案。这是微调不成功吗？哪里出问题了？
slowfast训练自定义数据集，识别动物行为
有闲的小孩新子: 这是连续行为的识别而不是某一时刻的状态，如果只是站还是坐，用检测不香吗，何必绕一大圈子来用这个行为识别呢，你得试验那种仰卧起坐，一个动作有不同状态，这样才能说明问题啊

最新文章

deepseek

关注

文章平均质量分 87

关注数：文章数：1 文章阅读量：1364 文章收藏量：21

作者: 盛世芳华

全栈

展开

DeepSeek-VL2使用swift微调的环境搭建和微调过程

最大模型用8张卡跑起来很难，需要降低--lora_rank、--lora_alpha、--max_length、--deepspeed、--per_device_train_batch_size、--gradient_accumulation_steps、--dataloader_num_workers才能刚好跑起来，虽然跑起来了，但训练速度却非常的慢。模型合并后，将模型复制到deepseek-vl2/deepseek-ai/目录下，使用deepseek-vl2的web.demo可以跑一下看看运行效果。

原创 2025-03-05 08:46:34 · 1375 阅读 · 0 评论