
大模型
文章平均质量分 69
亚伯拉罕·黄肯
……
展开
-
免费本地部署使用deepseek最新版 V3 0324(OpenRouter + ChatWise)
免费本地部署使用deepseek最新版 V3 0324(OpenRouter + ChatWise)原创 2025-03-26 14:33:10 · 282 阅读 · 0 评论 -
llama-factory微调Qwen2.5-7B-instruct实战,看这一篇就够了!!!(含windows和linux)
llama-factory微调Qwen2.5-7B-instruct实战,看这一篇就够了!!!(含windows和linux)原创 2025-03-20 16:56:01 · 1018 阅读 · 0 评论 -
linux使用llamafactory微调大模型出现python -m bitsandbytes,CUDA Setup failed despite Gpu being available的解决办法
CUDA Setup failed despite Gpu being available,python -m bitsandbytes的解决办法原创 2025-03-20 16:52:14 · 229 阅读 · 0 评论 -
模型蒸馏实战qwen2.5系列模型
模型知识蒸馏实战Qwen2.5系列原创 2025-03-17 18:55:17 · 732 阅读 · 0 评论 -
Attention Is All You Need(Transformer)详解以及代码复现
Attention Is All You Need(Transformer)详解以及代码复现原创 2024-06-19 17:31:44 · 2224 阅读 · 2 评论 -
MiniMind
miniMind个人见解原创 2025-01-04 16:32:41 · 1288 阅读 · 0 评论 -
将dify作为外接rag知识库--调用api实例
dify也可以接入作为自己大模型的辅助输入或者拓展知识,不仅仅只在界面开发。原创 2025-03-14 15:33:49 · 367 阅读 · 0 评论 -
Distilling the Knowledge in a Neural Network知识蒸馏
知识蒸馏模型解析。原创 2025-03-13 18:59:28 · 295 阅读 · 0 评论