
Qlora
文章平均质量分 80
努力努力再努力呐
努力努力再努力
展开
-
Qwen打包部署(大模型转换为 GGUF 以及使 用 ollama 运行)
Qwen打包部署(大模型转换为 GGUF 以及使 用 ollama 运行)原创 2025-03-25 12:49:10 · 212 阅读 · 0 评论 -
Qwen大模型微调(QLora微调与GGUF模型转换)
GGUF 格式的全名为(GPT-Generated Unified Format),提到GGUF 就不得不提到它的前身GGML(GPT-GeneratedModelLanguage)。GGML 是专门为了机器学习设计的张量库,最早可以追溯到 2022/10。其目的是为了有一个单文件共享的格式,并且易于在不同架构的 GPU 和CPU 上进行推理。但在后续的开发中,遇到了灵活性不足、相容性及难以维护的问题。原创 2025-03-25 12:50:26 · 1486 阅读 · 0 评论