
大模型
文章平均质量分 66
村北头的码农
c++程序员,目前从事人工智能领域相关工作
展开
-
LLaMA-Factory学习(1)简介及安装步骤
LLaMA-Factory 是一个开源的 全栈大模型微调框架,支持从预训练到指令微调(SFT)、强化学习(RLHF)等全流程训练。支持多种模型:Llama、LLaMA-3、Mistral、Qwen、Baichuan、ChatGLM 等。灵活的微调方法:全参数微调(Full)、冻结微调(Freeze)、LoRA、QLoRA 等。低资源训练:通过量化(INT4/INT8)和高效算法(如 GaLore、Unsloth)降低显存占用。原创 2025-04-02 16:32:13 · 502 阅读 · 0 评论 -
ImportError: cannot import name ‘LlamaFlashAttention2‘ from ‘transformers.models.llama.modeling_llam
操作系统:ubuntu22.04原创 2025-03-19 17:13:45 · 360 阅读 · 0 评论 -
Ubuntu22.04操作系统4090显卡电脑本地化部署DeepSeek
听说最近很火的DeepSeek,就像本地化部署一个看看,发现本地化部署很简单,在这儿记录一下。看好多指导都是先下载Ollama,首先去Ollama网站,打开网址后如下所示:点击Download按钮,如下图所示:按照网页中的指导,去执行一个shell命令:命令开始执行,如下所示:可是,下载速度太慢了!根本没法下载,这个得想办法了,有人会科学下载,我呢是去https://github.com/ollama/ollama下载打开网页后,看到下图箭头所示,有个Release模块,底下是要下载的文件的版本号原创 2025-02-06 12:55:22 · 4839 阅读 · 1 评论