LT_real-优快云博客

原创大模型从基础到入门记录

本文主要记录入门大模型学习的相关知识，以期为后续工作学习提供帮助。（除了我自己截图外，引用的我尽量标注来源，有些忘记来源了请告诉我orz）

2025-05-20 13:09:33 685

本文以DeepSeek-R1-Distill-Qwen-7B大模型为例，详细解析了大模型文件的结构及其参数意义。主要文件包括config.json（模型架构配置）、generation_config.json（生成控制配置）、tokenizer_config.json（分词器配置）及model.safetensors（模型权重文件）等。文章对比了不同模型文件的差异，如DeepSeek与Qwen系列在分词器上的优化，以及safetensors格式的引入，强调了其在安全性和加载速度上的优势。此外，文章还探讨了模

2025-05-20 00:38:18 997

原创 docker容器中的KTransformer更新

这里安装flash-attn有坑：（看github中有人提到，非官方docker容器编译总是报错，要用cpufeature=0.2.2版本才行）我们可以使用0.2.3版本的docker容器，作为项目运行环境，这样就不用再下一次了：（叉叉，还是不能偷懒，后面一堆报错，建议从头开始）找到与自己环境cuda版本一致的镜像，我这里用的是pytorch2.5.1，cuda12.1，devel版本。进入容器，其实后面步骤就是普通的部署过程了，我参考的是知乎上一位大佬的操作：？网络好的可以直接运行这行代码，不报错就行）

2025-04-16 10:20:22 648

原创本地构建知识向量库+大模型问答系统

本地化知识库+大模型=RAG，rag技术简单来说就是三个过程：retrieval检索+ augment增强 + generate生成；其中检索部分我选择使用milvus向量数据库实现，生成部分由本地大模型完成。

2025-04-14 15:58:42 895

原创 Quite-STaR论文阅读

原文：[2403.09629] Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking自学推理器（STaR：Self Taught Reasoner），LLM通过抽样基本原理来尝试回答问题，在基本原理上进行训练，如果回答正确，则重复该过程迭代以解决更困难的问题，从而在问答对数据集中引导大模型推理能力。然鹅，这种方法将大模型训练限制在精心准备的QA数据集，限制了基本原理的规模和普遍性，提高大模型训练的难度；同时，原始文

2025-04-09 17:15:21 566 1

原创本地离线部署llamafactory项目

在联网环境中部署llamafactory只需按官方教程来即可，但离线部署就有点麻烦了。

2025-04-02 10:20:15 461

原创基于Ktransformer部署DeepSeek-R1模型

我这边离线机器跑起来居然没有报错，成功后可以访问10012端口看看，一般会显示detail Not Found，访问后缀加/web/index.html即可进入聊天页面。其中gguf_path为gguf文件路径，需要有config配置文件在同一路径；记录一次在离线机器上使用kt框架部署Deepseek:671B模型过程。model_path为模型路径，不知道为什么没有后会报错（再看看；cpu_infer为用于推理CPU线程数，越多越快？一、前置准备下载（在联网的机器上操作）我这里下载的是Q5模型。

2025-03-18 17:07:55 373

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

qq_47814951的博客

原创大模型从基础到入门记录

原创从DeepSeek大模型文件到大模型入门记录

原创 docker容器中的KTransformer更新

原创本地构建知识向量库+大模型问答系统

原创 Quite-STaR论文阅读

原创本地离线部署llamafactory项目

原创基于Ktransformer部署DeepSeek-R1模型

原创新版本本地化的fastgpt接入重排模型≥4.8.20

原创记一次使用CUDA编程并行矩阵乘法程序

原创 rust实现大语言模型记录

原创在linux系统中的python虚拟环境管理

原创记一次复现缓冲区溢出过程

原创人工智能对网络空间安全带来的新机遇和新挑战工程科技学术研讨会分论坛二:大模型赋能网络安全总结

原创使用docker-compose一键本地化部署fastgpt，并连接本地ollama部署的大模型

原创使用docker通过ollama本地化部署qwen大模型

原创在docker内使用nginx反向代理其他容器

原创记一次使用MPI完成矩阵乘法程序

原创使用Pthread实现并行快速排序程序

原创关于anaconda中虚拟环境创建及深度学习中模型训练的过程记录

原创基于OpenMP实现利用泰勒级数计算正弦函数sin(x)的并行程序

原创基于win11系统的vscode中OpenMP配置

原创交叉验证法和自助法的异同

SYCL阅读文献的报告

使用cuda在GPU 实现上实现矩阵相乘程序+报告

MPI并行矩阵乘法编程实验+报告

OpenMP编程实验+报告

并行排序编程实验+报告

基于win11系统的vscode中OpenMP配置的task.json文件

空空如也