SSS不知-道-优快云博客

原创 vLLM 学习笔记｜Guided Decoding

一般来说，LLM 的输出通常是一段符合人类表达习惯的文本序列，这让我们可以利用 LLM 来回答问题或是创作内容。然而，当我们需要 LLM 的输出符合特定的格式（如：JSON、SQL、正则表达式等）时——例如希望 LLM 根据我们的需求生成查询数据库的 SQL 语句，通过微调的方法通常很难达到我们预期的效果。这时，就需要用到 Guided Decoding 技术，它可以通过影响模型输出层的 Logits 分布（施加 Mask 过滤不满足要求的 Token）来达到规范模型输出格式的效果。brand: str。

2025-03-20 15:06:41 652

原创深入解析 Python 包调用原理与最佳实践

Python 中的模块、包以及库有什么区别？模块（module）：任何.py文件都可以作为一个“模块”（除了.py文件之外，模块还可以有其它形式）；包（package）：任何包含了一个文件的文件夹都是一个“包”，一个包里可以包含其它的包和模块；库（library）：“库”更多地是一种编程上的概念，表示可重复利用的代码。关于这个问题，更深入的分析和讲解可以参考知乎上“风影忍者”和“看图学”的这两个回答，这里不再深入进行介绍。将。

2025-01-15 15:45:56 938

原创大模型微调知识全景

大模型微调一般指的是监督微调（SFT），即使用特定下游任务的数据继续训练“预训练模型（基座模型）”，使得模型能够满足特定下游任务的性能标准。示例一：将大模型微调为一个可以将德语翻译为英语的模型。我们需要使用大量输入为德语、输出为英语的带标签数据来训练 base 大模型，这样经过微调后的大模型就可以很好地用于将德语翻译为英语的任务。示例二：开源模型为了能够直接使用，一般会提供经过问答任务微调的版本，即 Chat 模型。增量预训练：注入领域知识；监督微调：适配特定下游任务（各类微调方法百花齐放）；偏好对齐。

2024-12-05 10:51:00 1095

AI Infra / LLM / 软件开发

原创 vLLM 学习笔记｜Guided Decoding

原创深入解析 Python 包调用原理与最佳实践

原创大模型微调知识全景

原创大模型 LoRA 微调原理详解

原创 Ascend aclnn 算子开发入门

原创 Git 实践案例｜合并多个分散的 commit 节点

原创 Ascend NPU 硬件架构入门

原创 NVIDIA GPU 硬件架构入门

原创从零开始的 AI Infra 学习之路

空空如也

空空如也