脚滑小子-优快云博客

原创 leetcode日常刷题

题目要求k个一组进行反转，首先考虑到如果k为1，那就可以直接返回链表头，这种情况没必要翻转。如果只有一个节点或者head为空结点，直接返回head即可（一个节点翻转k次都是本身）其次对于链表题型，在表头head前增加一个哑节点能省去很多麻烦（省去头节点特殊处理）

2025-03-27 19:49:36 295

原创 SGLang的调度器策略(Policy)详解

以下内容通过SGLang0.4.3源码解析得到：sglang/python/sglang/srt/managers/schedule_policy.py。

2025-03-27 18:58:07 467

原创本地vscode远程连接服务器docker容器

每次新配置环境，都会忘记怎么弄的，因此记录一下。（服务器端需要安装docker并配置好权限）

2025-03-17 16:57:46 161

程序启动命令为：torchrun --nproc_per_node=4 torch-dist-gptq.py (指定每个节点使用 4 个 GPU,根据你的环境来修改)调整之后量化成功（可见降低了64.30%的显存空间），但是总共耗时了将近一小时的时间，因此我想使用四卡并行量化。描述：使用四张3090，分别进行单卡量化，多卡量化。并使用SGLang部署量化后的模型，使用GPTQ量化。量化完成，和单卡量化效果一致，但是缩短了量化时间，效率约提升了4.5倍！原来的模型精度为FP16，量化为4bit。

2025-03-13 21:54:38 554

原创推理框架SGLang安装与调试

程序路径：examples/frontend_language/quick_start/local_example_chat.py。（安装torch2.5是为了和sglang对齐，cuda向后兼容）SGLang是一个用于大型语言模型和视觉语言模型的快速服务框架。

2025-03-12 15:24:39 393 1

原创 GGML源码阅读一（安装和调试）

GGML是一个用于机器学习的张量库，使用 C 和 C++编写，专注于 Transformer 推理，与 PyTorch 和 TensorFlow 等 ML 库类似。注意这里要配置构建类型。

2025-03-11 16:36:07 195

原创大模型生成长度预测器

在Transformer大模型推理过程中，**KV缓存（Key-Value Cache）**的内存占用会随着序列长度呈线性增长。传统系统（如HuggingFace Transformers和FasterTransformer）要么频繁分配内存导致延迟，要么预分配最大长度造成资源浪费。，将吞吐量提升6.49倍。

2025-03-05 18:46:02 291

原创四张GeForce RTX3090进行TP/PP/TP+PP推理实验

在单机多卡3090 通过PCIe 4.0互联场景，使用张量并行的端到端时延（e2e），GPU利用率等指标，相对PP，混合并行都有明显优势.

2025-02-21 15:48:11 179

原创源码方式安装llama.cpp及调试

【代码】服务器环境部署llama.cpp + CUDA。

2025-02-20 19:46:22 585

原创使用vscode调试transformers源码

优先参考官方手册。

2025-02-19 18:44:18 281

原创 ubuntu源码方式安装TensorRT-LLM推理框架(超详细)

写在前面：建议先根据官方手册进行安装，遇到问题再看blog：TensorRT官方文档TensorRT-LLM 官方推荐使用 Docker 进行构建和运行ubuntu安装docker官方手册可以通过以下命令进行检测buildx是否可用（遇到的第一个安装错误，缺少buildx，重装docker解决了）获取 TensorRT-LLM 源码建立docker 镜像可以搜索自己的GPU的计算能力，替换以下命令行的数字(能加速构建)注：构建 TensorRT-LLM Docker 镜像需要约 63 GB

2025-02-19 17:16:54 660

原创使用BERT模型微调二分类任务

工具包：torch 2.6.0+cu126 + transformers4.49.0.dev0。环境：ubuntu20.04 + GeForce RTX3090。复现时间：约 1 h。

2025-02-19 16:42:10 391

原创解决服务器无法下载huggingFace模型数据集

参数禁用文件软链接，这样下载路径下所见即所得，详细解释请见上面提到的教程。是 Hugging Face 官方提供的命令行工具，自带完善的下载功能。替换其中的URL为https://hf-mirror.com即可。

2025-02-19 16:13:25 332

原创 C++中static的详解

static关键的用法

2024-01-14 22:06:07 500 1

原创详解右值引用实现的完美转发机制

右值引用实现完美转发

2024-01-14 21:51:29 479 2

原创左值引用，右值引用

c++中的左右值引用，含有代码示例

2024-01-14 16:23:01 474 1

原创汇总c++11特性，含有智能指针，左值右值等

c++11特性汇总，含有智能指针，左值右值等

2024-01-14 15:31:57 1027 1

原创 C++11，智能指针详解，以及面试常见问题

四种智能指针详解，含面试常见问题

2024-01-14 14:14:24 1264 1

原创 C/C++中各类常见指针，裸指针，野指针，空指针，智能指针，悬空指针

概述c/c++中各类指针

2024-01-06 21:55:12 1162 1

原创静态库，动态库的创建和使用

动态库静态库详解，使用cmake进行创建和使用

2023-12-08 20:52:07 416 1

原创 vscode开发中常用的快捷键大全

简要概述vscode开发中常用快捷键

2023-11-08 10:16:08 582 1

原创 TLDR的安装和使用教程（超级详细，实测有效）

详细介绍TLDR的下载安装和使用

2023-10-11 19:40:00 8550 9

原创对于xv6 riscv项目的详细解读，源码解析，代码学习

对操作系统经典项目xv6 riscv进行超详细解析，源码解读，项目分析，非常适合新手入门学习

2023-10-08 10:41:17 1454 5

原创八皇后问题详解（附详细代码）

八皇后问题详解，助力理解八皇后问题

2021-03-27 22:16:05 16535 4

原创并查集算法应用

这是一个应用并查集算法的模板，有助于理解并查集的具体实现

2021-03-24 23:01:46 359

原创 DFS深度搜索算法应用

经典深度搜索算法DFS,助力理解和应用DFS

2021-03-24 11:09:22 233

原创拓扑排序算法应用

拓扑排序算法应用题，助力理解算法

2021-03-24 09:48:35 500

原创 oj1017：你会四舍五入吗？

题目：oj1017，C语言中的四舍五入

2021-03-23 23:10:32 1643 6

算法设计与分析实验报告.docx

算法设计与分析的实验，包含排序的比较，贪心算法的分析以及奖学金问题其中包含了代码以及运行截图和实验总结

2021-04-11

实验三多表查询.docx

实验三多表查询（包含答案代码以及运行结果）【实验目的】掌握多张表进行连接查询，主要包括连接查询、子查询和相关子查询等内容。【实验内容】在实验一的基础上完成下列查询。（1）(连接查询) 求选修了课程001且成绩在70分以下或成绩在90分以上的学生的姓名、课程名称和成绩。

2021-04-11

实验二单表查询.docx

内容：数据库原理以及应用中的Oracle数据库的实验二（单表查询）完整版（包含答案以及运行截图）实验二单表查询【实验目的】掌握单表查询语句的使用，主要包括选择、投影运算，以及精确查询、模糊查询和分组查询、排序等内容。【实验内容】在实验一的基础上完成以下实验内容。（1） (选择表中的若干列) 求全体学生的学号、姓名、性别和年龄。答：SELECT SNO,SNAME,SSEX,SAGE FROM STUDENT; 适应人群：初学MySQL的同学，以及正在学习数据库的原理以及应用的在校大学生，

2021-04-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

goodgood_UP的博客

原创 leetcode日常刷题

原创 SGLang的调度器策略(Policy)详解

原创本地vscode远程连接服务器docker容器

原创使用GPTQ量化Llama-3-8B大模型

原创推理框架SGLang安装与调试

原创 GGML源码阅读一（安装和调试）

原创大模型生成长度预测器

原创四张GeForce RTX3090进行TP/PP/TP+PP推理实验

原创源码方式安装llama.cpp及调试

原创使用vscode调试transformers源码

原创 ubuntu源码方式安装TensorRT-LLM推理框架(超详细)

原创使用BERT模型微调二分类任务

原创解决服务器无法下载huggingFace模型数据集

原创 C++中static的详解

原创详解右值引用实现的完美转发机制

原创左值引用，右值引用

原创汇总c++11特性，含有智能指针，左值右值等

原创 C++11，智能指针详解，以及面试常见问题

原创 C/C++中各类常见指针，裸指针，野指针，空指针，智能指针，悬空指针

原创静态库，动态库的创建和使用

原创 vscode开发中常用的快捷键大全

原创 TLDR的安装和使用教程（超级详细，实测有效）

原创对于xv6 riscv项目的详细解读，源码解析，代码学习

原创八皇后问题详解（附详细代码）

原创并查集算法应用

原创 DFS深度搜索算法应用

原创拓扑排序算法应用

原创 oj1017：你会四舍五入吗？

算法设计与分析实验报告.docx

实验三多表查询.docx

实验二单表查询.docx

空空如也

算法设计与分析实验报告.docx

实验三 多表查询.docx

实验二 单表查询.docx

空空如也

实验三多表查询.docx

实验二单表查询.docx