自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 资源 (3)
  • 收藏
  • 关注

原创 leetcode日常刷题

题目要求k个一组进行反转,首先考虑到如果k为1,那就可以直接返回链表头,这种情况没必要翻转。如果只有一个节点或者head为空结点,直接返回head即可(一个节点翻转k次都是本身)其次对于链表题型,在表头head前增加一个哑节点能省去很多麻烦(省去头节点特殊处理)

2025-03-27 19:49:36 295

原创 SGLang的调度器策略(Policy)详解

以下内容通过SGLang0.4.3源码解析得到:sglang/python/sglang/srt/managers/schedule_policy.py。

2025-03-27 18:58:07 467

原创 本地vscode远程连接服务器docker容器

每次新配置环境,都会忘记怎么弄的,因此记录一下。(服务器端需要安装docker并配置好权限)

2025-03-17 16:57:46 161

原创 使用GPTQ量化Llama-3-8B大模型

程序启动命令为:torchrun --nproc_per_node=4 torch-dist-gptq.py (指定每个节点使用 4 个 GPU,根据你的环境来修改)调整之后量化成功(可见降低了64.30%的显存空间),但是总共耗时了将近一小时的时间,因此我想使用四卡并行量化。描述:使用四张3090,分别进行单卡量化,多卡量化。并使用SGLang部署量化后的模型,使用GPTQ量化。量化完成,和单卡量化效果一致,但是缩短了量化时间,效率约提升了4.5倍!原来的模型精度为FP16,量化为4bit。

2025-03-13 21:54:38 554

原创 推理框架SGLang安装与调试

程序路径:examples/frontend_language/quick_start/local_example_chat.py。(安装torch2.5是为了和sglang对齐,cuda向后兼容)SGLang是一个用于大型语言模型和视觉语言模型的快速服务框架。

2025-03-12 15:24:39 393 1

原创 GGML源码阅读一(安装和调试)

GGML是一个用于机器学习的张量库,使用 C 和 C++编写,专注于 Transformer 推理,与 PyTorch 和 TensorFlow 等 ML 库类似。注意这里要配置构建类型。

2025-03-11 16:36:07 195

原创 大模型生成长度预测器

在Transformer大模型推理过程中,**KV缓存(Key-Value Cache)**的内存占用会随着序列长度呈线性增长。传统系统(如HuggingFace Transformers和FasterTransformer)要么频繁分配内存导致延迟,要么预分配最大长度造成资源浪费。,将吞吐量提升6.49倍。

2025-03-05 18:46:02 291

原创 四张GeForce RTX3090进行TP/PP/TP+PP推理实验

在单机多卡3090 通过PCIe 4.0互联场景,使用张量并行的端到端时延(e2e),GPU利用率等指标,相对PP,混合并行都有明显优势.

2025-02-21 15:48:11 179

原创 源码方式安装llama.cpp及调试

【代码】服务器环境部署llama.cpp + CUDA。

2025-02-20 19:46:22 585

原创 使用vscode调试transformers源码

优先参考官方手册。

2025-02-19 18:44:18 281

原创 ubuntu源码方式安装TensorRT-LLM推理框架(超详细)

写在前面:建议先根据官方手册进行安装,遇到问题再看blog:TensorRT官方文档TensorRT-LLM 官方推荐使用 Docker 进行构建和运行ubuntu安装docker官方手册可以通过以下命令进行检测buildx是否可用(遇到的第一个安装错误,缺少buildx,重装docker解决了)获取 TensorRT-LLM 源码建立docker 镜像可以搜索自己的GPU的计算能力,替换以下命令行的数字(能加速构建)注:构建 TensorRT-LLM Docker 镜像需要约 63 GB

2025-02-19 17:16:54 660

原创 使用BERT模型微调二分类任务

工具包:torch 2.6.0+cu126 + transformers4.49.0.dev0。环境:ubuntu20.04 + GeForce RTX3090。复现时间:约 1 h。

2025-02-19 16:42:10 391

原创 解决服务器无法下载huggingFace模型数据集

参数禁用文件软链接,这样下载路径下所见即所得,详细解释请见上面提到的教程。是 Hugging Face 官方提供的命令行工具,自带完善的下载功能。替换其中的URL为https://hf-mirror.com即可。

2025-02-19 16:13:25 332

原创 C++中static的详解

static关键的用法

2024-01-14 22:06:07 500 1

原创 详解右值引用实现的完美转发机制

右值引用实现完美转发

2024-01-14 21:51:29 479 2

原创 左值引用,右值引用

c++中的左右值引用,含有代码示例

2024-01-14 16:23:01 474 1

原创 汇总c++11特性,含有智能指针,左值右值等

c++11特性汇总,含有智能指针,左值右值等

2024-01-14 15:31:57 1027 1

原创 C++11,智能指针详解,以及面试常见问题

四种智能指针详解,含面试常见问题

2024-01-14 14:14:24 1264 1

原创 C/C++中各类常见指针,裸指针,野指针,空指针,智能指针,悬空指针

概述c/c++中各类指针

2024-01-06 21:55:12 1162 1

原创 静态库,动态库的创建和使用

动态库静态库详解,使用cmake进行创建和使用

2023-12-08 20:52:07 416 1

原创 vscode开发中常用的快捷键大全

简要概述vscode开发中常用快捷键

2023-11-08 10:16:08 582 1

原创 TLDR的安装和使用教程(超级详细,实测有效)

详细介绍TLDR的下载安装和使用

2023-10-11 19:40:00 8550 9

原创 对于xv6 riscv项目的详细解读,源码解析,代码学习

对操作系统经典项目xv6 riscv进行超详细解析,源码解读,项目分析,非常适合新手入门学习

2023-10-08 10:41:17 1454 5

原创 八皇后问题详解(附详细代码)

八皇后问题详解,助力理解八皇后问题

2021-03-27 22:16:05 16535 4

原创 并查集算法应用

这是一个应用并查集算法的模板,有助于理解并查集的具体实现

2021-03-24 23:01:46 359

原创 DFS深度搜索算法应用

经典深度搜索算法DFS,助力理解和应用DFS

2021-03-24 11:09:22 233

原创 拓扑排序算法应用

拓扑排序算法应用题,助力理解算法

2021-03-24 09:48:35 500

原创 oj1017:你会四舍五入吗?

题目:oj1017,C语言中的四舍五入

2021-03-23 23:10:32 1643 6

算法设计与分析实验报告.docx

算法设计与分析的实验,包含排序的比较,贪心算法的分析以及奖学金问题 其中包含了代码以及运行截图和实验总结

2021-04-11

实验三 多表查询.docx

实验三 多表查询(包含答案代码以及运行结果) 【 实验目的 】 掌握多张表进行连接查询,主要包括连接查询、子查询和相关子查询等内容。 【 实验内容 】 在实验一的基础上完成下列查询。 (1)(连接查询) 求选修了课程001且成绩在70分以下或成绩在90分以上的学生的姓名、课程名称和成绩。

2021-04-11

实验二 单表查询.docx

内容:数据库原理以及应用中的Oracle数据库的实验二(单表查询)完整版(包含答案以及运行截图) 实验二 单表查询 【 实验目的 】 掌握单表查询语句的使用,主要包括选择、投影运算,以及精确查询、模糊查询和分组查询、排序等内容。 【 实验内容 】 在实验一的基础上完成以下实验内容。 (1) (选择表中的若干列) 求全体学生的学号、姓名、性别和年龄。 答:SELECT SNO,SNAME,SSEX,SAGE FROM STUDENT; 适应人群:初学MySQL的同学,以及正在学习数据库的原理以及应用的在校大学生,

2021-04-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除