自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 大模型微调知识点总结

问题:模型的参数量由哪些部分组成,分别是以什么量级影响参数量(Word Embeddings): 这部分参数用于将输入的词汇映射到固定维度的向量。其参数量由词汇表大小(V)和嵌入维度(D)决定,总量大约为 V*D。(Positional Embeddings): 这部分添加了位置信息到嵌入向量中。其参数量通常与词嵌入的维度相同,大约为最大序列长度(S)和嵌入维度(D)的乘积,即 S*D。

2024-09-30 00:17:37 841

原创 模型推理与加速方案

vLLM是伯克利大学LMSYS组织开源的大语言模型高速推理框架,旨在极大地提升实时场景下的语言模型服务的吞吐与内存使用效率。vLLM是一个快速且易于使用的库,用于 LLM 推理和服务,可以和HuggingFace 无缝集成。vLLM利用了全新的注意力算法「PagedAttention」,有效地管理注意力键和值。其主要用于离线批量推理。

2024-09-30 00:16:34 1213 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除