大模型
文章平均质量分 78
大模型
二分掌柜的
二分掌柜的
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
如果让计算机理解人类语言 - 文本是如何变成向量的
flyfish原创 2025-07-11 13:42:04 · 1358 阅读 · 0 评论 -
如果让计算机理解人类语言- Qwen3 Embedding (2025)
flyfish原创 2025-07-07 18:35:18 · 1147 阅读 · 0 评论 -
如果让计算机理解人类语言- Word2Vec(Word to Vector,2013)
flyfish原创 2025-07-07 18:34:45 · 705 阅读 · 0 评论 -
如果让计算机理解人类语言- 词袋模型(Bag of Words, BoW,1970s)
flyfish原创 2025-07-07 18:34:22 · 885 阅读 · 0 评论 -
如果让计算机理解人类语言- One-hot 编码(One-hot Encoding,1950s)
flyfish原创 2025-07-07 18:33:49 · 1682 阅读 · 0 评论 -
LLaMA-Factory 合并 LoRA 适配器
flyfish原创 2025-06-25 18:20:53 · 2401 阅读 · 3 评论 -
Chatbox 连接 vLLM Qwen3
flyfish原创 2025-06-24 09:26:01 · 590 阅读 · 0 评论 -
LoRA核心公式
flyfish原创 2025-06-15 22:56:59 · 1214 阅读 · 0 评论 -
LoRA 与传统矩阵分解的比较
flyfish原创 2025-06-15 22:47:28 · 934 阅读 · 0 评论 -
一份小白都可以看的懂的各种归一化,不看公式也能会Batch Norm、Layer Norm、Instance Norm、Group Norm
flyfish原创 2025-06-01 09:12:17 · 1019 阅读 · 0 评论 -
密集自注意力与稀疏自注意力算法复杂度
flyfish原创 2025-05-29 09:06:51 · 603 阅读 · 0 评论 -
DeepSpeed-Ulysses 密集自注意力(Dense Self-Attention)和稀疏自注意力(Sparse Self-Attention)
flyfish原创 2025-05-27 11:07:59 · 1273 阅读 · 0 评论 -
DeepSpeed-Ulysses:支持极长序列 Transformer 模型训练的系统优化方法
flyfish原创 2025-05-26 19:49:30 · 1612 阅读 · 0 评论 -
提示工程 - Zero-Shot、One-Shot 和 Few-Shot
flyfish原创 2025-05-18 13:22:17 · 1596 阅读 · 0 评论 -
提示工程 - 系统提示(System Prompts)
flyfish原创 2025-05-18 13:21:17 · 1100 阅读 · 0 评论 -
vLLM - LLM 类初始化参数
flyfish原创 2025-05-18 13:20:30 · 1825 阅读 · 0 评论 -
vLLM - 控制模型返回多个不同的生成结果
flyfish原创 2025-05-18 13:19:36 · 1448 阅读 · 0 评论 -
vLLM - 控制生成过程中返回对数概率信息 logprobs的输出和解释
flyfish原创 2025-05-18 13:18:58 · 4153 阅读 · 0 评论 -
FlashInfer - SparseAttention(稀疏注意力)只计算部分有意义的注意力连接,而非全部 token 对
flyfish原创 2025-05-14 19:32:14 · 1285 阅读 · 0 评论 -
FlashInfer - 测试的GPU H100 SXM、A100 PCIe、RTX 6000 Ada、RTX 4090
flyfish原创 2025-05-14 19:31:49 · 1433 阅读 · 0 评论 -
FlashInfer - 介绍 LLM服务加速库 地基的一块石头
flyfish原创 2025-05-14 19:31:23 · 2119 阅读 · 0 评论 -
vLLM - SamplingParams 参数
flyfish原创 2025-05-14 19:30:46 · 3107 阅读 · 1 评论 -
FlashInfer - FlashAttention 分块计算(Blockwise Computation) 和 IO 感知优化(IO-Aware Optimization)
flyfish原创 2025-05-13 19:28:22 · 1377 阅读 · 0 评论 -
FlashInfer - Kernel Generator(内核生成器)
flyfish原创 2025-05-13 19:27:50 · 1352 阅读 · 0 评论 -
FlashInfer - 安装 JIT、预编译、源代码编译
flyfish原创 2025-05-13 19:26:13 · 1944 阅读 · 0 评论 -
Python Datasets的FolderBasedBuilder 类 处理jsonl的底层代码
flyfish原创 2025-05-12 19:48:53 · 522 阅读 · 0 评论 -
Python 实现从 MP4 视频文件中平均提取指定数量的帧
flyfish原创 2025-04-26 11:30:59 · 553 阅读 · 0 评论 -
Python 实现将图像发送到指定的 API 进行推理
flyfish原创 2025-04-26 11:30:32 · 862 阅读 · 0 评论 -
变分自编码器(Variational Autoencoder, VAE)的核心作用
flyfish原创 2025-04-15 14:47:23 · 1913 阅读 · 0 评论 -
Qwen 2.5 VL 批量推理的消息预处理
flyfish原创 2025-04-15 14:46:03 · 783 阅读 · 0 评论 -
Qwen 2.5 VL 多种推理方案
flyfish原创 2025-04-15 14:45:18 · 2467 阅读 · 0 评论 -
大模型的 AWQ: Activation-Aware Weight Quantization 激活值感知权重量化 压缩
flyfish原创 2025-04-09 17:07:41 · 1698 阅读 · 0 评论 -
大模型的Double Quantization(双量化)
flyfish原创 2025-04-09 16:52:58 · 1126 阅读 · 0 评论 -
深度解析“熵”
flyfish原创 2025-04-03 18:44:56 · 2126 阅读 · 0 评论 -
置信度是什么?
flyfish原创 2025-03-22 12:22:19 · 3215 阅读 · 0 评论 -
Python 线程池
flyfish原创 2025-03-19 18:45:38 · 1553 阅读 · 0 评论 -
Python 获取显存信息
flyfish原创 2025-03-19 18:45:06 · 1179 阅读 · 0 评论 -
随着样本量的增加,样本统计量会趋近于总体参数
flyfish原创 2025-03-16 16:35:03 · 1697 阅读 · 0 评论 -
读 Gemma 3 二分
flyfish原创 2025-03-15 21:30:57 · 1357 阅读 · 0 评论 -
大模型推理后JSON数据后处理
flyfish原创 2025-03-15 20:07:50 · 2654 阅读 · 0 评论
分享