Qwen
文章平均质量分 81
Qwen具备自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为AI Agent进行互动等多种能力。
二分掌柜的
二分掌柜的
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ReLU Rectified Linear Unit 修正线性单元 函数图像、求导、x=0处不可导的处理
flyfish原创 2025-12-30 18:58:25 · 754 阅读 · 0 评论 -
通过例子和可视化来理解极限
flyfish原创 2025-12-30 18:57:38 · 938 阅读 · 0 评论 -
绝对值的性质和可视化
flyfish原创 2025-12-29 18:47:59 · 607 阅读 · 0 评论 -
极限的常数倍数性质证明和可视化代码
flyfish原创 2025-12-29 18:47:01 · 1012 阅读 · 0 评论 -
Sigmoid 函数求导的详细步骤和可视化
flyfish原创 2025-12-28 17:45:16 · 984 阅读 · 0 评论 -
极限的基本运算性质
flyfish原创 2025-12-28 17:44:15 · 637 阅读 · 0 评论 -
使用复合梯形法则(Composite Trapezoidal Rule)求面积 包含可视化代码
flyfish原创 2025-12-25 19:11:52 · 817 阅读 · 0 评论 -
不定积分求出原函数,定积分用这个原函数在上下限的差值算出具体数值
flyfish原创 2025-12-25 19:11:01 · 566 阅读 · 0 评论 -
最基础的神经网络可视化 包括源码
flyfish原创 2025-12-25 19:09:17 · 988 阅读 · 0 评论 -
两种方式求解定积分 分割→近似→求和→取极限 和 牛顿 - 莱布尼茨公式 包括可视化源码
flyfish原创 2025-12-25 19:08:23 · 961 阅读 · 0 评论 -
动画展示梯度下降(二维和三维)包括源码
flyfish原创 2025-12-25 19:06:42 · 986 阅读 · 0 评论 -
模型微调 - 低秩适应背后的数学原理 Eckart–Young–Mirsky 定理
flyfish接着 模型微调 - 低秩适应背后的数学原理 矩阵的 Frobenius 范数 这篇文说。原创 2025-11-26 19:36:11 · 576 阅读 · 0 评论 -
模型微调 - 低秩适应背后的数学原理 矩阵的 Frobenius 范数
flyfish。原创 2025-11-26 19:35:15 · 448 阅读 · 0 评论 -
满秩分解是怎么把矩阵分解成了两个满秩的矩阵
flyfish原创 2025-11-24 22:15:50 · 161 阅读 · 0 评论 -
以低成本定制大模型,进而高效适配新任务的技术思路 - 低秩适应的设计
flyfish原创 2025-11-21 19:06:29 · 811 阅读 · 0 评论 -
MLP(Multilayer Perceptron,多层感知机)怎么解决异或问题
flyfish原创 2025-10-29 16:47:49 · 966 阅读 · 0 评论 -
为什么异或问题对单层感知机是难题
flyfish原创 2025-10-29 16:47:00 · 540 阅读 · 0 评论 -
对Qwen3-VL-4B-Instruct模型的微调 - PEFT 的包装机制
flyfish原创 2025-10-29 15:50:22 · 1191 阅读 · 0 评论 -
对Qwen3-VL-4B-Instruct模型的微调 微调层与冻结层信息
flyfish原创 2025-10-29 15:49:41 · 929 阅读 · 0 评论 -
对Qwen3-VL-4B-Instruct模型的微调 原始模型结构与微调结构的对比
flyfish原创 2025-10-29 15:48:52 · 1969 阅读 · 0 评论 -
Qwen3-VL LoRA 微调 和 部分参数全量微调
flyfish原创 2025-10-23 18:43:26 · 3064 阅读 · 0 评论 -
ImportError: cannot import name ‘PytorchGELUTanh‘ from ‘transformers.activations‘
这个语句和 a = [1,2,3]、b = a(让 b 成为列表 a 的别名)的语法完全相同 —— 都是 “让左侧变量指向右侧对象”,通过 通用的 “变量赋值语句”(Variable Assignment Statement) ,让新变量指向已有的类对象,从而形成 “别名” 效果。在上面的代码下加了一句。原创 2025-10-23 18:43:00 · 483 阅读 · 0 评论 -
将用于 Swift 微调模型的 JSON Lines(JSONL)格式数据集,转换为适用于 Qwen VL 模型微调的 JSON 格式
flyfish原创 2025-10-23 18:42:33 · 373 阅读 · 0 评论 -
微调 Qwen3-VL 使用自定义数据集配置
flyfish原创 2025-10-23 18:41:55 · 1047 阅读 · 0 评论 -
LoRA 微调大模型直观的理解
flyfish原创 2025-10-17 22:09:21 · 1282 阅读 · 0 评论 -
vLLM 推理 AWQ 量化后的模型
flyfish原创 2025-10-15 18:02:41 · 1311 阅读 · 0 评论 -
vLLM库实现大语言模型的推理对比原始基础模型与 LoRA 微调模型的输出结果
flyfish原创 2025-10-15 08:42:57 · 1131 阅读 · 0 评论 -
vLLM 使用 LLMEngine 加载基础模型与 LoRA 微调权重,处理对话请求并生成回答
flyfish原创 2025-10-15 08:42:04 · 824 阅读 · 0 评论 -
vLLM 框架中 定义LLMEngine(推理引擎)的初始化参数 EngineArgs
flyfish原创 2025-10-15 08:40:48 · 565 阅读 · 0 评论 -
swift 微调 Qwen 大语言模型后使用 swift 推理和 vLLM 推理
flyfish原创 2025-10-15 08:39:44 · 350 阅读 · 0 评论 -
一个基于稀疏混合专家模型(Sparse Mixture of Experts, Sparse MoE) 的 Transformer 语言模型
flyfish原创 2025-10-12 21:39:04 · 901 阅读 · 0 评论 -
稠密(Dense)架构与稀疏(Sparse,以MoE为代表)架构的差异
flyfish原创 2025-10-12 08:41:56 · 1701 阅读 · 0 评论 -
Qwen3-VL-30B-A3B-Instruct 视觉-语言大模型
flyfish原创 2025-10-12 08:40:34 · 1033 阅读 · 0 评论 -
Python JSON数据的处理更简单的方式
flyfish原创 2025-10-12 08:39:44 · 952 阅读 · 0 评论 -
flash_attn 错误的修复
flyfish原创 2025-10-09 18:25:09 · 315 阅读 · 0 评论 -
Python 数学公式构建海洋不明生物(好像是水母)动画 - 傅里叶合成模拟复杂波形
flyfish原创 2025-09-27 18:43:43 · 773 阅读 · 0 评论 -
Python 数学公式构建海洋不明生物(好像是水母)动画 - 波浪起伏效果
flyfish原创 2025-09-27 18:29:15 · 1045 阅读 · 0 评论 -
Python 数学公式构建海洋不明生物(好像是水母)动画 - 简谐振动
flyfish原创 2025-09-27 18:11:26 · 1007 阅读 · 0 评论 -
Python 数学公式构建海洋不明生物(好像是水母)形态与运动
flyfish原创 2025-09-27 11:36:26 · 1798 阅读 · 0 评论 -
Python 构建 洛伦茨吸引子 动画
flyfish原创 2025-09-27 11:31:40 · 1107 阅读 · 0 评论
分享