Qwen-3（通义千问 3 系列模型）

最新推荐文章于 2025-11-11 01:39:19 发布

原创最新推荐文章于 2025-11-11 01:39:19 发布 · 661 阅读

CC 4.0 BY-SA版权

文章标签：

部署运行你感兴趣的模型镜像

Qwen-3（通义千问 3 系列模型） 中两种文本匹配模型训练与架构的讲解，核心是 “表示型文本匹配（Embedding）” 和 “交互型文本匹配（Reranking）” 的训练逻辑，分两部分看：

用途：做 “交互型文本匹配”，核心是模拟文本 交互过程 重新排序（比如对初筛的候选文档，进一步判断相关性，挑出最匹配的）。
输入结构：{instruction} {Query} + {Doc} Assistant ，把指令、查询、文档、助手角色等信息组合输入，模拟 “交互对话” 场景。
训练逻辑：模型通过 “M head” 输出 p("yes"|(i,q,d)) 概率，判断文本交互后的匹配度，让相关文本的 “yes” 概率更高，实现重排序。

表示型（Embedding）：侧重 “静态向量表示”，用向量相似度快速筛文本；
交互型（Reranking）：侧重 “动态交互判断”，模拟对话逻辑精细排序。
两者配合（比如先 Embedding 粗筛，再 Reranking 精排），能提升文本匹配的精度和效率，是大模型检索、问答系统里的常见组合思路。

您可能感兴趣的与本文相关的镜像