一、技术选型与核心组件解析 1.1 黄金技术栈选型 组件 推荐方案 核心优势 资源需求 文本嵌入模型 sentence-transformers/all-MiniLM-L6-v2 轻量级(128MB)、支持多语言语义编码,余弦相似度准确率达89.2% CPU即可运行 向量数据库 FAISS(内存检索)/Chroma(持久化存储) FAISS毫秒级检索速度,Chroma支持增量更新和元数据过滤 本地部署优先选Chroma 大语言模型 GPT-3.5-turbo(云端)/ChatGLM-6B(