Cherry for SDU创新实训团队周报（五）

原创

已于 2025-06-15 21:25:27 修改 · 864 阅读

·

17

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2025-05-07 11:49:42 首次发布

创新实训项目中期总结

一、项目整体进展

本项目基于Haystack框架构建生产级RAG（检索增强生成）系统，覆盖技术选型、核心功能开发、中文优化、服务器部署、前端交互全流程。通过五周迭代，实现以下核心成果：

技术架构分析：完成BM25检索、语义排序、Pipeline设计的深度解析。
功能验证：集成DeepSeek API，实现基础问答与RAG功能，发现BM25中文支持问题。
多维优化：引入jieba分词、流式输出、ChromaDB持久化存储，显著提升中文场景性能。
生产部署：完成Docker容器化部署与依赖配置，支持跨平台运行。
交互升级：基于FastAPI+SSE实现流式输出，搭建动态渲染前端界面。

二、分阶段进展与关键技术

1. 第一阶段（2025.04.02）：Haystack技术架构分析

目标：拆解框架核心模块，明确技术路线。
关键技术：
- BM25检索算法：优化长文本匹配，公式如下：
  $\sum_{i=1}^n IDF(q_i) \cdot\frac{ f(q_i, D) \cdot (k_1 + 1)}{ f(q_i, D) + k_1 \cdot (1 - b + b \cdot\frac{ |D|} { avg \text{dl}})}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。