使用 LangChain 和 Milvus 构建测试知识库

最新推荐文章于 2025-05-04 23:08:12 发布

Python测试之道

最新推荐文章于 2025-05-04 23:08:12 发布

阅读量1.4k

点赞数 29

分类专栏：测试提效 python 文章标签： python DeepSeek

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_44872675/article/details/145890816

版权

LangChain 是一个强大的框架，可以与向量数据库（如 Milvus）无缝集成，用于构建基于检索的增强生成（RAG）系统。在测试工程师的场景中，可以将测试资产（如需求文档、测试用例、缺陷报告等）存储在 Milvus 中，然后通过 LangChain 提供的检索功能快速查询和生成相关内容。

功能目标

存储测试资产：将需求文档、测试用例和缺陷记录等内容转换为向量表示并存储到 Milvus。
检索测试资产：根据用户输入的查询，快速检索相关内容。
集成生成模型：结合检索结果，生成测试用例或分析缺陷原因。

架构流程

文档预处理：
- 清理和分割文档。
- 将段落或内容片段转化为易于向量化的文本。
向量化：
- 使用嵌入模型（如 OpenAI 的 text-embedding-ada-002 或 Hugging Face 模型）将文本转化为向量。
存储：
- 将向量及其元数据存储到 Milvus 向量数据库。
检索与生成：
- 根据用户查询，通过向量相似性搜索检索相关内容。
- 将检索结果与生成模型结合，生成响应。

示例代码：

1. 安装必要的依赖

首先确保安装了以下依赖库：

pip install langchain pymilvus openai sentence-transformers

2. 启动 Milvus

可以通过 Docker 快速启动 Milvus：

docker run -d --name milvus -p 19530:19530 -p 9091:9091 milvusdb/milvus:v2.2.9

2.1 Docker容器化部署（推荐）

环境准备
- 启用Windows子系统Linux（WSL）和虚拟机平台：
  bash
  dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart
  dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart
  重启后安装Docker Desktop并启用WSL 2后端。
- 验证Docker安装：
  bash
  docker --version
  docker-compose --version
获取并运行Milvus容器
- 拉取官方镜像：
  bash
  docker pull milvusdb/milvus:latest
- 启动容器（映射端口19530和19121）：
  bash
  docker run -d --name milvus -p 19530:19530 -p 19121:19121 milvusdb/milvus:latest
  服务启动后，通过浏览器访问http://localhost:19121验证。
持久化存储（可选）
- 挂载本地目录或使用Docker卷保存数据，避免容器删除后数据丢失。

2.2 预编译包部署（适合开发者）

下载二进制包
- 从GitHub仓库matrixji/milvus的windows-test-版本中选择对应版本（如windows-test-v8）。
- 或直接下载预编译的zip包（含milvus.exe、minio.exe、etcd.exe）。
启动服务
- 解压zip包后依次运行：
  bash
  run_minio.bat 启动MinIO存储服务
  run_etcd.bat 启动etcd元数据服务
  run_milvus.bat 启动Milvus核心服务
测试连接
- 使用Python客户端验证：
  python
  from pymilvus import connections
  connections.connect(host=‘localhost’, port=‘19530’)

2.3 图形化界面（Attu）

安装Attu
- 下载Attu客户端（如attu-2.4.6-windows-x86_64.zip）并解压。
- 启动Attu：
  bash
  .\attu.exe

最低0.47元/天解锁文章

Python测试之道

博客等级

码龄6年

264
原创

4637
点赞

3297
收藏

3312
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 结合pageassist与阿里百炼api实现deepseek-r1联网搜索功能

下一篇：: 测试工程师快速上手 DeepSeek：全流程实践指南

最新评论

Redis原理与Windows环境部署实战指南：助力测试工程师优化Celery调试
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。通过 funboost web manager 全方位可视化管理和查看你的函数运行情况，无需看文件日志。 https://funboost.readthedocs.io/zh-cn/latest/articles/c13.html pip install funboost
使用 Celery + Redis + Eventlet 实现 Python 异步编程（Windows 环境）
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。通过 funboost web manager 全方位可视化管理和查看你的函数运行情况，无需看文件日志。 https://funboost.readthedocs.io/zh-cn/latest/articles/c13.html pip install funboost
构建高可维护、易测试的异步任务系统：基于 Celery + Redis + Eventlet 的模块化架构实践
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。通过 funboost web manager 全方位可视化管理和查看你的函数运行情况，无需看文件日志。 https://funboost.readthedocs.io/zh-cn/latest/articles/c13.html pip install funboost
手把手教你用 Django + Celery 实现异步任务处理（附实战案例）
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。通过 funboost web manager 全方位可视化管理和查看你的函数运行情况，无需看文件日志。 https://funboost.readthedocs.io/zh-cn/latest/articles/c13.html pip install funboost
DeepSeek 在 Windows 环境下的具体部署步骤及常见问题解决方案
rheber: 通过pip install deepseek后，python 工程中import deepseek ，提示No module named 'deepseek', 不知道什么原因

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Python测试之道 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。