Cinnamon/kotaemon项目使用指南:构建智能文档问答系统

Cinnamon/kotaemon项目使用指南:构建智能文档问答系统

kotaemon An open-source RAG-based tool for chatting with your documents. kotaemon 项目地址: https://gitcode.com/gh_mirrors/kot/kotaemon

项目概述

Cinnamon/kotaemon是一个基于大语言模型(LLM)的智能文档问答系统,能够帮助用户通过自然语言与上传的文档进行交互。该系统集成了多种AI模型支持,提供直观的文件管理和对话界面,特别适合需要处理大量文档并进行智能检索的场景。

核心功能配置

1. 添加AI模型

系统依赖大语言模型来完成问答任务,因此首先需要配置可用的模型资源。

模型配置步骤
  1. 进入"Resources"资源选项卡
  2. 选择"LLMs"子标签页
  3. 点击"Add"添加新模型
  4. 配置模型参数:
    • 为模型命名
    • 选择供应商/提供商(如ChatOpenAI)
    • 提供必要的API凭证和规格
    • (可选)设为默认模型
  5. 点击"Add"完成添加
  6. 切换到"Embedding Models"子标签页,重复上述步骤添加嵌入模型
环境变量配置(高级)

对于开发者或需要批量配置的场景,可以通过.env文件进行模型设置:

OpenAI配置示例

OPENAI_API_KEY=您的API密钥
OPENAI_CHAT_MODEL=gpt-3.5-turbo
OPENAI_EMBEDDINGS_MODEL=text-embedding-ada-002

Azure OpenAI配置示例

AZURE_OPENAI_ENDPOINT=您的Azure端点
AZURE_OPENAI_API_KEY=您的API密钥
AZURE_OPENAI_CHAT_DEPLOYMENT=您的部署名称
本地模型支持

系统还支持本地部署的模型,适合对隐私要求高的场景:

  • 优势:数据完全本地处理、模型选择灵活、无使用成本
  • 限制:生成质量较低、处理速度受硬件限制

推荐模型

  • Qwen1.5-1.8B-Chat-GGUF:约2GB内存占用,适合中等配置设备

启用方法

LOCAL_MODEL=模型文件完整路径

2. 文档上传与管理

系统提供直观的文件管理界面:

  1. 进入"File Index"文件索引选项卡
  2. 文件上传区域:
    • 拖放文件或从系统选择
    • 点击"Upload and Index"上传并建立索引
    • 系统将自动处理文件并显示完成状态
  3. 文件列表区域:
    • 显示所有已上传文件
    • 支持文件删除操作

3. 文档智能问答

系统核心功能是与文档进行自然语言交互:

界面布局

  1. 对话设置面板:

    • 管理对话会话(创建/重命名/删除)
    • 文件索引选择:
      • "Disabled":不使用任何文档作为上下文
      • "Search All":检索所有文件
      • "Select":手动选择特定文件
  2. 聊天面板:

    • 与AI助手进行自然对话
    • 系统将基于选择的文档提供回答
  3. 信息面板:

    • 显示回答的参考证据和引用来源
    • 提供多项质量评估指标:
      • 回答置信度:LLM对回答的自信程度
      • 相关性分数:证据与问题的匹配程度
      • 向量存储分数:嵌入相似度计算结果
      • LLM相关性分数:LLM判断的问题-证据相关性
      • 重排序分数:专业重排序模型的评估结果

评分体系说明

  • 各评分指标可靠性:LLM相关分数 > 重排序分数 > 向量分数
  • 默认按LLM相关分数排序证据
  • 包含引用的证据会优先显示

最佳实践建议

  1. 模型选择

    • 生产环境推荐使用OpenAI或Azure的付费API
    • 敏感数据考虑本地模型方案
    • 可配置多个模型以便比较效果
  2. 文档处理

    • 上传前确保文档格式正确
    • 大型文档可分拆上传提高处理效率
    • 定期清理不再需要的文件
  3. 问答优化

    • 通过评分指标筛选高质量回答
    • 合理选择检索范围提高回答准确性
    • 利用引用功能追踪答案来源

通过以上配置和使用方法,用户可以充分发挥Cinnamon/kotaemon项目的潜力,构建高效的文档智能问答解决方案。系统特别适合法律、医疗、教育等需要处理大量专业文档的领域。

kotaemon An open-source RAG-based tool for chatting with your documents. kotaemon 项目地址: https://gitcode.com/gh_mirrors/kot/kotaemon

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

虞熠蝶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值