14、利用RAG和智能体的上下文感知推理应用

利用RAG和智能体的上下文感知推理应用

1. 大语言模型的局限性

大语言模型(LLMs)在准确知识和最新知识方面面临诸多挑战,常见问题包括幻觉和知识截止。
- 幻觉 :模型自信地返回错误响应。例如,询问“snazzy - fluffykins”犬种的样子,模型会给出虚构且可能具有误导性的描述,如“snazzy - fluffykins是一种小型、毛茸茸的犬,有卷曲的毛发、又大又圆的眼睛和长长的毛茸茸的耳朵”。这会导致用户对模型生成的输出缺乏信任,影响生成式AI应用的有效性。
- 知识截止 :模型返回的答案可能与当前数据不符。所有基础模型都有训练日期的知识截止点,其知识仅限于预训练或微调时的当前数据。例如,询问最近谁赢得了NBA总冠军,模型可能给出2021年的信息,而无法提供最新数据。

2. 检索增强生成(RAG)概述

RAG不是一组特定的技术,而是一个为大语言模型提供训练期间未见过的数据访问的框架。它允许基于大语言模型的应用利用外部数据源和应用程序,克服上述知识局限性。
- 优势 :对于幻觉问题,RAG可让模型访问其原本没有的信息,如企业的专有数据;对于知识截止问题,RAG能提供超出模型训练日期的当前信息,增强基础模型的信息,且无需持续进行全面微调。
- 工作原理 :基于RAG的架构通过增强提示的形式为模型提供外部知识源的访问,增强提示包含了原始输入提示的额外上下文信息,然后使用该增强提示调用大语言模型,使模型能够利用其范围之外的知识返回更准确和相关的完成结果。

3
源码来自:https://pan.quark.cn/s/d16ee28ac6c2 ### 上线流程 Java Web平台在实施Java Web应用程序的发布过程时,通常包含以下几个关键阶段:应用程序归档、生产环境配置文件替换、系统部署(涉及原有应用备份、Tomcat服务关闭、缓存数据清除、新版本WAR包上传及服务重启测试)以及相关异常情况记录。以下将对各阶段进行深入说明。#### 一、应用程序归档1. **归档前的准备工作**: - 需要事先验证Java开发环境的变量配置是否正确。 - 一般情况下,归档操作会在项目开发工作结束后执行,此时应确认所有功能模块均已完成测试并符合发布标准。 2. **具体执行步骤**: - 采用`jar`指令执行归档操作。例如,在指定文件夹`D:\apache-tomcat-7.0.2\webapps\prsncre`下运行指令`jar –cvf prsncre.war`。 - 执行该指令后,会生成一个名为`prsncre.war`的Web应用归档文件,其中包含了项目的全部资源文件及编译后的程序代码。#### 二、生产环境配置文件调换1. **操作目标**:确保线上运行环境与开发或测试环境的参数设置存在差异,例如数据库连接参数、服务监听端口等信息。2. **执行手段**: - 将先前成功部署的WAR包中`xml-config`文件夹内的配置文件进行复制处理。 - 使用这些复制得到的配置文件对新生成的WAR包内的对应文件进行覆盖更新。 #### 三、系统部署1. **原版应用备份**: - 在发布新版本之前,必须对当前运行版本进行数据备份。例如,通过命令`cp -r prsncre ../templewebapps/`将旧版应用复...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值