一、大模型
1.工作原理
2.固有缺陷及改进方法
(1)不具备知识出现幻觉
改:使用外接知识库给LLM提供知识
(2)无法解决复杂逻辑任务
改:多个LLM协同,各司其职
(3)不擅长数学运算
改:使用外接工具如计算器等
二、大模型开发现有开发范式
1.检索增强生成(RAG)
(1)检索增强生成(Retrieval Augmented Generation,简称 RAG)是一种人工智能框架,将预先训练的语言模型与检索机制相结合,旨在解决一些不仅仅需要通用语言模型知识的任务。
(2)RAG 的工作原理如下:
检索:检索模型接收输入(如查询或提示)后,使用检索系统在广泛的文档数据库中搜索与输入最相关的文档,运用各种技术(如 tf-idf、bm25 或密集检索器等神经方法)来排序和选择最相关的信息,然后将选定的信息传递给生成模型。
生成:生成模型采用序列到序列转换器,获取用户查询和检索到的上下文,并生成连贯且上下文相关的响应。该转换器不仅考虑原始输入,还会结合检索到的文档,以确保生成的响应精确且有意义,最终的响应是检索到的信息和模型自身生成能力的组合。
2. Al Agent
(1) AI Agent 是一种能够在特定环境中自主感知、思考、决策和行动,以实现特定目标或完成特定任务的智能实体。
(2