程序员胡默默-优快云博客

原创 LLM Agent应用场景：Agentic RAG

例如，在回答“找出所有区域的共同休假日期”时，查询规划代理可以首先将问题分解为查询每个区域的休假日期子问题，然后将这些子问题的结果合并以找出共同休假日期。例如，询问“找出所有区域的共同休假日期”时，如果只能传递前K个片段给大型语言模型(LLM)，那么能够比较的区域数量就受到K的限制，导致结果不够全面。例如，在需要同时进行概括和语义搜索的任务中，路由代理可以将查询分别发送到概括工具和语义搜索工具中，然后将两个工具的结果进行合并和整合。的概念来增强LLM的能力，成功地解决了传统RAG在处理复杂查询时的局限性。

2025-04-02 10:22:00 987

原创 LLM Agent：智能应用开发的新篇章

它融合了自然语言处理(NLP)、深度学习、机器学习等多种先进技术，能够模拟人类语言理解和生成能力，进行复杂的文本处理、知识推理和决策制定。将在未来发挥更加重要的作用。同时，随着跨模态、多语言等技术的突破，LLM Agent的适用性和智能化水平将进一步提升。就是一个不错的例子，上一篇文章探索新一代大模型代理(LLM agent)及其架构，也和大家一起了解了LLM Agent相关的架构，助力大家快速掌握LLM Agent。出现，它们将不仅仅是我们的工作助手和生活伴侣，更是推动社会进步和创新的重要力量。

2025-04-02 10:14:02 580

原创探索新一代大模型代理（LLM agent）及其架构

在人工智能大模型(AI)的浪潮中，2023年我们见证了检索增强生成(Retrieval Augmented Generation, RAG)的兴起，而2024年则无疑成为了“代理”agent的元年。各大AI企业纷纷投身于聊天机器人代理的研发中，工具如MultiOn通过与外部网站的连接实现了快速增长，而框架如LangGraph和LlamaIndex Workflows则助力全球开发者构建结构化的代理应用。然而，尽管代理在AI生态系统中备受瞩目，它们却仍未能在消费者或企业用户实际业务场景中掀起波澜。

2025-04-01 10:38:19 778

原创 GraphRAG原理深入剖析--图谱检索

GraphRAG为我们提供了2种方式的检索：local search和global search;接下来我们分别分析一下这两种检索方式。

2025-03-27 09:59:44 539

原创 GraphRAG原理剖析-知识图谱构建

这个阶段通过语言模型（LLM），为图谱构建一个多层面的社区报告。其核心步骤主要包括以下几步：1）社区报告生成：通过大语言模型，为每个社区生成详尽的报告。这些报告不仅捕捉到社区的独特特征，还通过综合分析社区概览、关键实体、关系和声明，提供对社区的全面认识，无论是宏观还是微观层面。2）报告摘要提炼：利用大语言模型对详尽的社区报告进行压缩，制作成简洁的摘要。这样，用户可以快速浏览报告，迅速把握核心内容。3）社区向量嵌入：通过文本嵌入技术，将社区报告、摘要和标题转化为数值向量。

2025-03-11 10:01:28 851

原创 GraphRag-知识图谱结合LLM的建索增强

GraphRAG通过结合图结构数据，解决了传统RAG的这些问题，它能够检索并利用不同信息片段之间的关系，提供更为丰富的上下文，同时也支持多跳的推理，并以更结构化的方式表示知识。事实上在我们大部分的文本内容并不是孤立的，而是互联的，传统的方式恰恰忽略了这种互联关系。随后，GraphRAG 运用先进的排序与过滤技术，将这些多样化的数据源精心编排，确保每一份信息都能在有限的上下文窗口中发挥其最大效用，为 LLM 提供最直接、最相关的实体级信息支持，从而精准回应用户查询，深化理解，提升答案的精准度与深度。

2025-03-11 09:36:25 628

原创大模型Agent：人工智能的崭新形态与未来愿景

大模型 Agent 乃是构建于大规模语言模型之上的智能实体，融合了自主性、交互性、反应性以及主动性等多元特质。具体来讲，Agent 拥有专属的计算资源和行为控制机制，即便在没有外界直接操控的状况下，也能够依据自身的内部状态以及所感知到的外部环境信息，独立自主地决定并掌控自身的行为。与此同时，Agent 还能够和其他 Agent 或者系统展开形式多样的交互，达成协同作业，并针对环境的变化及时作出反应。定义：Tool Use是指Agent能够识别、选择和利用外部工具或系统来完成任务或解决问题的一种能力。

2025-03-04 19:11:43 776

原创初始提示词(Prompting)

通过提供特定的提示，他们可以指导模型的行为、语气或风格，确保生成的文本符合他们的要求。提高准确性：通过整合引用特定事实或上下文的提示，模型可以从外部记忆模块中获取相关信息，并生成更准确、更符合上下文的文本。Prompting工程：设计有效的提示以产生期望的输出可能是具有挑战性的。基于示例的Prompting：这些提示提供期望输出的示例，允许模型从特定实例中学习，并生成遵循类似模式或特征的文本。Prompting多样性：使用多样化的Prompting有助于减少偏见，增加模型生成无偏见和包容性文本的能力。

2025-03-04 18:43:33 839

原创大模型RAG(检索增强)创新--SELF-RAG

检索增强生成 (RAG) 提供了一种将 ChatGPT/GPT-4 等大型语言模型与自定义数据集成的途径，但存在局限性。让我们看看 RAG 最近的研究是如何解决一些问题。大语言模型(LLM)将改变整个金融领域。其中一个场景是大语言模型可以学习大量文档，并在很短的时间内分析趋势并分析收益。但存在的问题是很多时候你得到的答案只是部分且不完整的。举例来说，您有一个文档，其中包含 X 公司过去 15 年的年收入，但位于不同的段落。

2025-02-27 22:21:29 769

原创大模型RAG中的retrieve策略

最近一直做大模型RAG(检索增强)相关的一些事情，现阶段模型还没办法做到足够智能，需要有RAG(检索增强)进行一些能力加强，特别是一些事实类和实时类的信息之前聊过，我们在实践过程中也落地了很多策略，比如我们发现在某些场景下较小的query和较小的块匹配精准度更好一些，但是较小的块容易遗漏很多上下文信息，所以我们尝试先将文本切成不同size 的块，小块和大块之间有一定的关联，然后用小块做embedding匹配，然后再query找小块对应的大块，这样既兼顾了准确性也考虑到了充足的上下文，整体效果还不错。

2025-02-27 22:16:24 800

原创大模型RAG切块策略

RAG（检索增强）技术说起来比较简单，但是落地到具体工程很复杂，他确实是一门入门很简单但是精通很难的技术。理论上模型如果足够强大，我们不太需要关注RAG，但是现阶段大部分模型还需要RAG做一些辅助的事情，所以很尴尬的是一方面不想投入太多时间去做RAG，另一方面还不得不研究RAG。所以今天还是聊聊RAG中切块相关的策略。主要是一些面试沟通的一些策略经验来供大家参考。

2025-02-27 22:05:04 476

原创 RAG（检索增强生成）原理、实现与评测方法探讨

解释一下embedding:嵌入，它其实就是将高维度的，复杂的、通常是离散的数据（比如文本、图像、音频等）转换为低维度的、连续的向量表示的过程。变体3:在线查询：query->意图识别->大模型丰富问题->embedding query->向量检索->切块->emdedding->rank->送给大模型->LLM归纳生成。变体2:在线查询：query->意图识别->embedding query->向量检索->切块->emdedding->rank->送给大模型->LLM归纳生成。我们使用的第二种方式。

2025-02-26 23:22:55 973

原创初识大模型

学习大模型

2024-07-09 19:45:15 761

原创容灾技术（一）

软件定义存储是一种存储架构，它将存储管理软件从专用硬件中解耦出来，并将其部署在通用服务器硬件上。SDS 通过软件来实现存储管理功能，包括数据保护、数据重复、快照、压缩、自动化等。这种架构具有更灵活、更可扩展、更经济的存储解决方案。HCI：HCI指的是。

2024-04-11 18:13:13 677 2

原创 SpringDataJPA

spirng data jpa是spring提供的一套简化JPA开发的框架，按照约定好的规则进行【方法命名】去写dao层接口，就可以在不写接口实现的情况下，实现对数据库的访问和操作。同时提供了很多除了CRUD之外的功能，如分页、排序、复杂查询等等。

2023-04-20 18:45:07 1163

原创初识hibernate

学习hibernate，逐步加深

2023-04-18 18:56:52 540

原创项目中异常信息的统一处理以及JSR03校验

统一异常处理与JSR03校验框架

2023-02-20 23:10:11 467

原创跨域问题的三种解决办法

项目常见的跨域问题

2023-02-19 21:32:51 3063

原创浅谈一下socket底层

socket的浅显的底层原理

2022-12-17 18:46:51 1053

原创深入理解数据库原理

从浅入深依此理解数据库的原理

2022-10-22 13:00:51 835

原创字符串常量池

字符串常量池详解

2022-10-08 20:48:38 4276

原创 Java内存区域与内存溢出（二）

JVM必须知道的基础知识

2022-10-08 20:29:14 510

原创 JVM内存区域与内存溢出（一）

JVM基础知识回顾

2022-10-08 20:22:12 311

原创 Java并发——锁（）

锁

2022-09-26 10:09:53 833

原创 SpringBoot实现文件上传下载（2）

文件上传下载带电脑目录

2022-09-25 10:41:32 458

原创分布式架构简述

上一篇文章的前提

2022-09-23 18:01:27 692

原创分布式基本知识(常识)

分布式的入门所必备的知识，并不是很难，关键在于理解。

2022-09-23 17:58:44 881

原创详解：整合SSM

一步步操作SSM框架整合

2022-09-08 11:19:46 228

原创枚举与反射

反射详解

2022-08-20 09:51:55 223

原创面试常问的异常体系

异常体系常见问题

2022-08-08 10:46:20 194

原创谈一谈深浅拷贝？

谈一下深浅拷贝

2022-07-28 09:44:52 179

原创面试SQL语句，学会这些就够了！！！

SQL语句面试必备！！！

2022-07-27 11:33:03 4396

原创多线程原理基础

多线程原理基础

2022-07-23 12:07:44 459

原创一篇文章讲清Servlet原理

一篇文章讲清servlet基本原理

2022-07-21 14:02:46 1159

原创为什么boolean分配32bit内存？

计算机分配的最小单元必须为 1 字节（8 bit），理论上 boolean 只需要 1 bit，不过在 java 中分配了 32 bit。这是为什么呢？实际上呢是因为 CPU 内部有储存能力，分为三级缓存，它是由基准单位的，缓存是由一个个小单位组成的，这个小单位就叫缓存行（一个缓存行能存 64 字节的数据），CPU 中的中央处理器（逻辑运算单元）通过导线在缓存行中拿数据。计算机内部所有零件之间传输数据都是靠高低电压来传输的，高电压为 1，低电压是 0。如图，CPU 在缓存行中拿数据的时候，每.

2022-05-08 13:39:22 151

原创编码的底层原理

屏幕是由像素点组成的，任何图像都是由形状、颜色、亮度构成，像素点的组成又是 x、y 的坐标，三原色数值比值，亮度（234,234,10,20，30），三原色取值范围 0~255，byte 存就可以了，总共一个像素点信息需要 16+16+8+8+8 = 56 bit。假设一个字需要 200 像素，那么这个就会占 200*56 bit 的大小，不仅记录了大小，还记录了形状（因为里面有 x,y 坐标）。而像汉字有那么多，几十万啥的，需要的空间也就越大，为了节省空间并且提高性能，...

2022-04-29 17:01:54 829

原创自己编写SpringBootStarter

2022-03-19 09:43:58 1126

原创 springboot实现文件上传

先定义一个上传接口 /** * 文件上传接口 * @param file 前端传递过来的文件 * @return * @throws IOException */ @PostMapping("/upload") public String upload(@RequestParam MultipartFile file) throws IOException { String originalFilename = file

2022-03-16 14:00:51 1945

原创代码生成器——Mybatis-Plus

首先导入依赖<dependency> <groupId>com.baomidou</groupId> <artifactId>mybatis-plus-generator</artifactId> <version>3.5.2</version></dependency><!-- https://mvnrepository.com/artifact/org.apache

2022-03-15 18:44:51 1803

原创 springboot项目的mysql连接不上问题

一直出现这段，起初我以为自己用得mysql5.5导入的是8的jar包问题，结果试了也没用，密码账号也没问题，倒腾了一天才试出来密码账号需要加引号

2022-03-06 12:18:13 1340 1

空空如也

空空如也