自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(123)
  • 收藏
  • 关注

原创 【智能体架构:Agent】LangChain智能体类型ReAct、Self-ASK的区别

本文讲解了LangChain智能体如何定义Tool,以及智能体类型ReAct和Self-Ask的示例、区别

2025-03-05 11:11:23 1324 1

原创 【Redis】如何处理缓存穿透、击穿、雪崩

穿透:布隆过滤器 + 空值缓存。 击穿:分布式锁 + 逻辑过期。 雪崩:随机TTL + 多级缓存

2025-04-02 14:26:02 702

原创 【网络丢包】原因排查及优化

丢包原因:网络拥塞、硬件不足、配置错误、协议特性、网络干扰

2025-03-27 17:20:01 854

原创 【Golang】defer与recover的组合使用

必须将recover放在defer函数中,才能确保在panic发生后被动调用。

2025-03-22 22:34:29 1121

原创 【Coze】Coze JWTOAuth对接

JWT(JSON Web Token)模式,扣子账号直接永久授予 OAuth App 权限,OAuth App 随时可以通过后端应用签发的 JWT 获取访问令牌,以后端应用的身份请求扣子 API。

2025-03-16 22:30:36 219

原创 【RRF】递归排序融合 1 / (k + i) 核心思想

关键参数:K 控制权重衰减速度;i 文档在当前排名列表中位置;RRF目标是多个排名列表合并为一个统一的排名;核心思想:高排名文档权重更大、低排名文档权重更小;多个列表的贡献叠加

2025-03-14 14:17:31 543

原创 【Python】元组和字典的区别

元组 有序、不可变、访问创建速度快,字典 无序 键值对 查找 、插入、删除速度快

2025-03-14 14:03:33 685

原创 【RAG】混合检索(Hybrid Search) 提高检索精度

RAG基于 RRF 的融合排序,融合向量检索、关键词检索 等检索算法,提高检索精度

2025-03-09 22:38:22 975

原创 【RAG】检索后排序 提高回答精度

RAG 有时最合适结果并非最位于最前,此时:通过检索时过召回一部分文本、通过一个排序模型对 query 和 document 重新打分排序,可以提高检索精度

2025-03-09 22:24:06 713

原创 【RAG】文本分割的粒度

文本分隔粒度,按一定粒度,部分重叠式的切割文本,使上下文更完整

2025-03-09 22:12:17 192

原创 【向量模型】 开源通用向量模型BGE (BAAI General Embedding)

BGE为各类信息检索及大语言模型检索增强应用而打造,本文从多个维度详细解析 BGE 的特点与应用

2025-03-09 21:22:34 1076

原创 【RAG】基于向量检索的 RAG (BGE示例)

RAG 文本向量化(BGE)、向量检索、答案生成

2025-03-09 21:16:05 1029

原创 【RAG】向量检索

本文讲解了 什么是向量,向量相似度的计算(余弦函数、欧氏距离)、向量数据库及对比

2025-03-09 18:39:27 968

原创 【RAG】RAG 系统的基本搭建流程(ES关键词检索示例)

RAG 搭建之ES检索示例,Query -> ES检索 -> Prompt -> LLM -> 回复

2025-03-09 18:15:00 1045

原创 【渗透测试】基于时间的盲注(Time-Based Blind SQL Injection)

基于时间的盲注(Time-Based Blind SQL Injection) 攻击语句,常见于对数据库的渗透测试或恶意攻击中

2025-03-07 20:45:44 579

原创 【大模型聊天】实时交互技术选型

RAG问答、大模型聊天,技术选型需结合实时性需求与交互场景

2025-03-07 15:40:55 308

原创 【FastAPI】 AI场景快速学习指南

AI 开发场景设计的 FastAPI 快速学习指南

2025-03-07 15:04:01 439

原创 【LangChain】Python Web框架推荐

针对 LangChain AI ,关于 Python Web 框架推荐及详细技术选型指南

2025-03-07 15:02:47 1150

原创 【Embedding】何为Embedding?

Embedding 向量空间映射、语义量化、纬度坍缩

2025-03-05 23:22:07 500

原创 大语言模型(LLM)和嵌入模型的统一调用接口

Python实现LLM模型、Embedding嵌入模型工厂

2025-03-05 23:14:30 1023

原创 【智能体Agent】Action执行动作的核心数据结构

from pydantic.v1 import BaseModel, Field

2025-03-05 22:56:35 657

原创 【智能体Agent】ReAct智能体的实现思路和关键技术

基于ReAct(Reasoning + Acting)框架的自主智能体,结合LangChain框架和工具调用能力来逐步解决用户任务

2025-03-05 22:27:15 748

原创 【LangChain】问答系统如何去重回答相似问题?

去重回答决策点:小规模数据(<1k 条)原始余弦相似度 + 动态阈值;大规模数据(>1k 条) FAISS/Annoy + 混合去重

2025-03-05 17:18:05 376

原创 【LangFuse】数据集与测试

基于Langfuse的并行评估系统,主要用于对LangChain流程进行批量测试和监控

2025-03-05 16:26:43 995

原创 【LangChain】 LangChain 与 LlamaIndex 的错位竞争

LangChain侧重与LLM交互的封装,比如LCEL;LlamaIndex 侧重与数据交互的封装,比如RAG相关工具

2025-03-05 12:00:31 294

原创 【LangChain.js】Python版LangChain 的姊妹项目

LangChain.jsPython版LangChain 的姊妹项目

2025-03-05 11:57:20 159

原创 【LangChain】LangServe将Chain或Runnable部署API服务

LangServe 用于将 Chain 或者 Runnable 部署成一个 REST API 服务

2025-03-05 11:54:34 105

原创 【LangChain】存储与管理对话历史

讲解了通过LangChain的SQLChatMessageHistory,实现持久化历史记录的对话系统,允许不同session_id的对话独立存储,确保每次交互都基于完整的对话历史生成响应。多用于聊天机器人或客服系统。

2025-03-05 09:14:08 1186

原创 【LangChain】用 LCEL 实现工厂模式

LCEL实现工厂模式应用场景:热切换大模型服务、地域化服务、故障转移、A/B测试

2025-03-05 08:34:32 814

原创 【LangChain】Chain和LangChain Expression Language (LCEL)

讲解了 LCEL的用法、流式输出、RAG系统标准实现范式

2025-03-05 08:25:26 742

原创 【LangChain】对话历史管理

LangChain对话历史管理,示范了 历史记录按token裁剪和强制保留、以及过滤历史,场景保留指定角色或内容的对话历史

2025-03-04 23:01:28 1159

原创 【LangChain 数据连接封装】 文档加载器、文档处理器

LangChain 数据连接封装 文档加载器、文档处理器、向量检索

2025-03-04 15:48:56 210

原创 【LangChain】 Function Calling 代码实践

代码演示LangChain调用Function Calling 过程:首次模型调用-工具执行-二次模型调用

2025-03-04 15:08:34 395

原创 【向量数据库】Chunk和Document是什么关系以及原理?

全局元数据Document、实际内容分块Chunk;两者通过 `doc_uuid`(文档唯一标识符)建立 **一对多关系**:- 1 个 `Document` ➔ 对应 N 个 `Chunk`- 每个 `Chunk` 通过 `doc_uuid` 指向其所属的 `Document`

2025-03-04 14:28:51 660

原创 【Weaviate RAG】OpenAI+Weaviate RAG实践

OpenAI和向量数据Weaviate的RAG实践,根据查询字符串和聊天历史,生成更复杂的查询并调用 OpenAI API

2025-03-04 13:44:19 825

原创 【对话状态跟踪】关心整个对话过程用户完整意图变化

NLU设计槽值对,DST对话状态跟踪维护用户意图;

2025-03-03 22:40:20 294

原创 【Weaviate】 vector search 语义向量搜索+结构化过滤+RRF 合并新旧结果

语义搜索 + 结构化过滤 + RRF 排序融合,实现了一个灵活且鲁棒的酒店搜索系统,能够有效平衡用户的多维度需求(如设施、价格、评分)。

2025-03-03 22:18:59 977

原创 【Weaviate】 keyword search BM25全文搜索 + 结构化过滤 + RRF结果融合

keyword search 之 BM25全文搜索 + 结构化过滤 + RRF结果融合

2025-03-03 22:15:41 951

原创 【Weaviate】使用递归排名融合RRF推荐酒店

RRF 多来源排序结果聚合

2025-03-03 21:58:12 686

原创 【向量数据库Weaviate】与ChromaDB的差异、优劣

两者可互补:用 ChromaDB 快速实验,验证后迁移到 Weaviate 进行规模化部署

2025-03-03 21:30:03 1049

LLM大语言模型从理论到实践

介绍了大语言模型在推理规划、智能代理、综合应用框架以及多模态大模型等方面的研究和应用情况,最后介绍大语言模型推理优化方法。

2025-02-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除