- 博客(80)
- 收藏
- 关注
原创 OpenSpec与Cursor集成指南
OpenSpec是一个规范驱动的开发工具,可与Cursor AI编码助手无缝集成。它通过非侵入式设计(仅添加3个命令文件)实现结构化开发流程,完全不影响Cursor原生功能。OpenSpec的核心价值在于:1)先写规范再编码,减少AI误解需求导致的返工;2)提供可追溯的变更历史;3)支持团队协作。实际使用中可灵活选择:简单任务直接使用Cursor,复杂功能开发则采用OpenSpec的提案-实施-归档流程。该工具特别适合需要长期维护的复杂项目,但随时可禁用回归原生状态。
2025-11-25 12:22:21
16
原创 AgentEvolver:自进化Agent系统
摘要:AgentEvolver是一个创新的端到端自进化训练框架,通过整合自主提问(Self-Questioning)、自主导航(Self-Navigating)和自主归因(Self-Attributing)三大机制,实现了智能体的持续自我优化。该框架采用模块化设计,支持多种应用场景如应用程序自动化(AppWorld)和函数调用优化(BFCL-v3),在7B参数模型上取得了显著性能提升。其核心创新包括ADCA-GRPO算法实现细粒度信用分配、动态经验管理策略以及服务化架构设计。
2025-11-23 20:14:27
75
原创 Spring AI Alibaba DataAgent:智能数据查询系统
摘要:SpringAIAlibabaDataAgent是基于SpringAI框架的智能数据查询系统,可将自然语言转换为SQL查询并生成分析报告。系统采用状态图(StateGraph)架构,实现从意图识别到报告生成的完整数据分析流程,支持多数据源查询和流式处理。核心组件包括证据召回、查询增强、SQL生成与执行等节点,通过多轮优化确保查询质量。技术栈涵盖Java17、SpringBoot3.4.8、DashScope大模型和向量检索技术,支持MySQL、PostgreSQL等多种数据库。
2025-11-22 12:03:11
87
原创 Palantir数据存储架构
Palantir Foundry平台通过ObjectStorageV2架构解决企业数据孤岛问题,其核心创新是多数据源Object类型(MDOs)。该架构将物理分散的数据虚拟整合为统一业务对象,支持列级权限控制。MDOs通过横向拼接不同数据源的属性构建完整业务视图,最多支持70个数据源整合。相比传统存储架构,ObjectStorageV2更灵活,但需注意属性不能跨源映射等限制。这一技术实现了数据层与业务层的有效解耦,为企业提供智能化的数据整合方案。
2025-11-21 19:31:14
101
原创 虚拟本体:基于语义层的自然语言SQL生成系统技术深度解析
VirtualOntology是一个创新的语义数据查询系统,通过轻量级本体层实现自然语言到SQL的自动转换。该系统采用三层架构设计:本体层定义业务概念与关系映射,API服务层提供安全可控的查询接口,数据层直接连接现有SQL数据库。应用场景主要面向MES制造执行系统,支持产能分析、质量调查等典型业务查询,首次尝试成功率可达86%。核心技术包括:基于YAML的本体规范定义、FastAPI构建的RESTful接口、SQLModel实现的数据访问层,以及自动化的查询模式学习机制。
2025-11-14 19:44:50
814
原创 AWS Bedrock Agent 结构化数据查询系统
本文介绍了一种基于Amazon Bedrock Agent的智能数据库查询系统,通过LLM驱动的Text-to-SQL技术实现自然语言到结构化数据的查询转换。系统采用Lambda函数作为Action Group、LlamaIndex作为查询引擎、Athena作为数据源,结合Few-Shot Learning和向量检索技术,构建了高效的AI驱动数据分析平台。文章详细解析了系统架构、核心实现和部署实践,包括关键技术组件如Bedrock Agent、Lambda函数、Few-Shot示例设计和提示词工程。
2025-11-09 18:52:50
652
原创 Palantir Foundry本体层次与数据存储
Palantir的Ontology架构采用三层设计:语义层定义业务对象和关系("名词"),动势层描述业务流程和操作("动词"),动态层实现智能决策(规则和AI)。这三层形成从数据建模到业务执行的闭环系统。数据存储采用分布式多模型架构,包括对象存储、时序数据库等,通过微服务提供统一访问。系统通过连接器接入多源数据,经五层流水线处理后生成实时更新的数字孪生知识图谱。
2025-11-06 19:17:01
1414
原创 Apache Calcite查询规划
将解析、校验、转换与规则集集中管理,适合内核嵌入与按需裁剪。等价类+Trait 的优化框架:Volcano 的动态规划与 trait 传播/派生提供强大的跨后端可塑性,是将“逻辑计划”转为“物理实现”的关键。RelRule的配置化让规则编写更加声明式,结合RelBuilder便于维护与组合。、基准代码清晰地展示了正确性预期与使用模式,是学习与回归的最佳入口。
2025-11-04 20:18:38
625
原创 Dremio查询加速技术全解析
Dremio查询加速系统通过反射(Reflections)和结果缓存机制显著提升查询性能。反射分为原始反射、聚合反射、外部反射和星花反射四种类型,通过预计算和优化存储数据来加速查询。系统支持自动和手动反射管理,并与多种数据格式兼容。结果缓存可复用相同查询结果,降低计算开销。前端界面提供反射配置、性能监控和智能推荐功能,后端架构包含反射服务、存储层、查询重写引擎和智能推荐系统。实际应用案例显示,反射技术可实现15-30倍的查询性能提升。
2025-11-03 21:11:03
704
原创 Dremio开源数据湖引擎
本文深入解析Dremio数据湖引擎的技术架构,主要包括以下内容:1)Dremio的核心应用场景包括数据湖查询加速、多源联邦查询、数据虚拟化等;2)系统采用模块化设计,包含查询引擎、存储插件、服务组件等核心模块;3)关键技术栈基于Calcite、Arrow等开源框架;4)采用插件化架构、工厂模式等设计模式实现可扩展性;5)详细分析查询执行流程和反射加速机制;6)提供存储插件开发和优化规则扩展的实现示例;7)介绍多种部署方式。
2025-11-01 09:57:21
841
原创 SQLBot:基于大模型和RAG的智能问数系统
摘要:SQLBot是一款基于大模型和RAG技术的智能数据分析系统,支持自然语言转SQL查询。系统采用FastAPI+Vue3现代化架构,核心功能包括:1)多数据源连接管理;2)LLM服务实现Text-to-SQL转换;3)RAG增强的语义检索;4)流式响应交互。技术亮点包含工厂模式管理AI模型、单例模式缓存嵌入模型、策略模式支持多数据库类型。系统通过组件化设计和容器化部署,为企业数据分析、BI系统集成等场景提供智能查询能力,是AI技术在企业级应用中的典型实践案例。
2025-10-31 19:15:29
1168
原创 LangGraph 官方教程:聊天机器人之七
摘要 LangGraph的时间旅行功能允许用户回退和探索聊天机器人的不同执行路径。通过get_state_history方法可以获取历史检查点,并在特定时间点恢复执行。该功能支持两种实现方式(Python和JavaScript),适用于需要修复错误、尝试不同策略或构建自主代理等场景。关键步骤包括:1) 添加检查点保存状态;2) 浏览完整状态历史;3) 通过checkpoint_id从指定时间点加载状态。该功能为调试和交互式应用开发提供了强大支持,特别适合构建复杂AI工作流和自主代理系统。
2025-10-30 12:03:20
937
原创 LangGraph 官方教程:聊天机器人之六
本文介绍了如何在LangGraph中实现自定义状态管理,通过添加name和birthday字段来增强聊天机器人功能。关键步骤包括:1) 在状态中定义额外字段;2) 创建human_assistance工具实现人工审核机制;3) 演示了状态更新流程,包括人工干预时修正数据。文章特别展示了如何通过中断机制获取人工输入,并利用Command对象更新状态,同时还介绍了手动更新状态的方法。这种设计模式使得复杂的工作流控制成为可能,同时保持了数据的持久性和可追溯性。
2025-10-29 12:19:50
1021
原创 LangGraph 官方教程:聊天机器人之五
本文介绍了如何在LangGraph框架中实现人机协作控制功能。通过添加human_assistance工具和使用interrupt函数,可以使AI系统在执行过程中暂停并等待人工输入,从而在需要人工监督或干预的场景下提高可靠性。文章详细展示了Python和JavaScript两种语言的实现代码,包括工具定义、图构建、执行中断与恢复的全流程。该功能基于检查点持久化机制,支持无限期暂停后准确恢复执行,为构建更可靠的AI代理系统提供了关键技术支持。
2025-10-28 12:30:00
808
原创 LangGraph 官方教程:聊天机器人之四
本文介绍了如何通过LangGraph的检查点系统为聊天机器人添加记忆功能,实现连贯的多轮对话。主要步骤包括:1)创建内存检查点器(MemorySaver);2)在编译图时配置检查点器;3)通过指定thread_id来维护对话上下文;4)演示了检查点系统如何在不同thread_id下保持独立对话状态。该方法不仅支持简单的聊天记忆,还能保存和恢复复杂状态,为错误恢复、人机协作等工作流提供了基础。文中提供了Python和JavaScript两种实现代码,并展示了如何检查保存的对话状态。
2025-10-27 12:05:22
681
原创 LangGraph 官方教程:聊天机器人之三
本文介绍了如何通过LangGraph的检查点系统为聊天机器人添加记忆功能,实现多轮对话的上下文保存。通过创建MemorySaver检查点器(可替换为数据库存储方案),在编译图时注入该检查点器,并使用唯一thread_id标识对话线程,系统能自动保存和恢复状态。这使机器人能在不同对话中记住用户信息,如演示中机器人能准确回忆用户姓名。检查点系统比简单记忆更强大,可处理复杂状态,支持错误恢复和人机协作等工作流。最后展示了如何通过get_state()方法查看保存的对话状态,包括完整的消息历史记录。
2025-10-26 12:16:29
1069
原创 LangGraph 官方教程:聊天机器人之二
本文介绍了如何通过集成Tavily搜索引擎来增强聊天机器人的回答能力。主要内容包括:1)安装和配置Tavily搜索API;2)定义搜索工具并绑定到语言模型;3)构建状态图(StateGraph)实现对话流程控制;4)添加条件边(conditional edges)实现工具调用逻辑;5)使用预构建组件简化开发。最终实现的聊天机器人能自动判断何时需要网络搜索,并整合搜索结果给出更准确的回答。这种方法显著扩展了聊天机器人处理超出其训练数据范围问题的能力。
2025-10-25 17:05:40
910
原创 LangGraph 官方教程:聊天机器人之一
摘要: LangGraph是一个面向开发者的AI智能体构建框架,强调可靠性、可控性和可扩展性。开发者可通过审核检查、持久化上下文和人类参与审批来确保智能体行为合规。其核心特性包括:1)使用低层原语构建自定义智能体;2)支持多智能体系统协作;3)提供原生流式传输,实现执行过程实时可见。教程指导用户从基础聊天机器人开始,逐步添加工具调用、记忆存储、人工审核等功能,最终构建支持复杂查询处理的智能体。
2025-10-24 18:49:11
1002
原创 SuperSonic提示词设计与实现深度解析
本文深入解析了SuperSonic文本到SQL流程中的提示词体系,从核心机制到工程实践。系统通过Few-shot示例选择、Schema格式化、上下文信息注入等构建精准提示词,并设计多场景模板(SQL解析、纠错、优化、建模)。关键技术包括:智能示例采样机制保证多样性,结构化Schema表示降低解析歧义,自一致性投票提升结果稳定性。工程实践层面实现了字段下采样控制长度,规则化+LLM双重纠错机制,以及性能优化策略。实际案例验证了系统在时间范围推理、聚合条件处理等方面的有效性,准确率可达95%以上。
2025-10-23 18:20:39
1414
原创 SuperSonic Text2SQL:智能自然语言转SQL解析引擎
SuperSonic的Text2SQL功能通过大语言模型实现自然语言到SQL的转换,采用多策略生成、智能Schema映射、Few-shot学习等技术。核心架构包含LLMSqlParser解析器、LLMRequestService请求服务和SqlGenStrategy生成策略,支持自一致性推理和多轮纠错。系统通过Prompt优化、并行推理和缓存策略提升性能,采用模块化设计确保扩展性和可靠性,为AI+BI系统提供了高效的自然语言查询解决方案。
2025-10-22 19:32:32
638
原创 Palantir的本体论建模跟数仓建模的异同
Palantir的Foundry Ontology通过构建组织的数字孪生体,将数据集和模型映射为对象类型、属性、链接和操作类型,形成完整的语义知识网络。与传统数仓建模相比,本体建模以业务问题为驱动,强调细粒度语义和实时决策能力,采用图语义技术实现灵活的映射关系。
2025-10-21 20:27:46
806
原创 AI+BI平台SuperSonic解析
SuperSonic是一个AI驱动的BI平台,采用SpringBoot微服务架构,集成LangChain4j和多种数据库,通过语义层和LLM实现自然语言到SQL转换。核心功能包括:1)企业数据分析,支持自然语言查询和智能报表生成;2)数据民主化,降低非技术人员使用门槛;3)多源数据整合,统一访问异构数据源。平台采用策略模式、工厂模式等设计模式,关键组件包括LLMSQL解析器、语义层服务和查询执行引擎。技术栈涵盖Java21、React18、LangChain4j等,支持独立和分布式部署。
2025-10-21 17:45:00
1031
原创 WrenAI:企业级AI数据分析平台技术解析
WrenAI是一个开源的企业级AI数据分析平台,采用微服务架构设计,包含前端React应用、后端GraphQL服务和AI推理引擎三大核心组件。平台通过自然语言查询实现智能数据分析,主要应用于商业智能分析、数据民主化和企业数据治理场景。技术架构上使用Python FastAPI处理AI推理、Node.js实现GraphQL中间层,并采用Docker容器化部署。项目亮点包括管道式AI处理流程、多LLM适配器模式以及实时状态管理机制,为企业提供了一套完整的AI驱动数据分析解决方案。
2025-10-20 18:37:07
1003
原创 Langgraph译文1:让AI自主决策的代理架构
本文介绍了LLM代理架构的核心概念及其实现方式。代理系统通过让LLM自主决定控制流程来解决复杂问题,主要包含路由器、工具调用代理等架构。路由器通过结构化输出实现单步决策,工具调用代理则支持多步决策、记忆管理和规划能力。文章还探讨了自定义代理架构的关键功能:人类参与可提升高风险任务的可靠性;并行化提高处理效率;子图实现模块化管理;反思机制支持自我改进。这些技术共同构成了灵活强大的代理系统框架,可处理复杂工作流并持续优化性能。
2025-10-18 16:01:29
628
原创 Vanna.AI:基于RAG的智能SQL生成框架解析
Vanna.AI是一款开源的Python RAG框架,专注于将自然语言转换为SQL查询。该项目采用模块化架构,支持多种LLM和向量数据库,通过训练-检索-生成的工作流程实现高精度SQL生成。核心功能包括:1)企业数据分析,使非技术人员能够进行复杂查询;2)数据库管理自动化;3)教育培训工具。技术架构上,项目使用抽象工厂模式、策略模式等设计模式,支持OpenAI、Claude等LLM集成,以及ChromaDB、Pinecone等向量数据库。
2025-10-17 12:30:00
706
原创 Cherry Studio知识库功能解析
CherryStudio知识库系统采用RAG技术实现智能文档管理,核心架构包括知识服务主进程、多格式文档加载器和基于SQLite的向量数据库。系统支持文本/网页/电子书/Office文档处理,通过递归分块和向量化技术实现内容检索。采用混合搜索策略(向量+文本搜索)结合重排序算法优化结果,并具备并发处理、缓存机制等性能优化设计。系统提供插件化扩展接口和配置化管理,支持自定义文档处理和嵌入模型。用户界面包含知识库管理、分页设置和实时状态显示功能,形成了一套高效可扩展的知识检索解决方案。
2025-10-16 12:30:00
1661
原创 DB-GPT AWEL工作流引擎深度解析
DB-GPT项目的AWEL工作流引擎为AI应用开发提供了创新解决方案。AWEL采用智能体优先的设计理念,通过三层架构(操作符层、智能体流层、DSL层)实现灵活性和易用性的平衡。其核心组件包括DAG管理、基础操作符和工作流执行器,支持类型安全、异步执行和智能资源管理。AWEL显著简化了复杂AI工作流的开发,支持RAG系统、多模态处理等场景,并提供生产级可靠性保障。
2025-10-15 19:09:57
871
原创 智能SQL客户端Chat2DB技术解析
Chat2DB是一款集成AI能力的智能SQL客户端和可视化工具,支持16+种主流数据库。文章从技术架构角度分析了其核心实现,包括:1)基于Java SPI的插件化架构设计,实现多数据库扩展;2)SpringBoot+React的前后端分离架构;3)AI辅助SQL生成的多模型集成方案;4)Electron跨平台桌面应用开发。重点解读了统一SQL执行器、数据库连接管理、AI服务适配等核心组件,并展示了插件开发、前端组件实现等最佳实践案例。
2025-10-14 12:07:35
880
原创 DB-GPT实现Text2SQL全流程解析
本文深入解析了DB-GPT框架中Text2SQL功能的完整实现机制,详细介绍了从自然语言查询到SQL执行的全流程技术方案。文章重点分析了智能表结构检索、精确提示词工程、安全SQL执行三大核心技术,通过模块化架构设计和微调框架集成,实现高准确率、高性能、高安全性的自然语言数据库查询系统。同时提供了实际案例演示、性能优化策略和错误处理机制,并展望了未来发展方向,为开发者构建AI驱动的数据库交互系统提供了完整参考。
2025-10-13 19:03:20
1519
原创 DB-GPT:AI原生数据应用开发框架解析
DB-GPT是一个开源AI原生数据应用开发框架,集成了AWEL工作流引擎和多智能体系统。本文从架构设计、核心组件到具体实现,全面剖析了DB-GPT的技术方案,重点解析了Text2SQL功能的完整实现机制。框架采用分层架构设计,包含Core基础层、App应用层和Serve服务层,支持插件化扩展。核心技术亮点包括:基于AWEL的声明式工作流编排、多智能体协作框架、企业级RAG实现,以及智能表结构检索与精确提示词工程相结合的Text2SQL功能。
2025-10-12 17:27:17
1321
原创 Cherry Studio 核心功能简介
CherryStudio是一款功能丰富的AI桌面应用,核心功能包括:1)AI对话系统支持多模型切换和流式交互;2)基于RAG架构的知识库系统,实现智能文档处理与搜索;3)符合MCP协议的插件系统,提供工具扩展能力;4)可定制的用户界面与布局管理;5)本地优先的数据存储与备份机制。应用采用安全沙箱和加密传输保障数据安全,通过性能优化确保流畅体验,满足从个人到企业级的多样化AI需求。
2025-10-11 17:42:21
1412
原创 MinerU与Docling:智能文档处理框架对比
本文对比分析了MinerU和Docling两大智能文档处理框架。MinerU专注于高精度PDF解析,采用多模态AI技术,在学术文献、金融报表等复杂文档处理上表现优异;Docling则定位企业级多格式文档处理平台,支持10+格式转换,更适合文档管理系统等场景。技术层面,MinerU基于VLM模型实现端到端处理,Docling采用插件化多后端架构。性能测试显示MinerU精度更高(95%+),但资源消耗较大;Docling处理速度更快(1-3秒/页),部署更灵活。
2025-10-10 12:09:45
920
原创 Smithery SequentialThinking:AI思维链技术深度解析
摘要:SequentialThinking是专为大型语言模型设计的MCP服务器,通过结构化思维链增强AI推理能力。它突破传统AI的线性思维局限,支持思维分支、修正和迭代优化,适用于复杂问题分析、多步骤推理等场景。核心架构包含思维历史管理、分支状态管理等功能模块,采用灵活的数据结构支持动态调整和状态持久化。该系统实现了人类认知过程的模拟,具有模块化设计、错误恢复机制等特点,为AI认知能力发展提供了新范式,在教育、科研等领域具有广泛应用前景。
2025-10-09 12:07:37
751
原创 Smithery MCP服务深度解析
本文深入解析了Smithery开发的MCP服务器集合项目,该项目基于TypeScript构建了GitHub、天气、数据库等多功能模块。文章重点剖析了项目的Monorepo架构设计、工具注册模式、配置管理机制和核心实现逻辑,包括有状态/无状态服务器模式、Zod参数验证、外部API集成等关键技术。通过对各服务器模块(GitHub、Weather、Postgres等)的具体实现分析,展示了错误处理、权限管理、状态维护等最佳实践,为开发者构建高质量MCP服务器提供了完整参考方案。
2025-10-08 09:24:39
803
原创 MinerU:多模态文档解析黑科技
摘要:MinerU 2.5是一款基于深度学习的多模态文档解析系统,在OmniDocBench基准测试中表现优异。该系统采用双后端架构设计(Pipeline和VLM模式),支持学术文献处理、企业文档数字化和AI训练数据准备等应用场景。
2025-10-07 09:11:35
1039
原创 Docling:企业级文档智能处理框架
Docling是一款基于Python的企业级文档智能处理框架,采用模块化管道架构设计,支持PDF、Word、Excel等多种格式的解析与转换。该框架通过工厂模式、策略模式等设计模式,实现了高度可扩展的OCR、布局分析和内容提取功能,为企业文档数字化转型提供完整解决方案。核心特点包括:1)多格式文档批处理能力;2)智能内容提取(表格/图像/公式);3)多模态文档处理支持;4)优化的内存管理和并发处理机制。项目采用分层架构设计,包含后端抽象层、管道处理层和模型管理层,支持插件化扩展和容器化部署。
2025-10-06 08:20:51
663
原创 Ragas:一套可扩展的RAG与LLM评估框架全解
Ragas是一个用于评估RAG系统的Python框架,提供多维度质量评估功能。核心功能包括离线评测、回归验证、统一接口集成不同LLM与Embeddings等。系统采用异步优先设计,支持单/多轮对话评测,通过策略模式实现灵活指标扩展。主要组件包括评测入口、执行器、数据集结构、度量指标等,采用工厂模式统一管理模型。最佳实践建议控制并发批量、使用回调追踪、避免事件环冲突。框架适用于问答产品、知识库助手等场景,可通过pip安装并参考丰富文档和示例快速上手。
2025-10-05 10:25:59
1561
原创 数据管理和组织变革管理考试考点及关系梳理
本文系统梳理了数据管理中的组织变革管理(OCM)核心考点。主要内容包括:1)OCM基础理论与模型(科特、ADKAR、Lewin)的适用场景;2)数据管理变革的驱动因素(法规、竞争等)与阻力类型(认知、行为等)及应对策略;3)OCM实施三阶段流程(准备-执行-巩固);4)数据管理与OCM的四大协同机制。文章强调考点间的逻辑关联,并提供了模型选择口诀、阻力分析框架等应试技巧。核心观点是:OCM作为数据管理落地的关键路径,需通过理论模型指导、动因分析、流程执行和协同保障,实现从技术部署到人员行为转变的跨越。
2025-10-04 11:00:00
1267
原创 数据管理组织和角色期望考试考点及关系梳理
本文系统梳理数据管理组织的核心考点,包括:1)组织定义与目标,强调跨职能协同和全生命周期管理;2)三种主流架构模式(集中式/联邦式/混合式)的特征及适用场景;3)核心角色体系(CDO、数据治理委员会、业务/技术数据管家等)的职责分工;4)角色协作流程与期望管理机制。考点间存在"架构决定角色分布-职责决定协作-机制保障落地"的逻辑链条,需整体掌握。应试需重点把握角色职责匹配、架构选型依据和标准协作流程,案例分析应遵循"问题定位-角色识别-方案设计"的思路。
2025-10-03 11:00:00
1332
基于 LangGraph 构建的多功能聊天机器人练习项目
2025-10-30
将MySQL数据库迁移到ClickHouse
2025-10-03
自动生成ppt格式数据分析报告的脚本
2025-10-02
基于Flask和Plotly的交互式饼图生成器,支持多种数据输入方式和图表类型,可以自行扩展
2025-10-02
ollama+大模型+python+langchain+mysql实现数据表查询问答
2024-09-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅