- 博客(454)
- 收藏
- 关注
原创 AGI |一文快速上手LangChain的新利器:LangGraph!
LLM Agent之所以受到广泛关注,是因为它代表了人工智能领域在处理和生成自然语言方面的最新进展,能够执行复杂的语言任务,如翻译、摘要、问答等,极大地推动了人机交互和自动化内容创作的边界。而LangGraph提供了一种创新的方法来增强LLM的语义理解和生成能力,通过构建和利用语言的图谱结构,LangGraph有助于提高模型对语言细微差别的捕捉能力,从而在各种语言任务中实现更准确、更自然的表现。本篇文章带大家一起,真实地上手尝试一下。
2024-05-28 11:45:03
4773
原创 AGI|一文识别LangChain中ChatOpenAI 和OpenAI的区别
也就是OpenAI中列举的模型中以gpt-3.5-turbo和gpt-4开头是ChatOpenAI 支持的模型,其余都是OpenAI支持的模型。在探索LangChian的ChatOpenAI 和 OpenAI这两个类时,了解到这两个类使用OpenAI接口不一样, OpenAI使用的是/v1/completions接口,而ChatOpenAI 使用的是/v1/chat/completions。OpenAI提供了一系列强大的机器学习工具和算法,适用于广泛的应用领域,并且能够满足复杂的研究和开发需求。
2024-05-21 11:28:21
4005
1
原创 AGI|一篇小白都能看懂的RAG入门介绍!
随着近几年AIGC的发展,不仅是大模型自身在不断优化,相关支持应用也在不断涌现。本文的主角便是这些技术中较为引人注目的RAG(Retrieval-Augmented Generation)——检索增强生成技术。LLM虽然已经在通识领域展现出了惊人的能力,但要落实到真正具体的问题解决,特别是针对专业领域,企业领域的一些具体的,私人的数据生成解决方案,仅仅依靠LLM还是远远不够的。
2024-02-20 11:22:14
4772
2
原创 Coze开源实践!一站式 AI 开发流水线
Coze开源AI开发平台技术实践解析 本文详细介绍了Coze开源AI开发平台的技术实现与应用实践。首先分析了当前AI开发的痛点及Coze的一站式解决方案,提供了完整的部署指南。通过项目结构解析,展示了基于DDD架构的后端设计,重点介绍了字节跳动的Hertz微服务框架和Eino AI开发框架。文章深入演示了RAG和Agent开发场景,包括知识检索、工具调用等核心功能实现。最后展望了多语言AI框架发展趋势,指出开源项目将降低AI开发门槛,推动行业创新。
2025-11-14 10:17:13
892
原创 别再手动解析网页了!让AI替你写爬虫
本文比较了两种网页爬取方法:传统Scrapy框架与基于大语言模型(LLM)的Crawl4AI。在Scrapy部分,详细介绍了创建项目、配置Item、XPath解析网页内容以及数据存储等流程。Crawl4AI部分展示了如何通过提示词提取结构化信息、自动生成Markdown、以及外部/内部调用LLM进行智能内容提取。对比发现,传统方法需要精细的HTML解析,而LLM方法通过语义理解简化了提取流程。两种方法各具优势:Scrapy适合结构化数据抓取,Crawl4AI则在处理复杂语义内容时更高效。文章附有完整代码示例
2025-11-14 10:16:49
981
原创 VectorDBBench 自定义(Custom)数据集测试全流程实战
企业大模型POC测试常面临老旧数据集与真实业务场景脱节的问题,如SIFT数据集(128维)与主流模型(768-3072维)差异显著。Zilliz团队开源VectorDBBench工具支持自定义数据集测试,但数据转换繁琐。本文提供一键生成工具脚本,可将CSV/NPY格式业务数据自动转换为标准Parquet格式(含train/test/groundtruth文件),并详细演示了在VectorDBBench中加载自定义数据集、配置测试方案的全流程。该方法能更准确评估QPS、延迟、召回率等关键指标,解决传统benc
2025-10-31 17:58:26
1054
原创 用 n8n 构建你的第一个智能 Agent
本文对比分析了Agent与自动化工作流的区别,并详细介绍了构建智能Agent系统的完整流程。自动化工作流是固定步骤的静态执行,而Agent具备自主推理和动态决策能力。一个完整的Agent包含三大核心组件:大脑(LLM模型)、记忆(上下文存储)和工具(外部交互能力)。文章通过飞书新闻助手的实际案例,分步骤讲解了如何从项目搭建、触发器设置到工具配置的全过程,包括连接LLM模型、配置飞书工具、编写智能提示词等关键环节。最后强调实施原则应优先选择最简单有效的解决方案,并提供了获取完整工作流文件的途径。
2025-10-31 17:44:23
1100
原创 Prompt质量优化指南,教你告别无效提问
Prompt(提示词)作为引导AI模型输出的关键指令,其质量直接影响生成结果的准确性。传统提示优化依赖人工试错,效率低且难以复现。火山引擎推出的PromptPilot工具通过自动化流程实现提示词的全周期优化,具备三大优势:1)提升准确性,通过交互式"选择题"模式和多轮反思生成精准提示;2)提高效率,支持一键优化和闭环迭代;3)强大适应性,支持文本、图像、数据分析等多模态任务。相比传统方法,PromptPilot将优化过程
2025-10-14 11:43:31
607
原创 智能体追踪(Tracing)的利器:Opik
Opik是Comet团队推出的开源平台,专为解决LLM应用全流程可观测性问题而设计。它提供三大核心功能:开发追踪(自动记录LLM调用流程)、自动化评估(支持多维度测试)和生产监控(高并发日志处理)。平台支持多种集成方式,包括官方SDK、函数装饰器、原生客户端和REST API,并能适配主流框架如LangChain和LlamaIndex。通过Trace-Span结构串联复杂工作流,开发者可快速定位问题,优化提示词和模型性能。Opik特别适合需要全链路监控的RAG、Agent等复杂LLM应用场景。
2025-10-11 11:23:04
778
原创 Ragas实践指南:科学评估你的知识库AI答得对不对
企业知识库数据庞杂、利用率低,需通过知识治理转化为AI易理解的纯文本格式。Ragas框架可科学评估知识治理效果,解决传统评估方式主观性强、成本高等问题。其核心优势包括多维度指标(忠实度、相关性等)、自动化评估和可扩展性。实践表明,Ragas在论文问答、SQL生成等场景能有效验证知识治理质量,提升AI问答的准确性。未来在金融、医疗等行业,Ragas将持续优化知识治理方案,助力企业盘活知识资产。
2025-10-09 18:05:06
939
原创 告别Python依赖!用Java也能玩转MCP Server
本文介绍了使用Java构建MCP(ModelContextProtocol)服务器和客户端的实践方案。针对主流MCPServer多采用Python而业务后端多为Java的现状,SpringAI提供了对MCP的支持实现,方便Java应用接入MCP协议。文章详细阐述了通过两种方式构建MCPServer:基于stdio的轻量级本地通信和基于SSE的远程服务访问,并以天气服务为例展示了具体实现代码。同时介绍了如何构建MCPClient,包括在ClaudeDesktop中的配置使用和在SpringAIAlibaba中
2025-10-09 17:41:34
1331
原创 LLM生成的分段总不满意?实践带你实现文本分段可视化
本文介绍了一个基于React技术栈开发的交互式文本分段可视化与编辑系统。该系统采用三层架构设计(背景层、拖放层和拖拽层),结合ReactDnD库实现直观的文本分段编辑功能,支持用户对大模型生成的分段结果进行可视化审核和边界调整。系统通过虚拟化列表技术优化长文本处理性能,提供颜色编码展示分段状态,并实现精确的拖拽交互。该解决方案有效提升了文本分段的质量控制效率,为自然语言处理中的文本结构化任务提供了实用工具。
2025-09-08 14:58:17
849
原创 分布式推理框架--Nvidia Dynamo
NVIDIA Dynamo是一款开源的分布式推理框架,旨在解决大规模AI推理中的性能瓶颈问题。其核心创新包括动态图优化、解耦式服务和KV缓存复用技术,通过智能资源调度和分层存储显著提升推理效率。测试显示,在大型模型如Llama 70B上性能提升可达2倍,但在小规模场景优化有限。相比vLLM等框架,Dynamo更注重PyTorch生态的灵活性与动态优化,适合研究探索阶段。关键组件包括GPU调度器、智能路由和分布式缓存管理器,通过技术创新实现高效资源利用和计算加速。
2025-09-08 14:55:26
1196
原创 AGI|开发效率翻倍?编码助手横向测评调研
市面上比较有代表性的的免费且不用科学上网使用的编码助手,展示各个编码助手的能力与特点,一起评选出一款最好用的代码助手插件。希望本次分享的结果能够帮助大家选择到自己合适的编码助手,提升开发效率。
2025-08-20 13:46:10
854
原创 AGI|研究报告还能这样写?揭秘Open Deep Research智能生成全流程
Open Deep Research是一款基于LangGraph的开源AI研究助手系统,提供两种智能写作模式:1)结构化工作流模式,支持用户参与规划与反馈;2)多智能体并行模式,模拟研究团队协作。系统能自动完成从选题规划、资料检索到内容撰写、质量评估的全流程,支持学术报告、市场分析等多种场景。核心特点包括模块化设计、自动质量评估、多源数据整合等,通过智能规划节点、人工反馈机制和章节研究子图实现高效可控的内容生成。未来将支持图表生成、多语言处理等增强功能,推动AI辅助内容创作的发展。
2025-08-20 11:32:23
1413
原创 Easy Dataset + 神州问学: 让大模型高效学习领域知识
EasyDataset简化了大型语言模型(LLM)微调数据集的生成流程,支持本地和云端模型调用。本教程演示了从互联网公司财报构建SFT微调数据的过程:1)通过Docker部署EasyDataset,上传财报文本并智能分割;2)调用DeepSeek等API生成问题-答案对;3)导出Alpaca/ShareGPT格式数据集。随后在神州问学平台微调Qwen3-0.6B模型,调整学习率至1e-4、训练8轮,验证显示模型成功学习了财报知识。建议资源充足时采用更大模型(7B/14B)以提升效果。
2025-08-07 14:15:24
1026
原创 AGI|从“实验室”到“生产线”:企业级AI Agent 如何突围
企业级AIAgent正从技术概念走向产业实践。2025年成为爆发临界点,技术成熟与市场需求共同推动发展:大模型推理能力提升、算力供给充足、开源社区支持,使AI进化到能主动行动的智能体阶段。企业需求从概念验证转向实际应用,更看重可量化成果。AIAgent凭借执行导向设计、自主规划能力和自动化潜力,正在重塑企业生产力。未来,AIAgent将通过人机协同解放人类创造力,推动企业从效率追求转向价值创造。
2025-08-01 10:23:46
1170
原创 AGI|企业级 AI 项目如何落地?一招破两难!
构建企业级AI平台的关键在于平衡创新与风险管控。麦肯锡研究发现,企业AI应用面临两大主要障碍:创新过程被繁琐流程拖累(30%-50%时间用于合规),以及规模化时遭遇成本和安全问题。解决方案是建立统一平台,包含三大核心要素:1)自助服务平台,提供标准化工具和成本管控;2)开放架构,支持能力复用和多供应商集成;3)自动化防护系统,内置合规检查和风险监控。这种平台化策略能显著提升AI应用开发效率,降低50%的合规等待时间,同时确保安全可控,为企业AI转型提供可持续的发展路径。
2025-07-30 11:16:59
1093
原创 AGI|知识治理:直击知识库知识质量与精准检索痛点
知识库文档智能处理方案研究 针对知识库文档处理中的多格式兼容、内容识别不准确等痛点,本文提出了基于MinerU开源工具的解决方案。该工具支持将PDF等复杂文档转换为结构化数据,保留原始语义和多模态元素,具备84种语言的OCR识别能力。方案通过版面识别、分段调整和知识治理三个关键步骤,有效提升了AI应用的回答准确率。实践表明,经过治理的企业供应链文件和财务发票等资料,显著改善了AI系统的检索精准度。该方案适用于需要处理复杂文档结构的各类知识管理场景。
2025-07-30 11:04:36
717
原创 AI越线了吗?从现实争议看日常开发中的伦理边界
近年来,AI在推荐系统、自动驾驶、搜索引擎等领域快速普及,深刻改变着我们的生活,却也在训练与决策环节暴露出偏见、隐私泄露与责任推诿等伦理隐患。本文将结合真实案例,解析开发与应用中的伦理边界,厘清AI“能做”与“可以做”的分界。
2025-07-16 14:00:27
1252
原创 《怎样做成大事》|成功率仅0.5%?给项目管理者的一剂良方
《怎样做成大事》由世界知名项目管理专家、牛津大学教授傅以斌携手加德纳撰写。作者通过全球多个超大型项目的失败与成功案例,系统剖析了影响项目成败的关键因素。本期文章将带您了解一下,为什么只有0.5%的大项目能按预期交付,以及如何借鉴其中的方法论,避开职场中那些看不见的“坑”。
2025-07-11 10:55:54
1077
原创 AGI|Auto Hyperlink上线:鼠标点到哪,知识秒懂!
本文介绍了一个名为AutoHyperlink的开源项目,该项目能自动为网页文本添加超链接,点击可显示简介并跳转百科搜索。项目已开源,适用于技术文档和AI应用场景,旨在提升专业内容阅读体验。
2025-07-09 16:00:53
460
原创 AGI|Browser Use —— AI代理浏览器
Browser Use 是一款专为大语言模型(LLM)设计的智能浏览器工具,旨在让 AI Agent 能够像人类一样自然地浏览和操作网页。它支持多标签页管理、视觉识别、内容提取,并能记录和重复执行特定动作。
2025-07-02 14:13:05
1629
原创 AGI| Neo4j 处理模型数据,轻松实现效率翻倍
想象一下,知识图谱就像一张巨大的蜘蛛网,只不过网上挂的不是露珠,而是无数个知识点,比如"苹果""牛顿""万有引力""iPhone"……每个知识点(实体)之间用线(关系)连接起来,线上还贴着标签,比如"牛顿→发现→万有引力""苹果→是→水果"或者"小米→生产→小米su7"。类比于乐高积木:每个积木块代表一个事物(比如"雷军","水"),积木之间的接口形状不同,只有匹配的关系才能拼在一起(比如"雷军→喝→水"能拼,"雷军→喝→汽车"就拼不上)。
2025-06-12 10:15:59
1027
原创 AGI|基于FastMCP 2.0的MCP Server快速搭建指南
FastMCP是一个基于模型上下文协议(MCP)的开发框架,支持开发者快速构建与LLM交互的服务。通过工具(Tool)、资源(Resources)、提示(Prompt)和服务组合(ServerComposition)等核心概念,FastMCP实现了功能解耦和模块化开发。文章详细介绍了如何搭建单MCPServer和多Server组合的复杂应用,并以电商平台为例展示了服务组合的实际应用。该框架支持静态和动态资源、参数化提示模板,以及服务挂载和导入等组合方式,为AI应用开发提供了标准化的通信解决方案。最后探
2025-06-04 13:36:11
1849
原创 斯坦福发布《2025年人工智能指数报告》:12大趋势总结AI发展
斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了《2025 年人工智能指数报告》,本篇文章为大家带来了报告中提到了12个要点。
2025-05-27 11:27:53
1625
原创 AGI|开源框架-Mem0解决AI长期记忆问题,让AI记住你的一切
Mem0技术通过构建智能记忆中枢,彻底改变了AI的"健忘症"问题。它实现了:1)长期存储用户个性化数据;2)动态更新交互记录;3)跨应用共享记忆。在教育领域,它能标记易错点并按节奏推送内容;医疗健康方面,可长期跟踪用药记录;游戏中则让NPC记住玩家历史选择。Mem0采用"记忆管理+RAG"协同架构,支持用户自定义记忆层次,并能自动提炼语义、降低过期信息权重。这项技术正在推动AI从工具向伙伴的转变,但也引发隐私保护等新思考。(148字)
2025-05-27 10:05:20
1231
原创 AGI|详解Google A2A协议,谁才是Agent的未来标准?
随着 Agent技术热度持续攀升,MCP与A2A等协议轮番登场,作为关键通信框架被推向科技前沿,引发了行业对"谁将主导智能体通信标准"的深度讨论。本篇文章带来A2A协议的介绍,以及它与MCP各自的优势又是什么。
2025-05-26 11:27:13
1396
原创 AGI|爆火的MCP背后,为何被称作 AI 模型的“万能适配器”?
作为可能重塑AI生态的关键协议,MCP究竟是什么?其协议架构设计暗藏哪些创新突破?在实践中又面临哪些挑战?本次系列推文将从理论原理到实践操作,带您多角度了解MCP协议及使用方法。
2025-05-26 09:52:38
853
原创 AGI|智能体总忘事?Letta框架如何让AI告别“金鱼记忆“?
letta是一个开源的AI智能体框架,它提供了agent、memory、model、tool等一系列的api和开发工具,方便开发人员构建一个有状态的agent,能够在长期对话中保持记忆和上下文。
2025-05-09 17:50:18
1061
原创 AGI|详解IPEX-LLM 与 OpenVino,嵌入生成的终极效率优化
OpenVINO是 Intel 推出的深度学习推理优化工具,主要用于在 Intel 硬件(CPU、GPU、VPU、FPGA、NPU)上高效运行 AI 推理任务。它能够优化和加速来自 TensorFlow、PyTorch、ONNX、PaddlePaddle 等框架训练的模型,提供高效的推理性能、低延迟以及跨平台兼容性。支持的硬件平台OpenVINO 适用于多种 Intel 硬件,支持异构计算CPU(Intel Xeon, Core, Atom 等)GPU(如 Intel Movidius)
2025-05-09 17:40:42
999
原创 AGI|用好AI工具,你不得不知道的基本知识!
对于现阶段的 AI 工具来说,他们已经足够智能到理解我们自然语言的输入,也就是说你在使用 AI 工具时,即使将它当做一位同事自然地输入问题,他也能够基本理解你的意思并且回答你的问题。以文本生成领域为例,像 ChatGPT 、Deepseek、豆包等等我们常见的 AI 应用都是基于大语言模型所建立的 C 端产品,他们通过对海量文本数据的学习,能够理解语言的语法、语义和语境,从而生成连贯、自然且富有逻辑的文本。,如何在保持创造力的同时减少幻觉,是所有 AI 厂商面临的一个亟待解决的难题。
2025-04-27 13:47:11
658
原创 AGI|AutoGen入门食用手册,搭建你的智能体流水线
AutoGen 是一个开源编程框架,用于构建AI代理并促进多个代理之间的合作以解决任务。它具有强大的可定制和可对话的代理,这些代理通过自动化的聊天将 LLM(大语言模型)、工具和人类集成在一起。通过自动化多个LLM代理之间的聊天,开发人员可以轻松地让他们自主或根据人工反馈共同执行任务,包括需要通过代码使用工具的任务。上图中,AutoGen使用多智能体对话实现了复杂的基于LLM的工作流。(左)AutoGen代理可以定制,可以基于LLM、工具、人员,甚至是它们的组合。
2025-04-11 17:38:19
1271
原创 AGI|AI驱动的前端代码生成和代码推荐
AI驱动生成前端代码的优势提高效率:AI可以自动生成复杂的UI组件或模板代码,减少开发者手动编写的时间。通过自动化生成,开发者能够集中精力于更有创意和技术挑战性的部分。提升代码质量:AI驱动的代码生成工具通常会基于大量的开源代码库进行训练,因此能够遵循最佳实践,减少代码中的潜在漏洞或性能瓶颈。缩短开发周期:通过自动化生成和即时的代码补全,开发者可以在更短的时间内完成项目,从而更快地推向市场。
2025-03-31 10:40:40
948
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅