- 博客(713)
- 收藏
- 关注
原创 马斯克、奥特曼都忍不住夸好的 Gemini 3,到底多强?
给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!你查旅游攻略,它给你生成一个“动态旅游杂志”;很多人都说 Gemini 3 是“强得不像阳间的东西”,乍一听像段子,但当你真正玩过,你会发现这形容其实挺节制的,因为这玩意儿真的太离谱了。最恐怖的是,这种“画”其实不是画,是用代码生成的 SVG,也就是说这些图全都能交互,全都能改,全都能用于真实产品界面中。
2025-11-24 11:47:07
305
原创 LangChain大模型应用发布教程:从零基础到Web服务,一篇搞定!
假设你已经写好了一个翻译服务,现在我们要把它“包装”成一个Web接口。这里我们用FastAPI来搭建服务器。# 解析返回结果# 定义提示词模板SystemMessagePromptTemplate.from_template("请将一下的内容翻译成{language}"),# 以链形式调用# 假设这是你写好的翻译函数# 这里是你自己的模型调用逻辑# 部署为服务。
2025-11-22 11:29:09
644
原创 Dify可观测性完全指南(非常详细)从入门到精通,开发运维必备,收藏这一篇就够了!
文章分析了Dify平台在Agentic应用开发中的可观测性挑战,从开发者和运维双重视角探讨了Dify可观测能力的现状与痛点。针对内置监控、第三方追踪服务和集群自身观测的局限性,提出了基于无侵入探针的全景可观测解决方案,实现了Workflow执行与基础设施全链路追踪,有效解决了Dify架构复杂、迭代频繁导致的观测难题,为Agentic应用开发和运维提供了全面支持。阿里妹导读。
2025-11-21 15:01:40
989
原创 多智能体系统深度教程:从零基础到精通,一篇掌握AI大模型开发核心模式!
文章介绍了Trae多智能体系统的四种核心设计模式:Agents as Tools、Workflow、Graph和Swarm模式,分别适用于不同开发场景。这些模式实现了全流程开发自动化,包括需求分析、架构设计、代码生成和测试验证。同时展示了多智能体系统在遗留系统维护和智能代码优化方面的应用,表明AI辅助开发已进入实用阶段,正在重塑软件开发的工作模式和效率标准。在多智能体系统设计中,直接决定了系统的协作效率和问题解决能力。
2025-11-21 11:02:38
1035
原创 本地RAG知识库搭建全攻略,一文搞定大模型文档检索技术,值得收藏!
文章介绍了如何使用开源模型nomic-embed-text搭建本地RAG知识库,实现高效文档检索。详细说明了模型的基本信息、特性和性能优势,提供了完整的搭建步骤,包括下载模型、创建工作区、文档向量化与存储,以及检索测试。同时展示了模型的两种使用方式,通过Hugging Face Transformers或Nomic官方API,满足不同开发需求,让新手也能轻松上手构建自己的知识库。有些努力,虽然暂时看不见结果,却在悄悄改变你。-摘。
2025-11-19 11:47:18
1498
原创 使用MCP执行代码:让Agent效率提升98.7%
Anthropic 在 2024 年 11 月推出了 Model Context Protocol (MCP),这是一个连接 AI Agent 到外部系统的开放标准协议。本文是 Anthropic 工程团队在 MCP 推出一年后,针对大规模工具连接场景下的性能瓶颈,提出的创新性解决方案——通过代码执行环境与 MCP 结合,实现 98.7% 的 token 使用率降低。这不仅是一次技术优化,更是 AI Agent 架构设计理念的重大转变。具体案例Description:从GoogleDrive检索文档。
2025-11-19 11:37:35
903
原创 AI智能体终极记忆方案Graphiti:从零基础入门到精通,一篇全掌握+必收藏!
实时将文本或结构化数据转化为“知识片段”(Episode)自动提取实体与关系,构建语义网络支持超低延迟的混合检索(语义关键词图路径精确追踪事件发生时间和被记录的时间(双时间维度)它不是传统的知识图谱工具,也不是简单的向量数据库,而是为 AI Agent 的大脑量身打造的记忆系统。然后告诉 Graphiti:“以后看到类似结构,就按这个模型提取!这样就能构建出高度定制化的专业知识图谱。简化复杂度:将复杂的图谱构建过程抽象成简单的 API 调用,开发者可以专注于业务逻辑。
2025-11-18 14:02:33
907
原创 Agentic AI开发实战:单智能体VS多智能体架构详解,零基础到精通,一篇就够收藏!
本文详细对比了单智能体与多智能体Agentic AI系统的构建实践。作者通过LangGraph和LangSmith Studio搭建了两个版本,发现多智能体系统虽耗时稍长,但输出质量更高。文章解释了Agentic AI本质是"用自然语言编程",强调接入结构化数据的重要性。建议:快速验证用单智能体,追求高质量用多智能体,最佳实践是人脑逻辑与机器执行结合,让AI负责理解模糊目标,程序执行确定性任务。
2025-11-17 15:18:12
248
原创 LangChain大模型数据库操作教程(超详细)从零基础入门到实战,一篇搞定!
本文详细介绍了在LangChain框架下使用MCP操作数据库的三种方法:1)使用MultiServerMCPClient连接MCP服务器;2)使用create_sql_agent构建SQL代理工具;3)直接让大模型生成并执行SQL。这三种方法各有优势,适用于不同场景,可满足从简单查询到复杂应用的各种需求。LangChain是一个专为大语言模型设计的开放框架,围绕任务链(Chain)与内存模块(Memory)构建了核心架构。
2025-11-17 11:48:53
1205
原创 两周,如何快速入门Agent开发!Agent开发入门到精通教程!
作者分享从零开始学习Agent开发的过程,通过选择LangChain框架,借助AI快速掌握Python基础,系统学习LangChain核心组件(Prompt模板、Tool工具、记忆)。文章强调学习AI重在实践而非理论,提供了学习资源和项目建议,鼓励读者"学AI不是看谁懂原理,而是看谁敢上手",适合小白快速入门Agent开发。我是在10月份第一次真正看到“Agent”的潜力。当时就一个念头——于是我决定试试看。问题是,我不会啊。那怎么办?于是我开始刷B站的Agent入门教程。
2025-11-14 11:54:52
1188
原创 从基础到部署:解密AI大模型应用架构全景
从底层的算力与数据,到中层的模型与能力组件,再到高层的应用与部署方式,这张AI大模型能力架构图呈现出的是一个“自下而上、逐层演进”的完整生态。它不仅适用于大模型技术团队,更是企业数字化、智能化转型路径的指南针与风向标。下一步,不妨对照这张架构图,问问自己:我的企业,已经构建好了哪一层?还缺少哪些能力模块?哪些环节可以率先启动小范围落地试点?未来的智能化之路已然清晰,不是要不要做,而是从哪里先动手做起。
2025-11-14 11:45:20
672
原创 微软AI Agent数字员工全攻略(超详细)从零到企业级部署,一篇全掌握必收藏!
一个销售团队的组织架构图上,Sales Manager下面挂着3个Account Executive和2个Sales Agent,后者的职位描述是"负责线索筛选、会议安排、跟进邮件自动化"。月度会议上,Sales Agent通过Teams语音汇报:“本月处理418条线索,转化率23%,安排会议67场,无冲突率98%。” 这不是未来场景,微软的技术能力已经支持这个流程。对员工最直接的影响是协作方式改变。
2025-11-13 14:51:17
782
原创 AI大模型全栈教程:从零基础到实战精通,一篇搞定必收藏!
本文全面介绍AI大模型基础知识,包括AI发展历程与分类、LLM训练原理、Token处理机制、Temperature与Top P参数控制,以及AI Chat产品的联网搜索、文件读取和记忆功能。同时分析全球AI发展现状、中美技术差距、美国对华AI限制及硬件影响,并概述中国主要AI公司及其模型。内容从基础概念到实际应用,为初学者和程序员提供系统性的AI大模型学习指南。
2025-11-13 10:44:57
469
原创 花费0.46元用DPO-LoRA方法微调豆包大模型解决了业务!
参数原配置建议配置调整原因epoch12增加轮次以充分学习小数据集batch_size88批次大小合理,无需调整0.000010.0001提高学习率加速 LoRA 参数收敛0.050.1增加预热比例保证训练稳定性lora_rank3232秩的取值适中,无需调整lora_alpha44缩放系数合理,无需调整dpo_beta0.10.1平衡格式对齐与输出多样性11保持 SFT 损失权重合理是否“混入预制数据集”?是否打开“验证集”?
2025-11-12 11:42:40
912
原创 小白能看懂的AI大模型系列-本地部署(vllm)
文章详细介绍了如何在本地部署AI大模型,以VLLM为例,从设备选择、环境配置到模型运行的全过程。推荐使用AutoDL云服务器解决硬件需求,通过VS Code远程连接开发,创建虚拟环境并配置vllm框架,最后从魔搭社区下载模型并成功运行。教程步骤清晰,适合零基础小白入门,帮助读者掌握大模型本地化部署技能,解决数据泄露等隐私问题。目前开源大模型的一大优势就是,它可以本地化部署,只要你的显卡硬件配置能满足要求,你可以在自己的本地部署属于自己的大模型,不用担心数据泄露等问题。
2025-11-12 11:15:23
394
原创 AI多智能体系统设计模式详解(超实用教程)从零基础到精通,一篇全掌握,值得收藏!
分工型协作是多智能体协作中最基础、最易落地的模式之一,核心定义可概括为:针对一个单一且复杂的总任务,将其拆解为多个独立、专业化的子任务,并为每个子任务匹配具备对应能力的Agent,最终通过子任务结果汇总整合,输出满足总目标的最终成果。它的核心特征是目标统一、职责拆分、结果聚合,所有Agent围绕同一个总任务发力,无对立或指挥关系,仅通过子任务衔接形成协作,类似现实中产品团队的分工:产品经理定目标,UI设计师做界面、开发写代码、测试找bug,最终合力交付产品。竞争型协作是多智能体协作中以博弈。
2025-11-07 14:13:50
782
原创 A2A协议教程(超详细)从零基础到精通,一篇就够用,赶紧收藏学习!
角色1:用户(User)即终端用户(可能是人类 或 服务),需要使用Agent来完成某个任务。角色2:客户端(Client)一个代表用户向 远程Agent 发送请求的实体,它发送的请求是严格按照A2A协议的。它的表现形式可以是一个应用程序、服务 或 一个Agent。例如,我们在上一篇的Demo中开发的一个控制台应用程序通过引用A2A包来向远端的Agent发送请求。角色3:远程Agent(Remote Agent)
2025-11-06 11:58:23
708
原创 不懂代码,也能搞定大模型微调!
本文介绍大模型微调的完整流程与实现路径,强调非技术人员无需编程也能主导微调项目。将微调比作"给博学天才进行专业岗前培训",分为定义目标、数据准备、环境选择、工具方法四个步骤,推荐三条实现路径:无代码GUI平台、低代码Notebook平台、与工程师协作。核心价值在于精准定义问题、提供高质量数据和做出正确产品判断,而非掌握编程技术。大模型微调虽然有门槛不能完全零基础,但重点应该放在理解概念、流程和如何使用现有工具,而不是学编程。
2025-11-04 14:46:34
914
原创 知识图谱技术详解(超详细)从零基础到实战应用,一篇全掌握!
知识图谱(Knowledge Graph)是一种以图形化结构系统化组织、存储和呈现知识的技术框架,其核心是通过“实体-关系-实体”的三元组构建语义网络,揭示事物间的关联性。它融合了人工智能、语义网、数据库与图论技术,旨在实现知识的结构化表达、高效检索与智能推理。知识图谱通过结构化知识网络,使机器能够“理解”人类语言中的语义关系,成为人工智能从感知智能迈向认知智能的关键基础设施。其应用已覆盖搜索、推荐、医疗、文物保护等核心领域,未来将与大模型、物联网等技术深度融合,推动智能化决策与交互的革新。
2025-11-04 11:48:28
1308
原创 全球首个AI智能体「自进化」开源框架来了!一次部署,终生可用!
EvoAgentX是一个开源的、以自我进化为导向的AI智能体研究框架,专为探索具备自我优化能力的多智能体系统而设计,旨在构建一个开放、可进化的智能体生态。
2025-11-01 07:30:00
805
原创 以Dify架构设计为例,一篇文看懂AI原生应用开发平台
本文深入解析了TaskingAI与Dify两大LLM应用开发平台的架构设计与核心原理。TaskingAI采用微服务架构和DDD设计,代码结构清晰,适合轻量级应用;Dify则创新设计了GraphEngine任务编排引擎,支持复杂AI场景。两者均提供LLM统一接入、工具插件扩展及多租户隔离能力,有效降低AI应用开发门槛。文章对比分析了两者在系统设计、代码架构及功能特性上的差异与优势,为开发者提供了宝贵的平台选型参考。👉目录1 平台定位2 核心能力3 系统架构4 AI 任务编排执行引擎5 总结。
2025-10-31 11:21:22
779
原创 RAG三大检索策略深度解析:稀疏检索、密集检索和混合检索
本文详细剖析RAG系统的三大检索策略:稀疏检索(BM25)、密集检索(向量嵌入)和混合检索。分析了各自优缺点、适用场景及性能对比,指出混合检索能平衡准确率与召回率。文章还探讨了GraphRAG、多模态检索等发展趋势,为不同业务场景提供选型建议,帮助开发者构建高质量RAG系统。如果你有构建RAG系统的经历,你就会理解那种辛辛苦苦搭建起来的AI系统,被业务人员骂成智障的挫败感,当你向AI系统问了一个问题,系统却返回了一堆驴唇不对马嘴的答案。
2025-10-31 10:47:14
936
原创 实战·Agentic_上下文工程(上):无需微调,让智能体自我学习与进化
本文详细介绍了上下文工程(Context Engineering)的概念与策略,解释了为什么长上下文不等于高质量,并重点阐述了斯坦福大学等团队提出的Agentic上下文工程(ACE)框架。ACE通过"生成→反思→策划→再执行"的闭环,让智能体无需微调就能实现自我学习与进化,通过不断优化上下文中的"策略手册",使AI从回答问题进化到学会思考,持续提升决策能力。在提示工程的年代,我们教AI“怎么回答”;而在Agent(智能体)的时代,我们要教它“怎么思考”。
2025-10-29 11:45:34
1038
原创 全球首个AI智能体「自进化」开源框架来了!一次部署,终生可用
EvoAgentX是一个开源的、以自我进化为导向的AI智能体研究框架,专为探索具备自我优化能力的多智能体系统而设计,旨在构建一个开放、可进化的智能体生态。
2025-10-29 11:37:07
693
原创 2025大模型开发入门到进阶:学习路线图分享!零基础入门到精通,一篇搞定!
学习大模型,不只是“看懂论文”,更是“亲手造出能跑的模型”。愿这份路线,成为你通往 AI 世界的清晰地图。
2025-10-28 11:42:15
1610
原创 AI智能体范式革命(超详细解析)从零基础到模型原生AI,收藏这一篇就够了!
Agentic AI的演变反映了智能本身如何被构想、训练和部署的更深层次的转变。从基于管道的系统(推理、记忆和行动由外部支架协调)到将这些能力内化的本地范式模型,我们正在见证Agentic AI的根本性重新定义。强化学习作为经验的引擎,连接感知和行动,将静态模型转变为能够从与环境的交互中学习的自适应、目标导向的实体。通过这项调查,我们回顾了计划、工具使用和记忆是如何逐渐被吸收到模型的内在策略中的。统一原则𝐿𝐿𝑀 +𝑅𝐿+𝑇𝑎𝑠𝑘 正在成为现代人工智能的方法论奇点。
2025-10-28 11:21:30
809
原创 AI大模型+强化学习智能体教程(超详细)从零基础入门到精通,看这一篇就够了!必收藏!
下面,结合最近整理的综述来进一步讨论这个公式。项目地址:**1.**
2025-10-27 11:45:53
1056
原创 一文帮你 MCP,从0到1快速入门! MCP教程(详细版)从入门到精通!
本文详细介绍了MCP(模型上下文协议)及其应用,通过构建一个天气服务器实例,展示了如何让大语言模型(如Claude)与外部工具和数据源交互。教程从MCP基础概念讲起,逐步指导读者配置环境、实现工具列表和执行逻辑,最终连接到Claude for Desktop进行测试。文章不仅提供了完整的代码实现,还解释了MCP的工作原理,并给出了更多学习资源,是开发者掌握大模型工具扩展的实用指南。世界上的相遇 都是久别重逢~01 MCP 是什么?
2025-10-25 11:24:58
1121
原创 DeepSeek-OCR大模型完全指南(超详细)从原理到实战应用,收藏这一篇就够了!
DeepSeek-OCR是将OCR重新定义为多模态压缩问题的开源模型,通过将页面渲染为图像并压缩为少量视觉token,减少7-20倍token数量。其两阶段架构(DepthEncoder视觉编码器和MoE解码器)在保留布局的同时高效处理长文档,基准测试显示10倍压缩比下达97%准确率。这一"上下文光学压缩"技术为LLM支持百万token上下文窗口提供了新思路,显著提升处理效率。DeepSeek-OCR是DeepSeek-AI最新发布的开源模型,它将光学字符识别(OCR)重新定义为多模态压缩问题。
2025-10-25 10:53:23
1719
原创 金融AI Agent来了,GitHub开源,从传统支付困境到DePA解决方案,一篇看懂未来支付!
文章介绍AI Agent经济面临的支付瓶颈,传统跨境支付高费率、延迟和加密支付操作复杂等问题制约发展。Zen7 Labs提出DePA(去中心化支付智能体)解决方案,通过多Agent协同架构实现秒级支付、高频小额交易和跨链兼容,采用"一次授权,多次免密"机制保障安全。该方案已在GitHub开源,有望重塑全球支付格局,为万亿美元AI Agent经济提供基础设施支持。现有支付方案无法适配AI Agent的交易特性,这家公司。
2025-10-24 10:55:03
600
原创 AI大模型RAG技术全解析:从入门到精通,一篇就够了!
文章探讨了RAG技术的发展与局限,传统RAG因分块导致知识联系被切断,而GraphRAG虽能解决此问题却因成本高、技术复杂、需求不足而难以普及。作者指出RAG系统搭建容易但调试困难,建议在资料积累后转向知识提炼,通过AI辅助完成从信息到知识的跃迁,而非单纯依赖信息检索。我已经很久很久没折腾RAG了。其实我的账号最初就是靠RAG、个人知识库的内容收获了第一批流量、第一批社群成员。但是后来我逐渐不再关注这个技术和相关产品。两个原因。第一,技术局限性。
2025-10-21 11:14:18
286
原创 一文搞懂AI大模型Attention机制:零基础入门到实战精通,一篇顶十篇!
本文详细介绍了AI大模型中的Attention注意力机制,强调其作为Transformer最核心部分的重要性。文章通过解释Attention机制的目的、工作流程(Q、K、V向量生成、点积计算、Softmax归一化、加权求和)和实际应用案例,展示了如何帮助模型理解上下文中的语义关系。文章建议初学者通过3Blue1Brown的可视化动画建立直观认知,以更好地掌握这一关键技术。在这四个阶段中,。为什么Attention机制如此重要?因为语言的理解从来不是孤立的——同一个词在不同语境下可能有完全不同的含义。
2025-10-21 10:23:25
638
原创 AI大模型+智能设备健康管理教程(超详细)从零基础到精通,一篇搞定,小白也能轻松上手!
ChatGPT能够将体检报告(血压、血糖、血脂、肝肾功能等)解析为可读、可执行的健康建议。相比人工解读,更快、可持续跟踪、并能结合个人目标生成个性化提示。
2025-10-18 13:55:32
722
原创 动手学Agent:工具使用(5)MCP工具调用
本文详细介绍了如何使用Python开发MCP Client,支持stdio、sse、streamable-http三种传输类型,实现工具列表获取和工具调用功能。文章提供了完整的代码实现,包括MCPClient类、工具格式转换函数,并通过实例演示了如何使用MCP工具进行搜索功能,为AI大模型开发者提供了一套完整的MCP工具使用指南。
2025-10-17 14:25:29
1016
原创 AI大模型教程(超详细)从零基础入门到精通,一篇全搞定!小白/程序员必学,建议收藏!
问题:定期嵌入新数据、监控向量库性能都增加复杂度;向量可能泄露原文信息,需要防范embedding反推原文的风险。概括来说,传统RAG扩展了LLM知识却引入新的挑战——
2025-10-16 14:16:01
918
原创 LLM智能体幻觉完全指南(超详细)从零基础到实战应用,收藏这一篇就够了!
LLM智能体的发展正从“追求功能全面”转向“追求安全可靠”,而幻觉问题是这一转型路上必须跨越的障碍。这篇综述的价值,不仅在于“系统性梳理现有研究”,更在于“为领域建立了统一的问题定义与分析框架”——它让原本模糊的“幻觉问题”变得可分类、可溯源、可解决。对于研究者,这份综述是入门的“地图”,清晰标注了每个方向的研究现状与缺口;对于开发者,它是排查问题的“手册”,可按5类幻觉快速定位产品中的风险点;而对于整个领域,它标志着LLM智能体研究从“零散探索”进入“系统攻坚”阶段。
2025-10-16 11:54:20
386
原创 AI大模型教程(超详细)从零基础到精通,小白/程序员必看,收藏备用!
文章详细介绍了阿里Qwen3大模型的结构与实现,包括输入处理、Transformer块、自注意力机制、归一化层和前馈网络五大核心组件。提供了完整的Python代码实现,涵盖Qwen3Model、TransformerBlock、GroupedQueryAttention、FeedForward和RMSNorm等关键类。通过这些代码,读者可以理解大语言模型的工作原理,从零开始构建自己的大模型。引言2025年4月29号,阿里千问团队发表了Qwen3模型,这是 Qwen 系列大型语言模型的最新成员。
2025-10-15 11:14:37
1420
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅