自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(72)
  • 收藏
  • 关注

原创 【收藏必备】Python微调大模型完整指南:零基础也能在本地运行定制LLM

本文提供了Python微调LLM的完整指南,使用Unsloth工具和Google Colab,以Phi-3 Mini为基础模型,通过LoRA技术高效微调。详细介绍了从数据收集、模型加载、训练到通过Ollama在本地运行的九大步骤,帮助开发者将通用大模型转变为领域专家,实现隐私安全、定制化的本地AI应用。

2025-09-08 13:25:32 937

原创 【珍藏干货】LangChain与LangGraph实战:构建智能AI代理的提示工程全攻略

本文详解LangChain和LangGraph在大模型提示工程中的应用,涵盖基础模板、智能链构建、高级编排、AI代理打造、生产实践及实际应用。通过实战案例展示如何创建客服机器人、内容生成工具和数据分析助手等AI应用,帮助开发者掌握构建复杂推理智能代理的关键技术。

2025-08-29 14:18:24 1009

原创 程序员必看:大模型Agent开发前必须思考的两个维度 - 本质与复杂度【珍藏指南】

文章阐述了开发大模型Agent前必须从两个维度进行分析:问题本质(战略层面,关注核心目标、输入输出、约束规则和环境状态)和问题复杂度(战术层面,关注状态空间、动态性、规划深度等)。这两个维度分别指导"做正确的事"和"正确地做事",影响技术选型、数据策略、评估指标、人机协同设计和范围定义等开发决策,确保资源高效利用,交付有价值的产品。

2025-08-28 15:13:54 615

原创 RAG 已成标配!一文讲透效果优化的架构设计与7大核心要点(建议收藏)

今天,让我们深入剖析RAG技术的方方面面,从基础概念到高级优化,从理论原理到实战案例,帮你构建真正可用的企业级AI知识系统。

2025-08-27 13:44:11 584

原创 企业级 AI Agent 系统整合架构:MCP 与 A2A 的设计与落地案例

如果将 MCP 视为 AI 智能体的“工具箱”,那么 Agent2Agent (A2A) 协议就是促进 AI 智能体之间“相互协作”的沟通语言。这两种协议的结合正在重新塑造 AI 智能体的合作方式,从独立作业转变为团队合作。

2025-08-26 14:50:03 734

原创 建议收藏!1小时搞懂Transformer:大模型底层逻辑极简指南

本文以通俗易懂的方式,为“大模型小白”解析Transformer的核心原理,包括其与大模型的关系、自注意力机制、多头注意力机制、位置编码、Encoder和Decoder的组成等内容,帮助读者全面理解这一支撑现代AI的语言模型基石。

2025-08-25 15:03:09 897

原创 大模型提示词工程背后的原理:深入理解Prompt Learning(提示学习)

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

2025-08-21 14:36:23 989

原创 从RAG到Graph RAG再到Agentic RAG:AI知识增强的三代演进全解析

随着人工智能技术的飞速发展,Retrieval-Augmented Generation (RAG) 及其衍生的Graph RAG和Agentic RAG正在成为AI领域的核心工具。本文系统梳理了三者的定义、区别与应用场景,帮助专业人士精准把握各自优势,为企事业单位与科研院所的AI应用与投资决策提供新思路。

2025-08-20 12:01:49 933

原创 从零到一构建多智能体系统:LangGraph 实现智能协作的完整路径

现在正是开始探索和实践多智能体架构的最佳时机——技术工具已经成熟,应用需求日益明确,市场机遇前所未有。让我们共同迎接AI协作系统的崭新时代。

2025-08-19 10:57:23 802

原创 RAG + AI工作流 + Agent:MaxKB、Dify、FastGPT等LLM框架深度对比与选型指南

RAGFlow 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。

2025-08-17 08:15:00 1543

原创 如何把大模型用到实际业务中?2025年最清晰的技术落地路径全解析

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-08-16 11:45:20 1395

原创 大模型如何落地业务?垂直领域定制化建设路径与典型场景分析

在人工智能发展的浪潮中,大模型技术已经成为推动各行业数字化转型和创新发展的核心驱动力。大模型凭借其强大的语言理解、生成和知识推理能力,展现出巨大的应用潜力。

2025-08-16 11:36:20 1314

原创 AI Agent 记忆系统全解析:8种架构设计模式与实战落地指南

如何既记且省?下面 8 种记忆系统架构设计和落地一次讲透,每种记忆系统都配完整思路、优缺点、代码、踩坑、调参建议,方便你直接落地。

2025-08-15 13:48:49 1124

原创 Dify实战进阶:利用长记忆技术打造智能对话体验

你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-08-14 14:09:47 1915 1

原创 手把手教学|从0到1搭建爆款视频拆解AI智能体完整指南

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!

2025-08-14 13:58:08 1358 1

原创 5分钟快速掌握GraphRAG和Mem0核心技术

一句话总结全文: GraphRAG是基于图+向量混合存储技术的RAG,Mem0是GraphRAG的一种实现,它的准确率比OpenAI Memory高26% ,延迟降低91%,并且节省了90%的Tokens,Mem0没有Java SDK但是提供了可供Java调用的Python Service,文章最后结合Mem0论文介绍了Mem0提升效率和节省Token的原理

2025-08-13 15:22:38 1017

原创 手把手教你开发小型语言模型(SLM):从理论基础到代码实现的完整指南

在当前的 AI 进化阶段,任何参数量少于 10 亿的模型都可以称为小型语言模型(Small Language Model)。回顾过去,像 GPT-3 这样的模型有大约 1750 亿个参数,而据说 GPT-4 可能有 1 万亿个参数。根据 scaling law,参数越多,模型性能越好。所以我们自然会认为,拥有更大的架构会带来更好的结果,但如果一个小型架构模型能比大型模型表现得更好呢?

2025-08-12 13:45:35 1130

原创 从技术到商业:AI产品经理的真正竞争力在哪里?

如果你是一位AI产品经理,面对老板的期待、团队的疑问和客户的痛点,手握最前沿的大模型技术,却发现:模型再强,也无法直接解决业务难题。

2025-08-11 15:04:25 1075

原创 一文搞懂AI Agent技术栈:64张架构图带你深入学习Agent架构及技术!

在这篇文章中,我们将通过64张图,探索 AI 智能体的架构设计、关键技术、主要组成部分、以及多智能体框架。

2025-08-06 14:13:58 1114

原创 Transformer中的自注意力机制到底是什么?

在深度学习的璀璨星空中,Transformer架构无疑是最为耀眼的明星之一。自2017年被提出以来,Transformer以其卓越的性能和强大的表现力,迅速席卷了自然语言处理、计算机视觉等多个领域,成为了众多前沿研究和应用的基石。

2025-08-05 13:57:05 1091

原创 别再只会调API了!AI产品经理如何从搬运技术到挖掘真实需求?

那么,如何从生产型企业的业务场景中,精准找到AI的落地机会?如何避免做那些“看上去很美,但投入大、回报低”的项目?今天,我们就来聊聊如何精准抓住生产型企业的痛点,并设计真正有价值的AI产品。

2025-08-05 13:43:13 939

原创 【建议收藏】AI Agent 是什么?大模型落地的核心方向深度解析

2025年被广泛认为是AI Agent元年。这一年,AI Agent技术取得了突破性进展,应用场景不断拓展。AI Agent以其强大的自主决策能力、高效的信息处理能力和出色的交互能力,开始在众多领域崭露头角,从智能客服到智能家居,从企业自动化流程到个人智能助理,为人们的工作和生活带来了前所未有的便利与变革。

2025-08-04 17:42:29 1108

原创 Embedding 入门看这篇就够了!通俗讲解文本如何变成向量(AI学习必知)

GPT(Generative Pre-trained Transformer)分别代表了生成式(Generative)、已预训练的(Pre-trained)和Transformer架构,这三部分共同构成了当前火热的大语言模型(LLM)。

2025-08-04 17:12:57 956

原创 【建议收藏】RAG核心组件深度解析:LangChain 与 Embedding 到底如何协同工作?

LangChain作为当前最热门的开源RAG(Retrieval-Augmented Generation,检索增强生成)框架,正在重塑我们处理非结构化数据的方式。在RAG框架中,检索环节至关重要,而Embeddings技术则是实现高效检索的核心组件之一。

2025-08-04 17:04:35 1079

原创 小白也能看懂的RAG与GraphRAG对比:什么时候该用哪种?

GraphRAG-Bench具有一个全面的数据集,任务难度逐渐增加,涵盖事实检索、复杂推理、上下文总结和创造性生成,并对整个流程进行系统评估,从图构建和知识检索到最终生成。

2025-07-21 11:58:21 957

原创 LLM开发者必看|上下文工程详解:让你的模型更“聪明”

随着大语言模型(LLM)的快速发展,从GPT-3到ChatGPT,再到Claude、GPT-4等更强大的模型,我们见证了一个重要趋势:上下文窗口的不断扩大。早期的模型可能只能处理几千个token,而现代模型已经能够处理数十万甚至数百万个token的上下文。为解决这些问题,上下文工程(Context Engineering)作为专门优化模型输入信息质量的技术体系应运而生,本文将从以下方面介绍:

2025-07-21 11:54:36 995

原创 AI大模型RLHF 实践总结:从原理、代码以及踩坑与解决方案,这篇文章一次性说清楚!

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-06-04 19:28:51 1415

原创 大模型入门到精通之如何选择GraphRAG、LightRAG、AgenticRAG?

RAG是大模型定制化或者私有化部署时知识增强方法的最便捷、成本最低的方式,是一种新数据引入大模型的经济高效的方法,它大模型私有化部署必备的步骤。

2025-06-03 18:35:35 1163

原创 一文读懂医学基础模型,带你全面了解医学大模型到底是什么!

从ChatGPT到DeepSeek,大模型日渐受到越来越多的关注。在医学领域,大模型更多地被称作基础模型(Foundation Model),其通过大规模未标注数据集进行训练,能够有效应用于各种下游医学辅助诊断任务。本文综合考量临床需求与人工智能技术进展,旨在介绍基础模型的概念和术语,希望能够帮助各位读者了解大模型在医学领域产生的变革性影响。

2025-06-01 09:15:00 1547

原创 初学者入门大模型:万字长文讲透 RAG 在实际落地场景中的优化

快速搭建一个RAG智能问答应用很简单,但是在实际业务场景落地还需要做大量的准备工作。

2025-05-29 19:42:25 851

原创 大模型从理论到实践:RAG、Agent、微调等6种常见的大模型定制策略

大语言模型(LLM)是基于自监督学习预训练的深度学习模型,训练数据量庞大、训练时间长,并且包含大量的参数。LLM在过去两年中彻底改变了自然语言处理领域,展现了在理解和生成类人文本方面的卓越能力。

2025-05-29 19:15:29 1050

原创 20 种典型的 AI 用例,看完这篇更好地理解AI 在不同领域的实际应用价值

在 AI 时代,了解 AI 的各种应用场景对职场人士的发展至关重要。今天,我将为大家详细介绍书中提到的 20 种典型的 AI 用例,帮助您更好地理解 AI 在不同领域的实际应用价值。

2025-05-28 19:54:23 1084

原创 一张图彻底搞懂AI智能体的底层框架逻辑

智能体能够通过接收文字、图片、语音、视频和各种外部传感器接收数据。无论是文字、图片、语音、视频或者温度、压力、角度等都是一种数据,这些数据最终转化为计算器所能够理解的信息。

2025-05-28 19:40:53 923

原创 一文汇总11种新型检索增强生成(RAG)

随着人工智能的快速发展,检索增强生成(Retrieval-Augmented Generation,RAG)技术正在经历前所未有的演变。RAG技术通过将外部知识融入大型语言模型(LLM)的生成过程,极大地提高了AI系统的事实准确性和可靠性。如今,RAG正向更具智能性和自主性的方向发展,能够处理像超图这样的复杂结构,并适应各种专业领域的需求。

2025-05-27 18:03:42 899

原创 大模型Dify搭建超实用工作流,职场人必备效率神器!

Dify 是一款开源的大语言模型(LLM)应用开发平台,融合了后端即服务(BaaS)与 LLMOps 理念 ,旨在助力开发者快速搭建生产级的生成式 AI 应用。其操作界面集成了 AI 工作流程、RAG 管道、代理、模型管理等功能,通过直观的可视化界面,用户可以轻松构建和测试功能增强的 AI 工作流程。

2025-05-27 17:40:11 1912

原创 大语言模型引擎全解析:Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama,哪个才是最佳选择?

近年来,大语言模型(LLMs)如 GPT、LLaMA、BERT 等已经成为人工智能领域的核心驱动力。然而,如何高效地运行和优化这些模型,成为了开发者和研究者面临的重要挑战。为此,一系列专为大语言模型设计的引擎应运而生。本文将带你深入了解 Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama 这些引擎,帮助你找到最适合的工具,释放大语言模型的全部潜力!

2025-05-26 19:59:22 1178

原创 大模型微调实战:LORA轻量级微调DeepSeek

LORA(Low-Rank Adaptation) 是一种高效的参数高效微调方法,其核心思想是通过在预训练模型的权重矩阵中引入低秩适配矩阵(低秩分解矩阵 A 和 B),仅对这部分新增参数进行训练,从而大幅减少计算和显存开销。与传统全参数微调相比,LORA 通过冻结原始模型参数,仅更新适配层参数,实现了轻量化训练。

2025-05-26 19:56:54 1966

原创 大模型入门干货:算力与CPU、GPU、GPGPU、TPU、DPU,终于有人说清楚了!

“ 算力准备是大模型私有化部署的必要前提,那什么是算力?大模型算力芯片的种类有哪些?”无论是大模型训练阶段还是推理阶段都需要强大的算力支撑,什么是“算力”?大模型所需要的算力有何特点?

2025-05-24 18:58:40 3096

原创 大模型Agent 在各个行业领域的 “花式玩法”,涉及电影、博客、医疗等多领域

今年大模型Agent的风口确实很强,那么今天作者就继续再给大家认真盘一盘大模型Agent在各个领域的“花式玩法”,涉及电影、博客、医疗、金融分析、软件、数据可视化、新闻审查、具身AI、web导航等,并且基本上都有源码的。如果你正在做这方面的工作,亦或者是正在寻求Agent应用灵感,这篇文章或许对你有帮助。

2025-05-23 21:39:21 1139

原创 终于有人把 MCP 和 A2A 讲明白了!小白也能看懂的硬核科普!

听起来是不是有点“高大上”?别担心,今天我就用大白话,结合我自己的体验,跟大家聊聊这俩到底是啥,以及为啥我觉得它们可能预示着 **AI 智能体(Agent)真正“落地”的大时代,真的要来了!**

2025-05-23 21:36:44 1139

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除