
从0到1学习人工智能大模型
文章平均质量分 95
以通俗易懂的理论讲解为基础,配合实操课程。由浅入深分享如何用好人工智能大模型,人工智能大模型的原理和使用场景,如何微调人工智能大模型,如何亲手编写人工智能大模型,从0到1让你成为人工智能大模型专家!赶上这波AI的风口浪潮!
大模型真好玩
公众号【大模型真好玩】,北京理工大学本硕,曾在字节阿里从事开发工作,目前在某大型国企研究人工智能大模型。分享最简洁最实用的人工智能大模型开发经验,看好未来世界人工智能大模型会和PC一样成为人手必备的工具,大家现在就动手玩起来吧
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
深入浅出LangChain AI Agent智能体开发教程(六)—两行代码LangChain Agent API快速搭建智能体
本篇分享了LangChain Agent API快速搭建智能体的方法,通过create_tool_calling_agent创建模型和工具的Agent,并使用AgentExecutor执行Agent。原创 2025-08-02 11:15:00 · 646 阅读 · 0 评论 -
深入浅出LangChain AI Agent智能体开发教程(五)—LangChain接入工具基本流程
本文介绍了如何在LangChain框架中接入和使用内置工具、自定义函数工具的能力,并通过代码自动执行和天气助手两个案例进行实战总结,接入工具是LangChain框架的强大扩展,为构建复杂工作流奠定基础原创 2025-07-30 17:46:31 · 911 阅读 · 0 评论 -
深入浅出LangChain AI Agent智能体开发教程(四)—LangChain记忆存储与多轮对话机器人搭建
本期分享回顾了LangChain的基本概念、接入大模型和构造链的方法,然后学习了LangChain多轮对话记忆的编写原理,最后通过gradio和多轮对话打造了具备前后端功能的智能机器人。原创 2025-07-27 11:15:00 · 678 阅读 · 0 评论 -
深入浅出LangChain AI Agent智能体开发教程(三)—LangChain核心概念“链”
本期分享讲解了LangChain的核心概念—“链”,由易到难搭建了简单链、复合链和自定义节点链,同时了解提示词模板和结构化解析器的基本用法。通过实战代码让大家感受到LCEL语法的简洁性和实用性。原创 2025-07-22 00:09:24 · 629 阅读 · 0 评论 -
深入浅出LangChain AI Agent智能体开发教程(二)—LangChain接入大模型
本期分享我们讲解了LangChain接入大模型的基本架构,并列举了硅基流动和DeepSeek大模型接入的案例,最后给出了LangChain官方文档接入其它大模型的方法。下期分享将介绍LangChain核心概念—链!原创 2025-07-17 00:28:42 · 758 阅读 · 0 评论 -
深入浅出LangChain AI Agent智能体开发教程(一)—认识LangChain&LangGraph
本篇分享从LangChain&LangGraph的核心概念、核心特性、与其它框架的对比以及热门项目四个方面带大家详细了解了LangChain和LangGraph框架特性,为后期系列分享奠定理论基础。原创 2025-07-15 00:50:13 · 684 阅读 · 0 评论 -
准确率飙升!GraphRAG如何利用知识图谱提升RAG答案质量(额外篇)——大规模文本数据下GraphRAG实战
本篇分享我们使用GraphRAG对几万字的文档进行知识图谱的构建,并分析了长文本下GraphRAG的构建效率。本篇文章进一步对比了全局模式和本地模式查询的差异,总结了三种不适合使用本地模式的场景。原创 2025-07-09 00:38:35 · 671 阅读 · 0 评论 -
准确率飙升!Graph RAG如何利用知识图谱提升RAG答案质量(四)——微软GraphRAG代码实战
本篇分享介绍了GraphRAG从环境安装再到简单命令行调用和高级Python API调用的全部流程。大家看完本期分享将掌握集成GraphRAG代码到自己项目开发中的能力,大幅提升检索知识增强的性能!原创 2025-07-04 13:30:18 · 925 阅读 · 0 评论 -
准确率飙升!Graph RAG如何利用知识图谱提升RAG答案质量(三)——GraphRAG检索查询详细步骤
本篇分享详细描述了GraphRAG构建完成知识图谱后的检索查询过程,并通过实战案例带大家了解GraphRAG检索查询的两种模式,同时进一步对比传统RAG,让大家感受到GraphRAG的强大性能!原创 2025-06-27 00:04:41 · 718 阅读 · 0 评论 -
准确率飙升!Graph RAG如何利用知识图谱提升RAG答案质量(二)——GraphRAG图谱构建详细步骤
本篇分享详细讲述了GraphRA通过文本切分、实体识别、关系挖掘构建生成知识图谱的全过程。通过列举《大数据时代》文本实例详细展示了GraphRAG知识图谱生成细节,让大家感受到知识图谱如何更全面理解文本!原创 2025-06-23 08:15:00 · 1059 阅读 · 0 评论 -
准确率飙升!Graph RAG如何利用知识图谱提升RAG答案质量(一)——GraphRAG是什么?
本篇分享详细描述了GraphRAG的发展历程和技术特点,通过实际知识库问答案例向大家展示GraphRAG基于知识图谱相比传统RAG检索的优异性能,GraphRAG一定是未来技术的标杆,大家快来学习吧~原创 2025-06-19 08:15:00 · 571 阅读 · 0 评论 -
GRPO 代码实战!让大模型具备思维能力,打造你的专属DeepSeek
本篇分享通俗易懂的讲述了GRPO核心原理(不涉及大量公式),并通过TRL库和自定义奖励函数编写代码实现GRPO的完整训练流程!使Qwen2.5-0.5B-Instruct模型具备数学推理的能力~原创 2025-06-12 17:15:00 · 728 阅读 · 0 评论 -
可视化神器WandB,大模型训练的必备工具!
大语言模型训练中,我们往往需要监控和分析大量的训练数据,而WandB可以帮助我们实现这一目标。本期分享介绍了WandB的注册流程以及搭配Unsloth微调框架的使用智能,帮助你精准掌握大模型训练流程~原创 2025-06-08 11:55:27 · 821 阅读 · 0 评论 -
最强大模型评测工具EvalScope——模型好不好我自己说了算!
本篇分享详细介绍EvalScope的核心功能、整体架构和使用指南,帮助大家快速上手EvalScope对大模型进行压力测试和模型性能评估,以后大家不用被官方文档牵着鼻子走,模型好不好我一测就知道!原创 2025-06-05 19:11:43 · 1267 阅读 · 4 评论 -
使用 MCP 官方 SDK 快速开发流式 HTTP MCP 服务器
本篇分享详细介绍了如何利用MCP官方SDK开发流式HTTP MCP服务器,从环境构建到代码编写、测试及发布到公网的全流程,为开发者提供了高效开发流式HTTP MCP服务器的完整指南。原创 2025-05-23 20:45:19 · 1325 阅读 · 1 评论 -
人工智能大模型入门分享(一)——利用ollama搭建本地大模型服务(DeepSeek-R1)
DeepSeek, Qwen的大火,是否激发你动手玩大模型的DNA,本分享教你使用Ollama在本地管理使用大模型,并搭配page assit快速搭建Web服务访问大模型,动手操作起来吧!原创 2025-02-18 19:29:33 · 1490 阅读 · 0 评论 -
deepseek r1模型太大无法本地部署?我有妙招(非蒸馏版)
DeepSeek R1大模型的横空出世,标志着中国AI从追随者跃升为领导者!然而,服务器压力和数据隐私问题催生了本地部署的需求。本文揭秘三种低成本部署方案:1. 官方蒸馏模型,适合个人用户;2. 量化模型,显存>200G的用户可享满血版体验;3. KTransformers,仅需一张4090显卡,内存>380G即可运行满血版R1。AI不再是巨头专属,普通人也能玩转大模型!🚀原创 2025-02-20 12:57:41 · 2859 阅读 · 2 评论 -
不懂这些概念,你敢说你了解大模型嘛?(一)—大模型“瘦身”指南
DeepSeek火爆全球,但大模型背后的知识却鲜为人知!本文揭秘大模型的三大“黑科技”:蒸馏,量化,微调。在你成为AI扛把子的路上,这三大技术都能助你一臂之力。还不快点进来探索一下吧~原创 2025-02-16 13:42:43 · 1100 阅读 · 0 评论 -
如何让 AI 对你言听计从?答案就在提示词!(史上最详细最通俗易懂提示词教程一 —提示词必备要素与技巧)
深入探讨如何通过提示词工程与大模型进行高效交流。从提示词的基本要素到万能模板,详细讲解了如何通过清晰的指令、上下文、输入和输出来优化与大模型的互动。掌握这些技巧,你就能像编程一样“编写”大模型!原创 2025-03-06 10:00:00 · 2066 阅读 · 0 评论 -
如何让 AI 对你言听计从?答案就在提示词!(史上最详细最通俗易懂提示词教程二——提升大模型逻辑能力)
这篇分享教你如何让大模型从“满分文科生”变身“理科尖子生”——当它面对数学题翻车时(比如纠结9.11和9.8谁大),别慌!四大秘籍助你逆袭:1️⃣ 召唤推理专用模型(如DeepSeek-R1),2️⃣ 投喂“少样本提示”示例,3️⃣ 用“思维链”拆解问题(像侦探破案一样步步推导),4️⃣ 念咒“让我们逐步思考”触发零样本推理。从此,大模型不再是只会背书的书呆子,而是逻辑在线的解题狂魔!原创 2025-03-08 12:02:51 · 1123 阅读 · 0 评论 -
一文带你了解RAG核心原理!不再只是文档的搬运工
RAG系统通过数据准备、数据检索和LLM生成三个核心环节把外部知识和大语言模型能力完美结合,使得用户能够收获更专业更准确的知识。RAG系统使用者如果需要提升RAG系统性能,必须深刻了解RAG核心原理。原创 2025-04-18 13:17:54 · 880 阅读 · 0 评论 -
RAG系统效果不达预期?一定要看看这篇详细高效的优化指南!
还在为RAG系统效果不佳而发愁?本篇文章从RAG系统三个核心环节出发,针对每个环节提出了诸如切片优化、提示词优化等详细的优化策略,大家可以尝试组合这些优化策略,预计可将现有RAG系统效果提高20%原创 2025-04-25 00:20:37 · 1289 阅读 · 0 评论 -
一文读懂2025核心概念 AI Agent:科技巨头都在布局的未来赛道(DeepSeek只是开始,AI Agent更是未来!)
2025年,AI Agent被誉为AI Agent元年,黄仁勋、奥特曼、吴恩达等大佬纷纷为其站台。那么什么是AI Agent,它又具有哪些表现形式呢,本期文章就风趣幽默地带你来认识AI Agent~原创 2025-03-02 22:43:48 · 1497 阅读 · 0 评论 -
零门槛!手把手教你用VS Code + DeepSeek 免费玩转AI编程!(5分钟编写部署个人网站)
想用AI编程却不想掏腰包?别急,这篇教程教你如何用VS Code+DeepSeek+Cline+Continue免费打造AI编程助手!从下载软件到配置插件,再到生成代码、部署网站,手把手带你玩转AI编程。只需几分钟,你的个人网站就能上线,还能分享给小伙伴炫耀一番!快来试试,让AI帮你写代码,解放双手,轻松编程!原创 2025-02-28 00:16:04 · 2737 阅读 · 0 评论 -
DeepSeek大模型API实战指南,python一键调用AI超能力打造多轮对话机器人!
这篇文档教你如何用OpenAI格式调用DeepSeek大模型API,打造多轮对话机器人。从API优势到代码示例,手把手带你玩转AI,让你从“AI小白”变身“AI大神”。快来看看吧~原创 2025-03-24 09:00:00 · 1407 阅读 · 0 评论 -
从0到1开发DeepSeek天气助手智能体——你以为大模型只会聊天?Function Calling让它“上天入地”
本文分享了大模型的function calling 技术,使大模型不再只会问答,更可以上天入地做任何事!Fucntion calling技术也是AI Agent关键,还等什么快来看看吧~原创 2025-03-27 23:03:01 · 1560 阅读 · 0 评论 -
理论+代码一文带你深入浅出MCP:人工智能大模型与外部世界交互的革命性突破
本文对MCP的标准化、与function calling相比优势进行深入分析,同时通过Python代码实践开发了MCP客户端和服务端代码,帮大家掌握MCP全貌,快速拥抱MCP这项大模型的革命性技术~原创 2025-04-04 09:00:00 · 2064 阅读 · 0 评论 -
基于 MCP Http SSE模式的天气助手智能体开发实战(一文带你了解MCP两种开发模式)
介绍了MCP的两种通信方式:标准输入输出和基于HTTP的服务器推送事件。通过开发一个天气助手智能体的实战案例,生动展示了两种模式的异同, 还安利了MCP Inspector服务端调试工具,大家来看看吧原创 2025-04-07 09:00:00 · 2781 阅读 · 0 评论 -
不写一行代码! VsCode+Cline+高德地图MCP Server 帮你搞定和女友的出行规划(附原理解析)
分享使用VsCode+Cline+高德地图MCP Server,不写一行代码免费快速构建和女友出行规划智能体,同时还深入分析了Cline和高德地图MCP Server交互的技术原理,大家都来看看吧~原创 2025-04-12 17:17:23 · 1913 阅读 · 0 评论 -
Qwen3+Qwen Agent 智能体开发实战,打开大模型MCP工具新方式!(一)
本篇分享介绍了如何利用阿里发布的Qwen3系列大模型和Qwen-Agent工具快速接入MCP服务端并开发AI Agent智能体,通过开发一个自然语言操纵数据库的智能体实例直观感受Qwen-Agent!原创 2025-05-08 00:23:06 · 2959 阅读 · 0 评论 -
Qwen3+Qwen Agent +MCP智能体开发实战(二)—10分钟打造“MiniManus“
本篇分享我们使用Qwen-Agent的MCP和WebUI功能开发了用户友好的智能体应用。得益于Qwen3模型的强大能力和Qwen-Agent工具接入MCP的便捷性,我们可以10分钟打造自己的Manus原创 2025-05-13 20:17:05 · 1621 阅读 · 0 评论 -
理论+代码讲解Streamable HTTP MCP服务器原理,拒绝调包从0到1手撕流式 HTTP MCP服务器!
2025年MCP协议推出硬核升级—Streamable HTTP,彻底解决传统Stdio/SSE通信的关键问题。本文从理论出发,史上最详细讲解Streamable MCP Server核心原理,又从0到1手撕代码帮助你透彻理解Streamable MCP Server通信协议!原创 2025-05-19 20:53:16 · 2774 阅读 · 0 评论 -
初学者必看大模型微调指南:Unsloth官方微调技巧大公开!
本篇分享我们基于Unsloth官方文档结合工作种微调经验,为大家提供了合适的参数选择范围,帮助大家从成百上千种参数组合中快速定位到最优组合,加速微调过程,让初学者也能简单快速上手大模型微调。原创 2025-04-29 08:45:00 · 1015 阅读 · 0 评论 -
大模型私人定制:5分钟教你不写一行代码微调构建属于你的大模型(使用llama-factory微调Qwen大模型)
本文介绍了使用llama-factory微调大模型的方法,无需编程即可将通用模型转化为领域专家。涵盖微调原理(如LORA高效调参)、环境搭建、数据集构建、参数设置及实战步骤,并演示了模型评测对比,帮助你构建自己的大模型!原创 2025-03-14 14:10:56 · 1997 阅读 · 0 评论 -
大模型私人定制:短短几行代码微调构建属于你的人工智能大模型(使用unsloth微调DeepSeek-r1大模型)
本文介绍了使用unsloth微调DeepSeek大模型的方法,无需编程即可将通用模型转化为领域专家。涵盖微调原理(如LORA高效调参)、环境搭建、数据集构建、参数设置及实战步骤,并演示了模型评测对比。原创 2025-03-20 09:00:00 · 1357 阅读 · 0 评论