- 博客(1226)
- 收藏
- 关注

原创 大模型学习文档+教程+PDF书籍+系统学习路线,一套全拿到!
大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。事实上,抢你饭碗的不是AI,而是会利用AI的人。继科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?
2025-03-26 19:45:50
894
原创 打造自己的大模型|03篇 使用llama.cpp量化并在Mac上私有部署ChatGPT
本篇文章,我们将对微调之后的大模型,进行量化处理,并在本地部署打造一个属于我们自己的ChatGPT。
2025-06-11 13:32:45
478
原创 打造自己的大模型-01篇|LLaMA-Factory微调Llama3和其占用资源分析
本教程就以Llama3-8B-Instruct开源模型为模型基座,通过开源程序LLaMA-Factory来进行中文的微调,提高Llama3的中文能力!
2025-06-11 13:29:46
512
原创 生成式 AI 领域的权威之作!一定不要错过这本书!
这个指南不是简单地列出一些“魔术词”来找到正确的组合,而是教你如何构建系统,为AI应用提供合适的上下文,并说明如何测试和扩展AI系统以用于生产环境。在这本书中,你将看到数百个示例,展示如何使用提示技术,包括文本和图像提示,以及如何使用Python构建AI自动化脚本和产品。在人工智能技术迅猛发展的今天,生成式AI已渗透至内容创作、数据分析、商业决策等各个领域。阅读本书,将有效解决这些问题,并获得可信赖的生成式AI。大佬们对这本书的评价也毋庸置疑了这本书的含金量!,帮助你掌握 LLM 和扩散模型的应用技巧。
2025-06-10 11:14:14
125
原创 目前最好的 LLMOps 实用书籍之一,从零构建和部署有效的 LLM 系统!
跟着书里的例子,你就能把 MLOps 的各种技巧用到自己的项目里。而且,它还会告诉你 LLM 领域现在最火的技术,比如怎么让模型跑得更快、更符合你的需求,以及怎么处理实时数据。你将学习构建一个由 LLM 驱动的孪生模型,它不仅经济高效、可扩展且模块化,更能超越 Jupyter 笔记本的实验阶段,构建真正可用于生产的端到端 LLM 系统。无论你是刚入门的人工智能爱好者,还是经验丰富的从业者,本书都将为你提供LLM部署的全面指导。通过本书,你将深入理解LLM的原理,并掌握将其应用于实际场景的关键技能。
2025-06-10 11:11:33
124
原创 全网爆火的大模型综述,现在终于出纸质书了丨送PDF电子书
大模型火了两年了,一些优质的科普教学资源还是比较稀缺。我们发现在高校中,尽管相当一部分学生已经将大模型应用,结合到了日常学习生活之中,但真正搞懂大模型前后今生的,是少之又少的。在 24 年暑假,我们和清华 NLP 实验室、OpenBMB、Huggingface 有个合作,将其录制的大模型公开课进行推广和内容二创。我们认为那是当下国内最好的最新的人工智能导论课。除了课程外,它的名字朴实无华,但它的内涵如特工少女一般丰富深邃…
2025-06-09 14:56:50
730
原创 大模型新书丨AI工程化落地必读书籍,强烈推荐!
本文推荐一本关于 AI 工程的书籍《AI Engineering: Building Applications with Foundation Models》,个人认为是目前最好的关于基于大模型的 AI 工程的书籍,涵盖适合核心原理、开发流程与策略、数据集处理、提示工程、RAG、微调、智能体等内容,内容覆盖全面,从入门到进阶,很适合 AI 工程的开发者阅读,强烈推荐!
2025-06-09 14:55:04
634
原创 重磅发布 | 复旦《大规模语言模型:从理论到实践(第二版)》
本书将介绍大语言模型的基础理论包括语言模型、分布式模型训练以及强化学习,并以Deepspeed-Chat框架为例介绍实现大语言模型和类ChatGPT系统的实践。
2025-06-08 11:00:00
936
原创 LangGraph 实战:用 Python 打造有状态智能体
本文首先概述 LangGraph 的核心特点及设计理念,然后以"智能客服"场景为例,演示其基本用法和典型代码。
2025-06-08 10:00:00
889
原创 超 300 幅全彩图示,《图解大模型:生成式 AI 原理与实战》重磅上市!
超 300 幅全彩图示,《图解大模型:生成式 AI 原理与实战》重磅上市!
2025-06-07 14:20:53
667
原创 大模型系列炼丹术(六) - 别只会用Greedy!6种主流LLM解码策略全面解析,附适用场景
别只会用Greedy!6种主流LLM解码策略全面解析,附适用场景
2025-06-06 11:00:00
739
原创 大模型系列炼丹术(五):LLM自回归预训练过程详解
在前面的4篇文章中,我们已经完成了整个数据流向所需的模块构建,包括tokenizer,embedding,注意力机制,并串联得到了GPT2这个LLM架构。
2025-06-06 08:45:00
556
原创 大模型系列炼丹术(三):从单头到多头,深度解析大语言模型中的注意力机制
在之前的两节内容中,我们已经将输入的句子通过tokenizer映射到了一个个的token IDs,并进一步做了连续编码,得到了包含充分语义信息的embedding向量。
2025-06-05 09:15:00
1554
原创 大模型系列炼丹术(二):从离散的token IDs到具有语义信息的embedding
在完成了tokenization之后,我们已经可以将一个个的单词映射到对应的数字,称之为token ID,这些数字已经可以被计算机处理。
2025-06-04 11:34:11
826
原创 大模型系列炼丹术(一):从tokenizer说起,为LLM自回归预训练准备数据集
在阅读完本文后,你将学会如何构建用于GPT自回归预训练阶段的数据加载器,这将是你向着LLM训练迈出的第一步!
2025-06-04 11:32:41
673
原创 大模型最新开源教程:[特殊字符]从零开始的大模型原理与实践教程
LLM 是一个快速发展、注重实践的领域,我们建议你多投入实战,复现本书提供的各种代码,同时积极参加 LLM 相关的项目与比赛,真正投入到 LLM 开发的浪潮中。
2025-06-04 11:21:07
802
原创 大型语言模型推理增强外部知识:综述
我们重点讨论结构化知识,提出了表格和知识图谱(KGs)的不同分类法,详细介绍了它们与LLM的集成范式,并回顾了具有代表性的方法。我们的比较分析进一步突出了可解释性、可扩展性和性能之间的权衡,为开发可信且具有普适性的知识增强LLM提供了洞察。
2025-06-03 15:21:32
746
原创 Ollama系列08:semantic kernel调用ollama接口
在前面的内容里面分享了如何使用OllamaSharp访问ollama接口,今天分享如何使用Semantic Kernel来访问ollama接口。
2025-05-31 12:00:00
1512
原创 Ollama系列07:Ollama本地部署大模型总结
今天计划对之前ollama系列做个回顾,从如何部署到API使用,整理到一篇内容中,提供给大家参考。
2025-05-31 11:45:00
711
原创 Ollama系列06:C#使用OllamaSharp集成Ollama服务
Ollama 提供了HTTP API的访问,如果需要使用SDK集成到项目中,需要引用第三方库OllamaSharp,直接使用nuget进行安装即可。
2025-05-31 07:15:00
946
原创 Ollama系列05:Ollama API 使用指南
在今天的分享中,我将分享如何通过API来调用ollama服务,通过整合ollama API,将AI能力集成到你的私有应用中,提升你的职场价值!
2025-05-30 15:45:00
1356
原创 Ollama系列04:进阶篇-搭建私有的知识库和问答系统—cherryStudio版
本文是Ollama系列教程的第4篇,在前面的3篇内容中,我们分享了如何在本地安装ollama、运行deepseek等大模型、以及如何在chatbox和cherryStudio中使用本地ollama中的大模型,我们创建了私有的AI对话框和智能体。
2025-05-30 10:15:00
1751
原创 Ollama系列03:快速上手搭建私有的AI对话框和智能体—cherryStudio版
本篇将介绍另一款好用的AI桌面应用CherryStudio,除了具备chatbox的对话、构建智能体功能之外,还具备构建本地知识库的功能。
2025-05-30 08:45:00
1340
原创 Ollama系列02:快速上手搭建私有的AI对话框和智能体—chatbox版
本文是Ollama系列教程的第2篇,在上一篇中我们介绍了Ollama的安装、大模型的下载和本地部署,本篇中我们将介绍如何将Ollama整合到chatBox中,并构建属于自己的智能体。
2025-05-29 15:45:04
708
原创 Ollama系列01:轻松3步本地部署deepseek,普通电脑可用
本文主要介绍如何通过ollama快速部署deepseek、qwq、llama3、gemma3等大模型,网速好的小伙伴10分钟就能搞定。让你摆脱GPU焦虑,在普通电脑上面玩转大模型。
2025-05-29 15:43:42
842
原创 基于fastGpt + m3e模型打造企业/个人私有化知识库(本地部署教程)
我专门编写了一篇简单易懂的教程,旨在帮助您使用FastGPT和Docker Compose搭建自己的本地知识库。这篇“保姆级”教程将引导您轻松完成这一任务。
2025-05-29 15:15:27
1011
原创 新手必看!LangGraph如何轻松搞定多语言模型协同工作
LangGraph是LangChain工具集中的一个重要组成部分,它是一个强大的库,专门用于简化LLMs的集成过程。
2025-05-28 15:06:48
532
原创 RAG与Agentic RAG:谁才是AI检索生成的未来?
在人工智能的浪潮中,检索增强生成(RAG)和代理式检索增强生成(Agentic RAG)正悄然改变着我们与机器交互的方式。今天,就让我们深入探讨这两者之间的差异,看看谁才是AI检索生成的未来!
2025-05-28 15:05:02
793
原创 重磅发布大模型书籍丨从零开始大模型开发与微调+大模型黑书(附PDF文档)
《从零开始大模型开发与微调:基于PyTorch与ChatGLM 》使用PyTorch 2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。
2025-05-27 15:14:29
749
原创 一本顶三本?入门LLM大模型必读《大模型应用开发极简入门》(附PDF书籍)
这两位作者一位侧重学术,一位侧重工程。在我看到本书之时,两位作者的背景信息,再加上 GPT-4 和 ChatGPT 这样的大模型前沿内容,就让我感觉非常值得一读。
2025-05-27 15:13:06
1025
原创 DeepSeek R1打造本地RAG知识库的AI助手:Dify深度讲解
本文将详细介绍如何利用 ollama 并结合 Dify 来搭建本地的私有 RAG 知识库,涵盖从环境准备到最终部署的完整工作流程以及关键技术细节。
2025-05-27 15:11:56
896
原创 大模型入门教程:写给0基础小白的大模型入门科普(附教程)
我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。
2025-05-26 10:17:28
790
原创 手把手掌握大模型技术!吴恩达&open AI联合推出《大模型通关指南》免费pdf分享
吴恩达老师与OpenAI合作推出的大模型系列教程,从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型API和LangChain架构快速开发结合大模型强大能力的应用。
2025-05-26 10:16:23
916
原创 手把手教你玩转开源大模型:从Llama3到企业级应用
AIGC 时代,大模型技术已成为企业数字化转型的关键。然而,大模型的选型、适配和应用对企业而言仍是挑战。本文将深入探讨如何选择、适配和落地大模型,为企业提供全面的大模型应用指南。
2025-05-26 10:15:25
832
原创 浙江大学高云君教授《大模型基础》教材发布,已开源(附PDF文档)
本书旨在针对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真严肃开源社区以及广大专家学者的建议,持续进行月度更新,致力打造易读、严谨、有深度的大模型教材。
2025-05-25 16:15:00
1651
原创 在Windows电脑上快速运行AI大模型-Llama3(附教程)
近期 Meta 发布了最新的 Llama3 模型,并开源了开源代码。Meta Llama 3 现已推出 8B 和 70B 预训练和指令调整版本,可支持广泛的应用程序。
2025-05-25 09:15:00
815
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人