- 博客(1220)
- 收藏
- 关注

原创 大模型学习文档+教程+PDF书籍+系统学习路线,一套全拿到!
大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。事实上,抢你饭碗的不是AI,而是会利用AI的人。继科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?
2025-03-26 19:45:50
896
原创 重磅发布 | 复旦《大规模语言模型:从理论到实践(第二版)》
本书将介绍大语言模型的基础理论包括语言模型、分布式模型训练以及强化学习,并以Deepspeed-Chat框架为例介绍实现大语言模型和类ChatGPT系统的实践。
2025-06-08 11:00:00
394
原创 LangGraph 实战:用 Python 打造有状态智能体
本文首先概述 LangGraph 的核心特点及设计理念,然后以"智能客服"场景为例,演示其基本用法和典型代码。
2025-06-08 10:00:00
375
原创 超 300 幅全彩图示,《图解大模型:生成式 AI 原理与实战》重磅上市!
超 300 幅全彩图示,《图解大模型:生成式 AI 原理与实战》重磅上市!
2025-06-07 14:20:53
417
原创 大模型系列炼丹术(六) - 别只会用Greedy!6种主流LLM解码策略全面解析,附适用场景
别只会用Greedy!6种主流LLM解码策略全面解析,附适用场景
2025-06-06 11:00:00
739
原创 大模型系列炼丹术(五):LLM自回归预训练过程详解
在前面的4篇文章中,我们已经完成了整个数据流向所需的模块构建,包括tokenizer,embedding,注意力机制,并串联得到了GPT2这个LLM架构。
2025-06-06 08:45:00
493
原创 大模型系列炼丹术(三):从单头到多头,深度解析大语言模型中的注意力机制
在之前的两节内容中,我们已经将输入的句子通过tokenizer映射到了一个个的token IDs,并进一步做了连续编码,得到了包含充分语义信息的embedding向量。
2025-06-05 09:15:00
1554
原创 大模型系列炼丹术(二):从离散的token IDs到具有语义信息的embedding
在完成了tokenization之后,我们已经可以将一个个的单词映射到对应的数字,称之为token ID,这些数字已经可以被计算机处理。
2025-06-04 11:34:11
826
原创 大模型系列炼丹术(一):从tokenizer说起,为LLM自回归预训练准备数据集
在阅读完本文后,你将学会如何构建用于GPT自回归预训练阶段的数据加载器,这将是你向着LLM训练迈出的第一步!
2025-06-04 11:32:41
669
原创 大模型最新开源教程:[特殊字符]从零开始的大模型原理与实践教程
LLM 是一个快速发展、注重实践的领域,我们建议你多投入实战,复现本书提供的各种代码,同时积极参加 LLM 相关的项目与比赛,真正投入到 LLM 开发的浪潮中。
2025-06-04 11:21:07
800
原创 大型语言模型推理增强外部知识:综述
我们重点讨论结构化知识,提出了表格和知识图谱(KGs)的不同分类法,详细介绍了它们与LLM的集成范式,并回顾了具有代表性的方法。我们的比较分析进一步突出了可解释性、可扩展性和性能之间的权衡,为开发可信且具有普适性的知识增强LLM提供了洞察。
2025-06-03 15:21:32
747
原创 Ollama系列08:semantic kernel调用ollama接口
在前面的内容里面分享了如何使用OllamaSharp访问ollama接口,今天分享如何使用Semantic Kernel来访问ollama接口。
2025-05-31 12:00:00
1510
原创 Ollama系列07:Ollama本地部署大模型总结
今天计划对之前ollama系列做个回顾,从如何部署到API使用,整理到一篇内容中,提供给大家参考。
2025-05-31 11:45:00
708
原创 Ollama系列06:C#使用OllamaSharp集成Ollama服务
Ollama 提供了HTTP API的访问,如果需要使用SDK集成到项目中,需要引用第三方库OllamaSharp,直接使用nuget进行安装即可。
2025-05-31 07:15:00
942
原创 Ollama系列05:Ollama API 使用指南
在今天的分享中,我将分享如何通过API来调用ollama服务,通过整合ollama API,将AI能力集成到你的私有应用中,提升你的职场价值!
2025-05-30 15:45:00
1356
原创 Ollama系列04:进阶篇-搭建私有的知识库和问答系统—cherryStudio版
本文是Ollama系列教程的第4篇,在前面的3篇内容中,我们分享了如何在本地安装ollama、运行deepseek等大模型、以及如何在chatbox和cherryStudio中使用本地ollama中的大模型,我们创建了私有的AI对话框和智能体。
2025-05-30 10:15:00
1749
原创 Ollama系列03:快速上手搭建私有的AI对话框和智能体—cherryStudio版
本篇将介绍另一款好用的AI桌面应用CherryStudio,除了具备chatbox的对话、构建智能体功能之外,还具备构建本地知识库的功能。
2025-05-30 08:45:00
1337
原创 Ollama系列02:快速上手搭建私有的AI对话框和智能体—chatbox版
本文是Ollama系列教程的第2篇,在上一篇中我们介绍了Ollama的安装、大模型的下载和本地部署,本篇中我们将介绍如何将Ollama整合到chatBox中,并构建属于自己的智能体。
2025-05-29 15:45:04
706
原创 Ollama系列01:轻松3步本地部署deepseek,普通电脑可用
本文主要介绍如何通过ollama快速部署deepseek、qwq、llama3、gemma3等大模型,网速好的小伙伴10分钟就能搞定。让你摆脱GPU焦虑,在普通电脑上面玩转大模型。
2025-05-29 15:43:42
843
原创 基于fastGpt + m3e模型打造企业/个人私有化知识库(本地部署教程)
我专门编写了一篇简单易懂的教程,旨在帮助您使用FastGPT和Docker Compose搭建自己的本地知识库。这篇“保姆级”教程将引导您轻松完成这一任务。
2025-05-29 15:15:27
1010
原创 新手必看!LangGraph如何轻松搞定多语言模型协同工作
LangGraph是LangChain工具集中的一个重要组成部分,它是一个强大的库,专门用于简化LLMs的集成过程。
2025-05-28 15:06:48
530
原创 RAG与Agentic RAG:谁才是AI检索生成的未来?
在人工智能的浪潮中,检索增强生成(RAG)和代理式检索增强生成(Agentic RAG)正悄然改变着我们与机器交互的方式。今天,就让我们深入探讨这两者之间的差异,看看谁才是AI检索生成的未来!
2025-05-28 15:05:02
792
原创 重磅发布大模型书籍丨从零开始大模型开发与微调+大模型黑书(附PDF文档)
《从零开始大模型开发与微调:基于PyTorch与ChatGLM 》使用PyTorch 2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。
2025-05-27 15:14:29
747
原创 一本顶三本?入门LLM大模型必读《大模型应用开发极简入门》(附PDF书籍)
这两位作者一位侧重学术,一位侧重工程。在我看到本书之时,两位作者的背景信息,再加上 GPT-4 和 ChatGPT 这样的大模型前沿内容,就让我感觉非常值得一读。
2025-05-27 15:13:06
1024
原创 DeepSeek R1打造本地RAG知识库的AI助手:Dify深度讲解
本文将详细介绍如何利用 ollama 并结合 Dify 来搭建本地的私有 RAG 知识库,涵盖从环境准备到最终部署的完整工作流程以及关键技术细节。
2025-05-27 15:11:56
894
原创 大模型入门教程:写给0基础小白的大模型入门科普(附教程)
我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。
2025-05-26 10:17:28
805
原创 手把手掌握大模型技术!吴恩达&open AI联合推出《大模型通关指南》免费pdf分享
吴恩达老师与OpenAI合作推出的大模型系列教程,从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型API和LangChain架构快速开发结合大模型强大能力的应用。
2025-05-26 10:16:23
916
原创 手把手教你玩转开源大模型:从Llama3到企业级应用
AIGC 时代,大模型技术已成为企业数字化转型的关键。然而,大模型的选型、适配和应用对企业而言仍是挑战。本文将深入探讨如何选择、适配和落地大模型,为企业提供全面的大模型应用指南。
2025-05-26 10:15:25
831
原创 浙江大学高云君教授《大模型基础》教材发布,已开源(附PDF文档)
本书旨在针对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真严肃开源社区以及广大专家学者的建议,持续进行月度更新,致力打造易读、严谨、有深度的大模型教材。
2025-05-25 16:15:00
1650
原创 在Windows电脑上快速运行AI大模型-Llama3(附教程)
近期 Meta 发布了最新的 Llama3 模型,并开源了开源代码。Meta Llama 3 现已推出 8B 和 70B 预训练和指令调整版本,可支持广泛的应用程序。
2025-05-25 09:15:00
817
原创 DeepSeek带火AI大模型岗!急招岗年薪百万,人才缺口将达400万(附大模型教程)
正值年后跳槽高峰期,近期大火的国产AI大模型——DeepSeek发布的一系列高薪招聘信息在各大平台刷屏,阅读量上亿。
2025-05-25 07:45:00
747
原创 一文让你搞懂向量数据库!结合大模型Agent,简直不要太好用(附教程)
以 ChatGPT 为代表的大语言模型问世,它在带来巨大震撼的同时,其天然缺陷和诸多限制也让开发者颇为困扰,比如存在输入上下文 token 限制、不具备记忆能力等问题。
2025-05-24 10:49:39
731
原创 本地知识库部署:AnythingLLM一键AI私有知识库! 支持多种大模型、RAG 和 AI Agents!
AnythingLLM是一个全栈AI应用程序,可以将任何文档、资源(如网址链接、音频、视频)输入大语言模型(LLM),与大模型互动。
2025-05-24 10:48:15
749
原创 人大高瓴团队的大语言模型综述出书啦——《大语言模型》轻松入门大模型(送pdf)
你是否读过大语言模型综述文章A Survey of Large Language Models?这篇来自学术界系统介绍大语言模型技术的综述性文章,成为了很多人入门大模型的必读论文。
2025-05-23 11:38:34
822
原创 全面且基础的大模型LLM入门教程书来了(附pdf)
24年8月出版的名为《Large Language Models: A Deep Dive》的教程书,内容和书名完美匹配,真的是完美符合新手入门大语言模型(LLM)的需求,不仅全面还足够基础。
2025-05-23 11:37:24
741
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人