自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1220)
  • 收藏
  • 关注

原创 大模型学习文档+教程+PDF书籍+系统学习路线,一套全拿到!

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。事实上,抢你饭碗的不是AI,而是会利用AI的人。继科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

2025-03-26 19:45:50 896

原创 重磅发布 | 复旦《大规模语言模型:从理论到实践(第二版)》

本书将介绍大语言模型的基础理论包括语言模型、分布式模型训练以及强化学习,并以Deepspeed-Chat框架为例介绍实现大语言模型和类ChatGPT系统的实践。

2025-06-08 11:00:00 394

原创 LangGraph 实战:用 Python 打造有状态智能体

本文首先概述 LangGraph 的核心特点及设计理念,然后以"智能客服"场景为例,演示其基本用法和典型代码。

2025-06-08 10:00:00 375

原创 用一杯咖啡的时间,无需高端显卡,用魔塔社区实现大模型微调

用一杯咖啡的时间,无需高端显卡,用魔塔社区实现大模型微调

2025-06-07 14:22:58 450

原创 超 300 幅全彩图示,《图解大模型:生成式 AI 原理与实战》重磅上市!

超 300 幅全彩图示,《图解大模型:生成式 AI 原理与实战》重磅上市!

2025-06-07 14:20:53 417

原创 大模型系列炼丹术(六) - 别只会用Greedy!6种主流LLM解码策略全面解析,附适用场景

别只会用Greedy!6种主流LLM解码策略全面解析,附适用场景

2025-06-06 11:00:00 739

原创 大模型系列炼丹术(五):LLM自回归预训练过程详解

在前面的4篇文章中,我们已经完成了整个数据流向所需的模块构建,包括tokenizer,embedding,注意力机制,并串联得到了GPT2这个LLM架构。

2025-06-06 08:45:00 493

原创 大模型系列炼丹术(四):从零开始动手搭建GPT2架构

本文首先搭建GPT架构包含的🧍各个小组件,然后将这些组件串联起来,得到最终的GPT架构。

2025-06-05 14:43:55 625

原创 大模型系列炼丹术(三):从单头到多头,深度解析大语言模型中的注意力机制

在之前的两节内容中,我们已经将输入的句子通过tokenizer映射到了一个个的token IDs,并进一步做了连续编码,得到了包含充分语义信息的embedding向量。

2025-06-05 09:15:00 1554

原创 大模型系列炼丹术(二):从离散的token IDs到具有语义信息的embedding

在完成了tokenization之后,我们已经可以将一个个的单词映射到对应的数字,称之为token ID,这些数字已经可以被计算机处理。

2025-06-04 11:34:11 826

原创 大模型系列炼丹术(一):从tokenizer说起,为LLM自回归预训练准备数据集

在阅读完本文后,你将学会如何构建用于GPT自回归预训练阶段的数据加载器,这将是你向着LLM训练迈出的第一步!

2025-06-04 11:32:41 669

原创 大模型最新开源教程:[特殊字符]从零开始的大模型原理与实践教程

LLM 是一个快速发展、注重实践的领域,我们建议你多投入实战,复现本书提供的各种代码,同时积极参加 LLM 相关的项目与比赛,真正投入到 LLM 开发的浪潮中。

2025-06-04 11:21:07 800

原创 大型语言模型推理增强外部知识:综述

我们重点讨论结构化知识,提出了表格和知识图谱(KGs)的不同分类法,详细介绍了它们与LLM的集成范式,并回顾了具有代表性的方法。我们的比较分析进一步突出了可解释性、可扩展性和性能之间的权衡,为开发可信且具有普适性的知识增强LLM提供了洞察。

2025-06-03 15:21:32 747

原创 豆瓣评分 9.5,海外疯传,这本大模型书凭什么圈粉全球无数程序员?

豆瓣评分 9.5,海外疯传,这本大模型书凭什么圈粉全球无数程序员?

2025-06-03 15:14:10 483

原创 Ollama系列08:semantic kernel调用ollama接口

在前面的内容里面分享了如何使用OllamaSharp访问ollama接口,今天分享如何使用Semantic Kernel来访问ollama接口。

2025-05-31 12:00:00 1510

原创 Ollama系列07:Ollama本地部署大模型总结

今天计划对之前ollama系列做个回顾,从如何部署到API使用,整理到一篇内容中,提供给大家参考。

2025-05-31 11:45:00 708

原创 Ollama系列06:C#使用OllamaSharp集成Ollama服务

Ollama 提供了HTTP API的访问,如果需要使用SDK集成到项目中,需要引用第三方库OllamaSharp,直接使用nuget进行安装即可。

2025-05-31 07:15:00 942

原创 Ollama系列05:Ollama API 使用指南

在今天的分享中,我将分享如何通过API来调用ollama服务,通过整合ollama API,将AI能力集成到你的私有应用中,提升你的职场价值!

2025-05-30 15:45:00 1356

原创 Ollama系列04:进阶篇-搭建私有的知识库和问答系统—cherryStudio版

本文是Ollama系列教程的第4篇,在前面的3篇内容中,我们分享了如何在本地安装ollama、运行deepseek等大模型、以及如何在chatbox和cherryStudio中使用本地ollama中的大模型,我们创建了私有的AI对话框和智能体。

2025-05-30 10:15:00 1749

原创 Ollama系列03:快速上手搭建私有的AI对话框和智能体—cherryStudio版

本篇将介绍另一款好用的AI桌面应用CherryStudio,除了具备chatbox的对话、构建智能体功能之外,还具备构建本地知识库的功能。

2025-05-30 08:45:00 1337

原创 Ollama系列02:快速上手搭建私有的AI对话框和智能体—chatbox版

本文是Ollama系列教程的第2篇,在上一篇中我们介绍了Ollama的安装、大模型的下载和本地部署,本篇中我们将介绍如何将Ollama整合到chatBox中,并构建属于自己的智能体。

2025-05-29 15:45:04 706

原创 Ollama系列01:轻松3步本地部署deepseek,普通电脑可用

本文主要介绍如何通过ollama快速部署deepseek、qwq、llama3、gemma3等大模型,网速好的小伙伴10分钟就能搞定。让你摆脱GPU焦虑,在普通电脑上面玩转大模型。

2025-05-29 15:43:42 843

原创 基于fastGpt + m3e模型打造企业/个人私有化知识库(本地部署教程)

我专门编写了一篇简单易懂的教程,旨在帮助您使用FastGPT和Docker Compose搭建自己的本地知识库。这篇“保姆级”教程将引导您轻松完成这一任务。

2025-05-29 15:15:27 1010

原创 新手必看!LangGraph如何轻松搞定多语言模型协同工作

LangGraph是LangChain工具集中的一个重要组成部分,它是一个强大的库,专门用于简化LLMs的集成过程。

2025-05-28 15:06:48 530

原创 RAG与Agentic RAG:谁才是AI检索生成的未来?

在人工智能的浪潮中,检索增强生成(RAG)和代理式检索增强生成(Agentic RAG)正悄然改变着我们与机器交互的方式。今天,就让我们深入探讨这两者之间的差异,看看谁才是AI检索生成的未来!

2025-05-28 15:05:02 792

原创 重磅发布大模型书籍丨从零开始大模型开发与微调+大模型黑书(附PDF文档)

《从零开始大模型开发与微调:基于PyTorch与ChatGLM 》使用PyTorch 2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。

2025-05-27 15:14:29 747

原创 一本顶三本?入门LLM大模型必读《大模型应用开发极简入门》(附PDF书籍)

这两位作者一位侧重学术,一位侧重工程。在我看到本书之时,两位作者的背景信息,再加上 GPT-4 和 ChatGPT 这样的大模型前沿内容,就让我感觉非常值得一读。

2025-05-27 15:13:06 1024

原创 DeepSeek R1打造本地RAG知识库的AI助手:Dify深度讲解

本文将详细介绍如何利用 ollama 并结合 Dify 来搭建本地的私有 RAG 知识库,涵盖从环境准备到最终部署的完整工作流程以及关键技术细节。

2025-05-27 15:11:56 894

原创 大模型入门教程:写给0基础小白的大模型入门科普(附教程)

我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。

2025-05-26 10:17:28 805

原创 手把手掌握大模型技术!吴恩达&open AI联合推出《大模型通关指南》免费pdf分享

吴恩达老师与OpenAI合作推出的大模型系列教程,从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型API和LangChain架构快速开发结合大模型强大能力的应用。

2025-05-26 10:16:23 916

原创 手把手教你玩转开源大模型:从Llama3到企业级应用

AIGC 时代,大模型技术已成为企业数字化转型的关键。然而,大模型的选型、适配和应用对企业而言仍是挑战。本文将深入探讨如何选择、适配和落地大模型,为企业提供全面的大模型应用指南。

2025-05-26 10:15:25 831

原创 浙江大学高云君教授《大模型基础》教材发布,已开源(附PDF文档)

本书旨在针对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真严肃开源社区以及广大专家学者的建议,持续进行月度更新,致力打造易读、严谨、有深度的大模型教材。

2025-05-25 16:15:00 1650

原创 在Windows电脑上快速运行AI大模型-Llama3(附教程)

近期 Meta 发布了最新的 Llama3 模型,并开源了开源代码。Meta Llama 3 现已推出 8B 和 70B 预训练和指令调整版本,可支持广泛的应用程序。

2025-05-25 09:15:00 817

原创 DeepSeek带火AI大模型岗!急招岗年薪百万,人才缺口将达400万(附大模型教程)

正值年后跳槽高峰期,近期大火的国产AI大模型——DeepSeek发布的一系列高薪招聘信息在各大平台刷屏,阅读量上亿。

2025-05-25 07:45:00 747

原创 搭建个人知识库 | 手把手教你本地部署大模型(附教程)

搭建个人知识库 | 手把手教你本地部署大模型(附教程)

2025-05-24 10:50:37 1020

原创 一文让你搞懂向量数据库!结合大模型Agent,简直不要太好用(附教程)

以 ChatGPT 为代表的大语言模型问世,它在带来巨大震撼的同时,其天然缺陷和诸多限制也让开发者颇为困扰,比如存在输入上下文 token 限制、不具备记忆能力等问题。

2025-05-24 10:49:39 731

原创 本地知识库部署:AnythingLLM一键AI私有知识库! 支持多种大模型、RAG 和 AI Agents!

AnythingLLM是一个全栈AI应用程序,可以将任何文档、资源(如网址链接、音频、视频)输入大语言模型(LLM),与大模型互动。

2025-05-24 10:48:15 749

原创 人大高瓴团队的大语言模型综述出书啦——《大语言模型》轻松入门大模型(送pdf)

你是否读过大语言模型综述文章A Survey of Large Language Models?这篇来自学术界系统介绍大语言模型技术的综述性文章,成为了很多人入门大模型的必读论文。

2025-05-23 11:38:34 822

原创 全面且基础的大模型LLM入门教程书来了(附pdf)

24年8月出版的名为《Large Language Models: A Deep Dive》的教程书,内容和书名完美匹配,真的是完美符合新手入门大语言模型(LLM)的需求,不仅全面还足够基础。

2025-05-23 11:37:24 741

原创 大模型爆款新书TOP5盘点!为什么它们都火了?

整理了这份小榜单给大家——近期被读者买爆的计算机新书 TOP5!

2025-05-22 11:07:53 437

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除