
大模型LLM
文章平均质量分 95
关于大模型的系列文章
IT从业者张某某
致力成为一个做事高效,待人认真,对社会产生价值的人
展开
-
大语言模型-2.2/3-主流模型架构与新型架构
本博客内容是《大语言模型》一书的读书笔记,本文主要记录datawhale的活动学习笔记,本文是大语言模型的主流模型架构与新型架构部分原创 2025-03-23 20:52:21 · 1095 阅读 · 0 评论 -
大语言模型-2.1-Transformer架构及详细配置
本博客内容是《大语言模型》一书的读书笔记,本文主要记录datawhale的活动学习笔记,本文主要介绍Transformer架构及详细配置原创 2025-03-18 17:15:31 · 929 阅读 · 0 评论 -
基于扣子(coze.cn)搭建一个古文化学习助手
基于coze完成一个agent原创 2025-03-18 11:56:57 · 875 阅读 · 0 评论 -
在教育领域的大模型知识引擎 × DeepSeek应用
基于腾讯云的大模型知识引擎 LKE构建了一个包含RAG+工作流的Agent原创 2025-03-14 17:39:11 · 385 阅读 · 0 评论 -
从零预训练一个自己的大模型(完整代码)
本文从零开始训练一个大模型原创 2025-03-12 16:49:28 · 1396 阅读 · 0 评论 -
大语言模型-1.3-GPT、DeepSeek模型介绍
本博客内容是《大语言模型》一书的读书笔记,本文主要记录datawhale的活动学习笔记,本部分主要介绍GPT和DeepSeek的进展。原创 2025-03-12 11:13:38 · 1071 阅读 · 0 评论 -
大语言模型-1.2-大模型技术基础
本博客内容是《大语言模型》一书的读书笔记,本文主要记录datawhale的活动学习笔记,本博客位大模型的技术基础包括训练过程与一些模型原理。原创 2025-03-12 10:00:46 · 1157 阅读 · 0 评论 -
大语言模型-1.3-预训练语言模型到大语言模型
本博客内容是《大语言模型》一书的读书笔记,本文主要记录datawhale的活动学习笔记,主要内容位预训练模型到大语言模型阶段。原创 2025-03-12 06:05:45 · 758 阅读 · 0 评论 -
大语言模型-01-语言模型发展历程-02-从神经网络到ELMo
本博客内容是《大语言模型》一书的读书笔记,本文主要记录datawhale的活动学习笔记,本文为神经网络到ELMO。原创 2025-03-10 17:11:12 · 903 阅读 · 0 评论 -
大语言模型-01-语言模型发展历程-01
本博客内容是《大语言模型》一书的读书笔记,本文主要记录datawhale的活动学习笔记,本文内容介绍了语言发展模型原创 2025-03-10 15:37:24 · 987 阅读 · 0 评论 -
大语言模型-1.1-语言模型发展历程
本博客内容是《大语言模型》一书的读书笔记,本文主要记录datawhale的活动学习笔记,是系列博客的汇总。原创 2025-03-10 15:36:37 · 751 阅读 · 0 评论 -
深入探索像ChatGPT这样的大语言模型
深入探索像ChatGPT这样的大语言模型,本文是第1-3汇总篇,主要介绍了base模型,SFT与RL等阶段,并提出了下一步的探索原创 2025-03-04 16:14:56 · 1598 阅读 · 1 评论 -
深入探索像ChatGPT这样的大语言模型-03-POST-Training:Reinforcement Learning
深入探索像ChatGPT这样的大语言模型,本文是第3篇,主要介绍了后训练的RL部分原创 2025-03-04 16:14:00 · 1523 阅读 · 0 评论 -
深入探索像ChatGPT这样的大语言模型-02-POST training supervised finetuning
深入探索像ChatGPT这样的大语言模型,本文是第2篇,主要介绍了助手模型的训练过程,SFT原创 2025-03-03 13:28:05 · 1096 阅读 · 0 评论 -
深入探索像ChatGPT这样的大语言模型-01-Base Model-Pretraining阶段
深入探索像ChatGPT这样的大语言模型,本文是第一篇,主要介绍了base模型的训练过程原创 2025-03-03 08:39:38 · 964 阅读 · 0 评论 -
DeepSeek从云端模型部署到应用开发-03-实战指南:从部署到RAG Agent
基于DeepSeek构建RAG原创 2025-02-21 09:49:17 · 829 阅读 · 0 评论 -
DeepSeek从云端模型部署到应用开发-02-ollama+deepseekr1本地部署
本文完成deepseek+ollama的本地部署与chatbox AI的使用。原创 2025-02-19 17:16:05 · 1583 阅读 · 0 评论 -
DeepSeek从云端模型部署到应用开发-01-社区内一键部署DeepSeek
DeepSeek简介与在aistudio社区一键部署原创 2025-02-19 14:55:00 · 840 阅读 · 0 评论