
大大大模型知识点
文章平均质量分 90
985小水博一枚呀
谢谢粉丝宝宝们的关注,我会持续分享深度学习笔记|地学应用|论文推荐和学术会议推荐!!!每日必更!!!
需要发表学术会议论文SCI检索EI检索scope检索IEEE收录|参会经历—口头汇报或者海报展示的同学可以私戳我!!!
射手座//国内985摸鱼的小水博/爱好学习和讨论/欢迎留言交流/欢迎提供可以解析的素材
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【人工智能之大模型】详述大模型中矩阵乘法如何做张量并行?
【人工智能之大模型】详述大模型中矩阵乘法如何做张量并行?原创 2025-04-30 07:30:00 · 844 阅读 · 0 评论 -
【人工智能之大模型】详述LLMs中量化权重(Weight Quantization)和量化激活(Activation Quantization)的区别是什么?
【人工智能之大模型】详述LLMs中量化权重(Weight Quantization)和量化激活(Activation Quantization)的区别是什么?原创 2025-04-29 10:00:00 · 815 阅读 · 0 评论 -
【人工智能之大模型】详述训练后量化(Post-Training Quantization,PTQ)和量化感知训练(Quantization-Aware Training,QAT)的区别?
【人工智能之大模型】详述训练后量化(Post-Training Quantization,PTQ)和量化感知训练(Quantization-Aware Training,QAT)的区别?原创 2025-04-28 09:15:00 · 642 阅读 · 0 评论 -
【人工智能之大模型】大模型中PPO(Proximal Policy Optimization)算法流程,并说明它跟TRPO的区别是什么?
【人工智能之大模型】大模型中PPO(Proximal Policy Optimization)算法流程,并说明它跟TRPO的区别是什么?原创 2025-04-27 07:30:00 · 711 阅读 · 0 评论 -
【人工智能之大模型】详述大模型中流水线并行(Pipeline Parallelism)的GPipe推理框架?
【人工智能之大模型】详述大模型中流水线并行(Pipeline Parallelism)的GPipe推理框架?原创 2025-04-26 09:30:00 · 676 阅读 · 0 评论 -
【人工智能之大模型】详述大模型中稀疏微调(Sparse Fine-Tuning)的原理、优势和挑战?
【人工智能之大模型】详述大模型中稀疏微调(Sparse Fine-Tuning)的原理、优势和挑战?原创 2025-04-25 09:45:00 · 634 阅读 · 0 评论 -
【人工智能之大模型】介绍LORA微调、微调适配器和前缀微调,并说明LORA微调相比于微调适配器或者前缀微调有什么优势?
【人工智能之大模型】介绍LORA微调、微调适配器和前缀微调,并说明LORA微调相比于微调适配器或者前缀微调有什么优势?原创 2025-04-25 07:30:00 · 819 阅读 · 0 评论 -
【人工智能之大模型】参数高效的微调PEFT有哪些方法?
【人工智能之大模型】参数高效的微调PEFT有哪些方法?原创 2025-04-24 09:30:00 · 668 阅读 · 0 评论 -
【人工智能之大模型】介绍监督微调(SFT)和基于人类反馈的强化学习(RLHF),并说明RHLF模型为什么会表现比SFT更好?
【人工智能之大模型】介绍监督微调(SFT)和基于人类反馈的强化学习(RLHF),并说明RHLF模型为什么会表现比SFT更好?原创 2025-04-24 07:30:00 · 783 阅读 · 0 评论 -
【人工智能之大模型】Transformer 系列模型中,LayerNorm(层归一化)的应用实例,附代码。
【人工智能之大模型】Transformer 系列模型中,LayerNorm(层归一化)的应用实例,附代码。原创 2025-04-18 09:00:00 · 754 阅读 · 0 评论 -
【人工智能之大模型】详细介绍大语言模型(LLM)增强技术ReAct?并说明它的优点?
【人工智能之大模型】详细介绍大语言模型(LLM)增强技术ReAct?并说明它的优点?原创 2025-04-17 07:30:00 · 851 阅读 · 0 评论 -
【人工智能之大模型】什么样的任务或领域适合用思维链(CoT)提示?
【人工智能之大模型】什么样的任务或领域适合用思维链(CoT)提示?原创 2025-04-16 07:30:00 · 901 阅读 · 0 评论 -
【人工智能之大模型】详细介绍Post-LayerNorm和Pre-LayerNorm的区别?
【人工智能之大模型】详细介绍Post-LayerNorm和Pre-LayerNorm的区别?原创 2025-04-14 09:15:00 · 791 阅读 · 0 评论 -
【人工智能之大模型】简述温度系数和top-p和top-k参数有什么区别?
【人工智能之大模型】简述温度系数和top-p和top-k参数有什么区别?原创 2025-04-09 11:00:00 · 1813 阅读 · 0 评论 -
【人工智能之大模型】简述 GPT-3拥有的1750亿参数,是怎么算出来的?
【人工智能之大模型】简述 GPT-3拥有的1750亿参数,是怎么算出来的?原创 2025-04-08 07:30:00 · 961 阅读 · 0 评论 -
【人工智能之大模型】列举有哪些常见的优化LLMs输出的技术?
【人工智能之大模型】列举有哪些常见的优化LLMs输出的技术?原创 2025-04-07 09:30:00 · 1605 阅读 · 0 评论 -
【人工智能之大模型】在Transformer中,同一个词可以有不同的注意力权重嘛?为什么
【人工智能之大模型】在Transformer中,同一个词可以有不同的注意力权重嘛?为什么原创 2025-04-03 13:30:00 · 802 阅读 · 0 评论 -
【人工智能之大模型】Transformer是否需要位置编码?为什么
【人工智能之大模型】Transformer是否需要位置编码?为什么原创 2025-04-02 10:00:00 · 2460 阅读 · 7 评论 -
【人工智能之大模型】为什么Transformer的架构需要多头注意力机制?
【人工智能之大模型】为什么Transformer的架构需要多头注意力机制?原创 2025-04-02 07:30:00 · 997 阅读 · 0 评论 -
【人工智能之大模型】简述Transformer的基本原理?
【人工智能之大模型】简述Transformer的基本原理?原创 2025-04-01 09:45:00 · 801 阅读 · 0 评论 -
【人工智能之大模型】生成式语言模型的工作机理?
【人工智能之大模型】生成式语言模型的工作机理?原创 2025-03-30 13:30:00 · 2044 阅读 · 0 评论 -
【人工智能之大模型】说说你了解的大型语言模型中的有哪些分词技术?
【人工智能之大模型】说说你了解的大型语言模型中的有哪些分词技术?原创 2025-03-29 13:15:00 · 938 阅读 · 0 评论 -
【人工智能之大模型】ChatGPT的零样本和少样本学习的概念?
【人工智能之大模型】ChatGPT的零样本和少样本学习的概念?原创 2025-03-29 08:15:00 · 935 阅读 · 0 评论 -
【人工智能之大模型】如何减轻大语言模型LLM中的幻觉现象?
【人工智能之大模型】如何减轻大语言模型LLM中的幻觉现象?原创 2025-03-28 13:15:00 · 805 阅读 · 0 评论 -
【人工智能之大模型】大语言模型LLM中的因果语言建模和掩码语言建模有什么区别?
【人工智能之大模型】大语言模型LLM中的因果语言建模和掩码语言建模有什么区别?原创 2025-03-27 13:30:00 · 749 阅读 · 0 评论 -
【人工智能之大模型】哪些因素会导致大语言模型LLM的偏见?
【人工智能之大模型】哪些因素会导致大语言模型LLM的偏见?原创 2025-03-27 07:30:00 · 1486 阅读 · 0 评论 -
【人工智能之大模型】GPT系列(GPT-1 到 GPT-2 和 GPT-3(以及后续 GPT-4 的概念性改进))模型是如何演进的?(四)
【人工智能之大模型】GPT系列(GPT-1 到 GPT-2 和 GPT-3(以及后续 GPT-4 的概念性改进))模型是如何演进的?(四)原创 2025-03-25 13:30:00 · 998 阅读 · 1 评论 -
【人工智能之大模型】GPT系列(GPT-1 到 GPT-2 和 GPT-3(以及后续 GPT-4 的概念性改进))模型是如何演进的?(三)
【人工智能之大模型】GPT系列(GPT-1 到 GPT-2 和 GPT-3(以及后续 GPT-4 的概念性改进))模型是如何演进的?(三)原创 2025-03-25 07:30:00 · 929 阅读 · 0 评论 -
【人工智能之大模型】GPT系列(GPT-1 到 GPT-2 和 GPT-3(以及后续 GPT-4 的概念性改进))模型是如何演进的?(二)
【人工智能之大模型】GPT系列(GPT-1 到 GPT-2 和 GPT-3(以及后续 GPT-4 的概念性改进))模型是如何演进的?(二)原创 2025-03-24 13:30:00 · 1077 阅读 · 0 评论 -
【人工智能之大模型】GPT系列(GPT-1 到 GPT-2 和 GPT-3(以及后续 GPT-4 的概念性改进))模型是如何演进的?(一)
【人工智能之大模型】GPT系列(GPT-1 到 GPT-2 和 GPT-3(以及后续 GPT-4 的概念性改进))模型是如何演进的?(一)原创 2025-03-23 13:30:00 · 1055 阅读 · 1 评论 -
【人工智能之大模型】阐述生成式语言模型的工作机理...(二)
【人工智能之大模型】阐述生成式语言模型的工作机理...(二)原创 2025-03-21 13:15:00 · 930 阅读 · 0 评论 -
【人工智能之大模型】阐述生成式语言模型的工作机理...(一)
【人工智能之大模型】阐述生成式语言模型的工作机理...(一)原创 2025-03-21 07:15:00 · 573 阅读 · 0 评论 -
【人工智能之大模型】简述大模型GPT和BERT的区别...
【人工智能之大模型】简述大模型GPT和BERT的区别...原创 2025-03-20 13:15:00 · 726 阅读 · 0 评论 -
【人工智能之大模型】大模型的起源、发展、应用及未来前景...
【人工智能之大模型】大模型的起源、发展、应用及未来前景...原创 2025-03-19 13:15:00 · 1001 阅读 · 0 评论