本文精心汇总了多家顶尖互联网公司在大模型基础知识考核中的核心考点,并针对这些考点提供了详尽的解答。并提供电子版本,见于文末百度云盘链接中,供读者查阅。
大模型(LLMs)基础面
1. 目前 主流的开源模型体系 有哪些?
2. prefix Decoder 和 causal Decoder 和 Encoder-Decoder 区别是什么?
3. 大模型LLM的 训练目标 是什么?
4. 涌现能力是啥原因?
5. 为何现在的大模型大部分是Decoder only结构?
6. 简单 介绍一下 大模型【LLMs】?
7. 大模型【LLMs】后面跟的 175B、60B、540B等 指什么?
8. 大模型【LLMs】具有什么优点?
9. 大模型【LLMs】具有什么缺点?
Layer normalization篇
• Layer normalization-方法篇
- Layer Norm 的计算公式写一下?</