大模型面试-Layer normalization篇

1. Layer Norm 的计算公式写一下?

2. RMS Norm 的计算公式写一下?

3. RMS Norm 相比于 Layer Norm 有什么特点?

4. Deep Norm 思路?

5. 写一下 Deep Norm 代码实现?

6.Deep Norm 有什么优点?

7.LN 在 LLMs 中的不同位置 有什么区别么?如果有,能介绍一下区别么?

8. LLMs 各模型分别用了 哪种 Layer normalization?

 

一、 Layer Norm
1.1 Layer Norm 的计算公式写一下?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值