1 介绍一下 FFN 块计算公式?
2 介绍一下 GeLU 计算公式?
3 介绍一下 Swish 计算公式?
4 介绍一下 使用 GLU 线性门控单元的 FFN 块 计算公式?
5 介绍一下 使用 GeLU 的 GLU 块 计算公式?
6 介绍一下 使用 Swish 的 GLU 块 计算公式?
各LLMs 都使用哪种激活函数?
1 介绍一下 FFN 块计算公式?
2 介绍一下 GeLU 计算公式?
3 介绍一下 Swish 计算公式?
4 介绍一下 使用 GLU 线性门控单元的 FFN 块 计算公式?
5 介绍一下 使用 GeLU 的 GLU 块 计算公式?
6 介绍一下 使用 Swish 的 GLU 块 计算公式?
各LLMs 都使用哪种激活函数?