自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 一点思考:RNN中为什么要将每次采样的小批量数据形状由(批量大小, 时间步数)转置成(时间步数, 批量大小)

下面是我的一点理解,作为抛砖引玉:假如不做T转置,进行独热后的三阶张量是( 批量大小, 时间步数,词表大小),当将其作为input输入网络时,由于RNN的时序特性(不做赘述),必须按照步数从0依次到4,也就是5个时间步。上图是一个具体的例子,其中batch_size=2,t=5,vocab=28。第二行代码将(2,5)的二阶张量先打个转置(T),然后再用独热函数将X.T变为三阶张量,即(时间步数, 批量大小, 词表大小),那么为什么要这么做呢?而且显存大多是行优先存储,对张量的取数速度会比转置后的慢一些。

2024-07-05 18:22:48 188

原创 概率论与数理统计学习笔记

我的理解是:表示沿着X=x切开密度面后,沿着y轴对留下的剖线进行积分,积分的结果即是剖线与y轴围成的面积。X的边缘概率密度函数。

2024-02-09 12:16:18 238 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除