seq2seq 的 output_projection 参数

output_projection参数在Sequence-to-Sequence Models中用于处理大规模输出词汇表的问题。通过返回较小的输出张量并利用output_projection进行投影,避免了直接存储大张量的不必要消耗。sampled softmax与output projection结合,可以更有效地处理大型输出词汇,并在训练时减少计算资源的需求。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

转载请注明出处: https://blog.youkuaiyun.com/qq_33427047/article/details/81320098


Sequence-to-Sequence Models中会有一个 output_projection 参数,它是什么意思呢?

以 embedding_attention_seq2seq() 函数为例:

def embedding_attention_seq2seq(encoder_inputs,
                                  decoder_inputs,
                                  cell,
                                  num_encoder_symbols,
                                  num_decoder_symbols,
                                  embedding_size,
                                  num_heads=1,
                                  output_projection=None,
                                  feed_previous=False,
                                  dtype
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值