torch.multinomial使用

本文深入探讨了Word2vec模型中非相关数据降采样方法的应用,重点介绍了torch.multinomial函数的工作原理及参数设置,包括输入张量、采样数量和是否允许重复采样。通过实例分析,揭示了权重对采样结果的影响,以及在特定条件下可能出现的错误。

在Word2vec中使用到了非相关数据的降采样方法, 其中用到了torch.multinomial方法, 这里记录一下:

multinomial(input, num_samples, replacement=False)

该方法主要有三个参数, 分别是输入的张量, 采样的个数, 是否有重复的数据, 采样的时候是根据输入张量的数值当做权重来进行抽样的, 数值越大, 抽到的可能性越大, 越小抽到的可能性越小, 如果是0 则不会抽到

由案例可知, 输出的是出入的张量的索引值,

当非零数据只有4个时, 要输出5个不重复的数据会报错

而可以重复数据时, 即使去很多值, 也不会取到, 索引值为0的, 因为其权重是0

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值