fastnlp-知识汇总

no_create_entry参数用于指定当集合中的词不在预训练embedding中时的行为,可以设置为随机初始化或忽略。该参数对于dev集和test集尤其重要,因为如果训练集中未出现的词在测试集中出现,微调可以改善模型对这些词的理解。文章指出,如果test或dev集独有的词在预训练中不存在,将按设定方式处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

no_create_entry参数的作用

建议使用的dev集和test集可以设这个参数。这个参数的作用是指定某个集合中的词如果没出现在预训练 embedding 中,会随机 embedding 还是设为 。
https://www.cnblogs.com/TABball/p/12727326.html
这个博客写的很好,举了例子。
不过有一个笔误:
原文:“这样做的好处在于一些词没有在与训练的 embedding 中,但是在test集中出现,我们通过 finetune 可以提高对这个词的理解。若test集或dev集中有这个词,可以达到更好的训练效果。如果test或dev集有只在这两个集合中出现,且没有在预训练出现的词,则按照处理。”
问题:“但是在test集中出现”
修改:“但是在train集中出现”

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值