关于 句子向量 和 词向量 的想法

本文探讨了句子级别和字符级别在自然语言处理中的差异,指出句子级别向量可能包含更多语义信息。SentenceBERT通过meanpooling和双塔网络结构,利用预训练的BERT模型,优化得到更能表达句子语义相似度的向量。实验表明,这种新方法在句子相似度表示上优于传统策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Motivation:

在很多地方都在讨论,句子级别和字符级别。
这两者,在实际操作中到底有什么区别呢?

通常来说,句子级别是[CLS] 或者 字符级向量的avg max等等。或者说是一些特殊的组合。
那这些向量到底有什么区别以及会带来多少信息上的不同。

从本人角度来看,我更想知道的是,句子的向量是不是比字符的embedding有更多的句子层次的信息。虽然,暂时没有见到相关的讨论,但也有很多文章对该问题进行了说明。

Sentence bert

在这里插入图片描述
主要做的事情:

  1. 实验说明了mean pooling的效果比较好,比CLS和MAX策略要好。
  2. 在mean pooling的基础上,作者用基于已经预训练好的bert模型的孪生网络,去训练一个,新的 句子级别的向量,为什么这么做呢?因为,重新设计的这个网络,通过新的loss:句子相似度,来让这里得到的句子级别的 向量,能更好的表示句子级别的语义相似度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值