embedding模型有哪些?如何选择合适的embedding模型?

embedding模型是一种将数据映射到低维空间的模型,常用于自然语言处理、推荐系统、图像识别等领域。以下是一些常见的embedding模型:

  1. Word2Vec
    • CBOW(Continuous Bag-of-Words):通过上下文预测中心词。
    • Skip-Gram:通过中心词预测上下文。
  2. GloVe(Global Vectors for Word Representation):结合了词频统计和Word2Vec的优点,通过全局词频信息学习词向量。
  3. FastText
    • 利用子词信息,通过字符级别的n-gram来表示词。
  4. BERT(Bidirectional Encoder Representations from Transformers)
    • 利用Transformer的双向编码器,通过预训练来学习语言表示。
  5. Transformer:通过自注意力机制来学习序列数据的深层次表示。
  6. ELMO(Embeddings from Language Models):结合了浅层双向LSTM和预训练的词向量。
  7. Sentence-BERT(SBERT):为句子生成embedding,可以用于计算句子之间的相似度。
  8. Doc2Vec
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值