XX2Vec算法汇总

XX2Vec是一系列基于word2vec的算法,包括Char2Vec、Word2Vec、GloVe、Doc2Vec、Image2Vec和Video2Vec。它们为不同类型的输入分配向量,例如Char2Vec对字符敏感,适用于处理拼写错误;Word2Vec是高效的非监督学习算法;GloVe通过数学方法获取单词嵌入;Doc2Vec结合word2Vec进行监督学习,适用于文档分类;Image2Vec和Video2Vec则分别处理图像和视频数据,提供多维度的表示。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

XX2Vec算法汇总

转载请注明!

XX2VecEmbedInSup/UnsupAlgorithms used
Char2VecCharacterSentenceUnsupervisedCNN -> LSTM
Word2VecWordSentenceUnsupervisedANN
GloVeWordSentenceUnsupervisedSGD
Doc2VecParagraph VectorDocumentSupervisedANN -> Logistic Regression
Image2VecImage ElementsImageUnsupervisedDNN
Video2VecVideo ElementsVideoSupervisedCNN -> MLP

强大的word2vec算法激发了许多其他的算法,李在上表中。(对于word2vec的说明,参阅2015Spark峰会我的演讲.)word2vec是对单词分配向量的便捷方式,而且响亮是机器学习的货币。一旦你向量化你的数据,你可以自由应用任何机器学习算法。
word2vec能够通过嵌入的概念关联到向量。在语料库中,一个单词出现在周围单词的上下文,word2vec使用这些同现推断单词间的关系。
所有列在上表的XX2vec算法为X分配向量,X是嵌入在大文本Y中。
但是相似之处到此为止。每个XX2vec算法不仅有专有适合领域,而且使用情形也是不一样的。例如,Doc2Vec是监督学习,其他大多数是非监督学习。Doc2Vec的目标是能够标记文档,word2vec和其他XX2vec算法的目的只是分裂出向量,用于你下一步机器学习和分析。
下面是每个XX2vec算法的简要说明。

Char2Vec

Char2Vec运行于字符集,对拼写错误更加宽容,因此可以更好的分析tweets,用户产品评价等等。

Word2Vec

如上所述。还有一点是:它是不合理有效算法之一。如果你愿意可以碰碰运气。

GloVe

关于将单词嵌入一些数学中,而不是从神经网络中抽取权重并盼望其工作,已经取得了一些成就。GloVe目前是这方面的旗手。模型从一开始支持寻找类似,而不是仅仅在word2vec中碰运气。

Doc2Vec

实际上,Doc2Vec使用word2Vec作为第一步。然后从有利于Word2Vec的单词向量中对每个句子或段落生成复合向量。复合对段落或句子给出总体背景的某种形式,然后复合向量作为额外单词插入到句子或段落开始。段落向量和单词向量使用文档的人工标签,一起训练监督学习分类器。

Image2Vec

word2vec有意使用一个浅神经网络,Image2Vec使用一个深层神经网络,组合从网络多层的权重所得的结果向量。图像袁术可能由这些权重代表,包括图像片段(草,鸟,篱笆等等),或整体图像质量,比如颜色。

Video2Vec

如果图片的机器学习包含高维度,那么视频包含更高的维度。Video2Vec首先通过卷积神经网络做一些初步降维。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值