Word2Vec的相关知识

本文介绍了Word2Vec的基础知识,包括统计语言模型、n-gram模型、sigmoid函数和逻辑回归等内容,为理解Word2Vec的工作原理提供了必要的背景知识。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Word2Vec的相关知识

1.预备知识

1.1 统计语言模型

统计语言模型是用来计算一个句子的概率的概率模型,通常是基于一个语料库来构建的。而一个句子的概率可以用一下的公式来表示:

p(W)=p(wT1)=p(w1,w2,,wT) (1.1)

其中,W=wT1:=(w1,w2,...,wT),表示由T个词w1,w2,...,wT按顺序构成的一个句子。公式(1.1)可以使用链式法则分解为:

p(wT1)=p(w1)p(w2|w1)p(w3|w21)p(wT|wT11) (1.2)

1.2 n-gram 模型

首先假设,与它前面的所有词都相关,那么我们有:

p(wk|wk11)=p(wk1)p(wk11) (1.3)

那么,根据大数定律,也就是在语料库足够大的情况下,我们有:

p(wk|wk11)=count(wk1)count(wk11) (1.4)

其中,count(wk1)表示句子wk1在语料中出现的次数,count(wk11)表示句子wk11在语料中出现的次数。

如果计算所有的词,那么计算量将会非常的大,因此使用n元模型。它就是一个词出现的概率与它的前面的n1个词都相关。那么可以得到:

p(wk|wk11)p(wk|wk1kn+1)

因此得到如下公式:

p(wk|wk11)count(wkkn+1)count(wk1kn+1)

n一般取5

1.3 sigmoid函数

​ sigmoid函数是神经网络中的激活函数之一,在不同的阈值下会有不同的输出结果。其定义为:

σ(x)=11+ex

该函数的定义域为:(,+),值域为(0,1).

https://upload.wikimedia.org/wikipedia/commons/thumb/2/2f/Error_Function.svg/600px-Error_Function.svg.png‘/ width=’400’>

​ 图1 sigmoid函数的图像

sigmoid的导函数有一下形式:

σ(x)=σ(x)[1σ(x)]

由此可得到,函数logσ(x)log(1σ(x))的导函数分别为:

[logσ(x)]=1σ(x), [log(1σ(x))]=σ(x)

1.4 逻辑回归

​ 用于解决二分类问题,对样本数据{(Xi,yi)}mi=1为一个而分类问题的样本数据,其中XiRn,yi{0,1},当yi=1时,称对应的样本Xi为正例,反之为负例。

未完待续

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值