word2vec 番外篇 1—— Skip-Gram 方法介绍

1. 一些定义

功能:

输入一个词,然后试着估计 其他词 出现在 该词附近 的概率。

gram 含义:

是一个有 n 个单词的组 (group),其中 n 是 gram 的窗口大小 (window size)。

例如:「The cat sat on the mat」这句话用 3 个 gram 表示的话,是「The cat sat」、「cat sat on」、「sat on the」、「on the mat」。

skip 含义:

指一个输入词 在不同的上下文词 的情况下,在数据集中 重复的次数

 

2. 预期功能

框架名称:

Word2Vec 上下文预测系统

预期测试结果:

输入:词「cat」

输出:预测的上下文(「the」,「sat」)

 

3.  训练过程

输入:

gram 

过程:

Word2Vec 系统将遍历所有 给出的 gram输入的单词,并尝试学习适当的 映射向量(嵌入)

 

4. 测试过程

输入:

给定输入单词,例如 词「cat」

输出:

预测的上下

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梦dancing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值