GolVe学习笔记

GolVe的损失函数?

解释GolVe的损失函数?

其实,一句话解释就是想构造一个向量表征方式,使得向量的点击和共现矩阵中的对应关系一致。因为共现矩阵中的对应关系证明了,存在i,k,j三个不同的文本,如果i和k相关,j和k相关,那么p(i,j)=p(j,k)近似于1,其他情况都过大和过小。

为什么GolVe会用的相对比W2V少?

  • GloVe算法本身使用了全局信息,自然内存费的也就多一些
    • 公现矩阵,NXN的,N为词袋量
  • W2V的工程实现结果相对来说支持的更多,比如most_similarty等功能

如何处理未出现词?

按照词性进行已知词替换,[unknow-n],[unknow-a],[unknow-v]…,然后再进行训练。实际去用的时候,判断词性后直接使用对应的unknown-?向量替代

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值