自然语言处理
文章平均质量分 87
walkeao
What you can not create, you do not understand !
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数学之美~阅读
数学之美目录 数学之美目录统计语言模型谈谈中文分词隐马尔科夫在语言处理中的应用怎样度量信息布尔代数和搜索引擎的索引图论和网络爬虫信息论在信息处理中的应用贾里尼克的故事和现代语言处理如何确定网页和查询的相关性有限状态机和地址识别Google的阿卡47制造者阿米特辛格博士余弦定理和新闻分类信息指纹及其应用谈谈数学模型的重要性繁与简 自然语言处理的几位精英不要把所有的原创 2017-12-15 18:29:02 · 3444 阅读 · 1 评论 -
Word2Vec
Word2Vec-01Word2Vec-01Skip-gram模型模型介绍层级softmax负采样subsample参考文献Skip-gram模型模型介绍 给定词序列w1,w2,...,wi−c,...,wi−1,wi,wi+1...,wi+c,...,wTw_1,w_2,...,w_{i-c},...,w_{i-1},w_i,w_{i+1}...,w_{i+c},...,w_T:sk原创 2018-01-03 09:50:45 · 848 阅读 · 0 评论 -
Doc2Vec模型介绍及使用
Doc2Vec模型Doc2Vec模型摘要背景段落向量PV-DM模型PV-DBOW模型gensim实现Doc2Vec说明参考文献摘要通过本文,你将了解到:Doc2Vec模型是如何产生的Doc2Vec模型细节Doc2Vec模型的特点Doc2Vec的使用及代码(gensim)背景 Doc2Vec模型的产生要从词向量表示(论文word2vec模型)开始说起,该文章介绍了两种词的向原创 2018-01-07 16:35:31 · 15519 阅读 · 0 评论 -
Sentence2Vec模型介绍
Sentence2VecSentence2Vec前言算法介绍参考文献前言 本文是对论文A Simple but Tough-to-Beat Baseline for Sentence Embeddings中算法的简要描述,具体细节请参考代码实现。算法介绍 1. 对一个句子中所有词的词向量进行加权平均,每个词向量的权重可以表示为aa+p(w)\frac{a}{a+p(w)},其中aa为参数,原创 2018-01-04 20:03:56 · 12907 阅读 · 5 评论
分享