
词向量
文章平均质量分 92
wuyijian_ml
这个作者很懒,什么都没留下…
展开
-
word2vec(嵌入空间)
1 word2vec本文会通过 图书馆 图书排布的例子引入词的表征,继而通过最小化借书成本过渡到skip-gram的模型,阐述word2vec训练和最小化信息熵的关联词表征? 词嵌入 ? 词向量 ? word2vec ?词表征是比较宽泛的概念,词可以通过各种方式来表征,比如one-hot 比如 词嵌入 等等 词嵌入特指由神经网络模型得到的低维实数向量表示 word2vec 用来训...原创 2019-01-15 20:25:13 · 3217 阅读 · 1 评论 -
文本信息过滤中的变体词识别(一)
文本过滤中的变体词识别(一)变体词识别概述最近在搞文本过滤的一些工作,看了一些变体词识别的内容,分三篇文章做一些总结: 先来一个严谨的定义: 网络书写具有随意性、非正规性等特点。变体词就是网络语言作为一种不规范语言的显著特色, 人们往往出于避免审查、表达情感、讽刺、娱乐等需求将相对严肃、规范、敏感的词用相对不规范、不敏感的词来代替, 用来代替原来词的新词就叫做 变体词(Morph) 。...原创 2018-08-19 13:32:35 · 6187 阅读 · 9 评论