
NLP
文章平均质量分 89
zcc_0015
业精于勤,荒于嬉
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
腾讯词向量使用
腾讯词向量腾讯词向量主页:https://ai.tencent.com/ailab/nlp/zh/embedding.html词向量下载地址:https://ai.tencent.com/ailab/nlp/zh/data/Tencent_AILab_ChineseEmbedding.tar.gz腾讯词向量(Tencent AI Lab Embedding Corpus for Chinese Words and Phrases)提供了预训练好的800万中文词汇的word embedding(20原创 2021-02-02 15:28:58 · 2984 阅读 · 0 评论 -
xlnet中传统transform失效的原因分析
xlnet中为了看到上下文信息,引入了PLM(排列组合的语言模型),即原始的x1,x2, x3, x4序列,通过排列组合可以分解出16种方式,可以认为预料变为了: x1,x3, x2,x4 x1,x3, x4,x2 等16种按标准的softmax的话,那么对于除了x1和x3之外的一个比如:词x4...原创 2019-10-16 21:01:25 · 935 阅读 · 0 评论 -
bert使用总结
1、bert的开源代码:https://github.com/google-research/bert2、bert的service接口:将bert封装成了clinet和service框架,通过客户端向服务器发起请求的方式使用https://github.com/hanxiao/bert-as-service/3、bert的简单使用https://github.com/Ins...原创 2019-01-09 20:20:49 · 1808 阅读 · 1 评论