
自然语言处理
文章平均质量分 97
linxid
现阿里巴巴算法工程师,原华为诺亚方舟实验室高级算法工程师,专注人工智能算法研究
展开
-
NLP预训练模型-Transformer:从原理到实战
[1]AllenNLP 使用教程[[2]]原创 2019-01-18 08:47:54 · 7342 阅读 · 5 评论 -
paper list
2019年1月:原创 2019-02-01 15:40:50 · 1388 阅读 · 0 评论 -
Kaggle-Quora Insincere Questions Classification-Solution
Quora Insincere Questions Classification寒假期间参加了Kaggle的一个比赛-QIQC,作为第一个认真参加的Kaggle比赛,最后这个结果实属幸运,感谢啸宇哥和 W^2e的帮助,现在简单记录下比赛中学到的东西。1. 数据预处理数据预处理是这类任务非常重要的一个环节。由于数据是直接爬取,所以数据是非常脏的,首先就要进行数据预处理。数据预处理的另一个作用就...原创 2019-02-15 20:05:19 · 1686 阅读 · 0 评论 -
词向量之word2vec及Tensorflow实现
Word2Vec已经几乎成为NLP任务中,肯定会用到的模型,当然现在我们有了更新的Elmo和Bert,但是Word2Vec作为基本的词向量,仍然需要弄明白。1. 词的Onehot表示:当我们处理文本的时候,我们首先需要将这些文本进行表示,以前大家常用的就是onehot编码。首先对整个文档建立一个字典,每个字/词和索引一一对应。对于文档中的一句话,比如,“可爱的你喜欢吃面包。”。我们就可以根据词...原创 2019-03-13 22:53:24 · 1559 阅读 · 0 评论