
NLP
y430
这个作者很懒,什么都没留下…
展开
-
NLP资源整理
参考资料:https://blog.youkuaiyun.com/antkillerfarm/article/details/78082564https://mp.weixin.qq.com/s/WaHv9w8BaZdwbR1gMMPAqg 揭开知识库问答KB-QA的面纱(知识图谱方面的系列专栏)https://zhuanlan.zhihu.com/kb-qa CIPS ATT 2...转载 2018-08-01 08:57:41 · 369 阅读 · 0 评论 -
windows安装fasttext
下载https://www.lfd.uci.edu/~gohlke/pythonlibs/#fasttext安装cmd进入该whl文件所在的文件夹下,输入命令进行安装:pip install fasttext-0.8.22-cp36-cp36m-win_amd64.whl测试是否安装成功未报错,说明已安装成功。注意:导入的时候是fastText而不是fastte...原创 2019-03-13 15:56:31 · 5154 阅读 · 0 评论 -
【NLP实践-Task6 简单神经网络】文本表示&fasttext
目录文本表示one-hot介绍one-hot在提取文本特征上的应用优缺点分析sklearn实现one hot encodeword2vecCBOW模型的理解CBOW模型流程举例fasttextfasttext介绍应用场景优点原理fasttext与word2vec对比fasttext文本分类实战参考文本表示one-hot介绍...原创 2019-03-13 16:27:36 · 553 阅读 · 0 评论 -
【NLP实践-Task8 循环神经网络】LSTM详解 & Text-RNN文本分类 & RCNN原理
目录RNN基础循环神经网络(Recurrent Neural Networks)RNN的训练方法——BPTT算法(back-propagation through time)长期依赖(Long-Term Dependencies)问题LSTM(long short-term memory)LSTM 的核心思想逐步理解 LSTMLSTM 的变体GRU(Gated ...原创 2019-03-17 09:33:12 · 8086 阅读 · 1 评论 -
【NLP实践-Task10 BERT】Transformer & BERT
目录Transformer原理Transformer总体结构Self-AttentionMulti-Headed AttentionPositional EncodingLayer normalizationDecoder层MaskPadding MaskSequence mask输出层BERT的原理1. Masked LM (MLM)2. ...原创 2019-03-23 01:11:19 · 1846 阅读 · 1 评论 -
【NLP实践-Task2 特征提取】文本处理&语言模型&文本矩阵化
目录基本文本处理技能分词的概念正向最大匹配法逆向最大匹配法双向最大匹配法词、字符频率统计语言模型语言模型中unigram、bigram、trigram的概念文本矩阵化分词新词识别自定义词典关键词提取去除停用词构造词表文档向量化参考基本文本处理技能 目前有三大主流分词方法:基于字符串匹配的分词方法、基于理解的分词...原创 2019-03-05 19:04:54 · 1273 阅读 · 0 评论 -
【NLP实践-Task3 特征选择】TF-IDF&互信息
目录TF-IDF原理TF-IDF代码方法1:使用TfidfTransformer方法2:使用TfidfVectorizer(推荐)互信息的原理点互信息PMI互信息MI对特征矩阵使用互信息进行特征筛选sklearn.metrics.mutual_info_scoresklearn.feature_selection.mutual_info_classif参...原创 2019-03-07 11:56:25 · 1870 阅读 · 0 评论 -
【NLP实践-Task4 传统机器学习】朴素贝叶斯 & SVM & LDA文本分类
目录朴素贝叶斯原理公式朴素贝叶斯的优点朴素贝叶斯的缺点利用朴素贝叶斯进行文本分类SVM简介利用SVM模型进行文本分类文本特征提取文本特征表示归一化处理文本分类pLSA、共轭先验分布、LDA简介主题模型简介pLSA共轭先验分布定义及公式LDALDA介绍LDA生成过程LDA整体流程LDA文本分类获取训练矩阵和单词...原创 2019-03-08 14:09:13 · 1622 阅读 · 1 评论 -
【NLP实践-Task9 Attention原理 】attention & HAN & 文本分类实战
目录Attention原理背景Encoder-Decoder框架Soft Attention模型Attention机制的本质思想Self Attention模型Attention机制的应用HAN的原理(Hierarchical Attention Networks)Attention文本分类实战训练结果参考Attention原理背景 ...原创 2019-03-19 12:42:56 · 1404 阅读 · 0 评论