
NLP
DrugAI
Fight Disease With Code ! Fight Disease With Data Technology !
药学、医学、化学和生物与计算机和AI交叉的爱好者从业者。
展开
-
Python自然语言处理 NLTK 库用法入门教程
NLP (Natural Language Processing):自然语言处理那么 NLP 到底是什么?学习 NLP 能带来什么好处?简单的说,自然语言处理( NLP )就是开发能够理解人类语言的应用程序和服务。我们生活中经常会接触的自然语言处理的应用,包括语音识别,...原创 2019-11-07 22:38:16 · 2371 阅读 · 0 评论 -
NLP(5) | 命名实体识别
NLP(1) | 词向量one hot编码词向量编码思想NLP(2) | 中文分词分词的概念分词方法分类CRFHMM分词NLP(3)| seq to seq 模型NLP(4) | 用词向量技术简单分析红楼梦人物关系用n-gramma生成词向量word2vect进行模型训练为什么需要实体识别普通的工具如hanlp,htp,不能识别特定领域的专有名词,所以需要实体识别的算法。下面就...转载 2019-10-25 22:00:50 · 1978 阅读 · 0 评论 -
NLP(4) | 用词向量技术简单分析红楼梦人物关系用n-gramma生成词向量word2vect进行模型训练
NLP(1) | 词向量one hot编码词向量编码思想NLP(2) | 中文分词分词的概念分词方法分类CRFHMM分词NLP(3)| seq to seq 模型前言:出于种种原因,总是不自觉把爱好和工作相互结合起来,每每感叹于曹雪芹构思的巧妙,语言的精炼,情节的感人……于是蹦出想法,看机器能否读懂“宝黛”之间的爱情。数据处理数据当然是伟大的《红楼梦》本身了,下载txt文件。...转载 2019-10-25 21:47:55 · 2628 阅读 · 1 评论 -
NLP(3)| seq to seq 模型
NLP(1) | 词向量one hot编码词向量编码思想NLP(2) | 中文分词分词的概念分词方法分类CRFHMM分词什么是Seq2Seq网络? 在Seq2Seq模型中采用了这种 Encoder-Decoder架构,其中 Encoder 是一个RNNCell(RNN ,GRU,LSTM 等) 结构,四层的LSTM结构使得能够提取足够多的特征,使得decode的模型变好 几种Seq2Se...转载 2019-10-25 21:16:42 · 2859 阅读 · 0 评论 -
NLP(2) | 中文分词分词的概念分词方法分类CRFHMM分词
NLP(1) | 词向量one hot编码词向量编码思想分词的概念 简单来说就是把词进行分开,分词的难点: 1.如何避免歧义,如:“白开水不如果汁甜”。如何让机器避免将“如果”分到一起。 2.如何识别未登录词,并判断词性(人物,地点) 解决歧义的方法有很多,使用n_gram模型或者概率统计在解决歧义的作用下很好实现,如下面要介绍的HMM和CRF.分词方法分类基于...转载 2019-10-25 21:01:34 · 1652 阅读 · 0 评论 -
NLP(1) | 词向量one hot编码词向量编码思想
词向量one hot编码词向量编码思想Word2VecEmbeddingSkip-gram的原理负采样前言:深度学习网络rnn能解决有序的问题,我们就生活在这样一个有序的世界。比如时间,音乐,说话的句子,甚至一场比赛,比如最近正在举办的俄罗斯世界杯。one hot编码我们在做分类任务的时候经常用到one hot编码,如果把自然语言中每个词当做一个...转载 2019-10-25 20:38:18 · 3581 阅读 · 0 评论