
自然语言处理
NLP理论与实践
一只干巴巴的海绵
这个作者很懒,什么都没留下…
展开
-
Python自然语言处理库 gensim核心概念
gensim 的核心概念包括:- Document:一些文本(text)。- Corpus:文档(documents)的集合。- Vector:文档(documents)的一种数学上方便的表示。- Model::一种将向量(Vector)从一种表示转换为另一种表示的算法。原创 2020-11-06 21:43:51 · 860 阅读 · 0 评论 -
scikit-learn文本特征提取:CountVectorizer与TfidfVectorizer
文本特征提取函数CountVectorizer、TfidfVectorizer参数详细原创 2020-07-26 19:38:35 · 934 阅读 · 0 评论 -
隐马尔可夫模型HMM
隐马尔可夫模型的基本概念 隐马尔可夫模型(hidden Markov model, HMM)是可用于标注问题的统计学习模型,描述由隐藏的马尔可夫链随机生成观测序列的过程,属于生成模型。隐马尔可夫模型的定义图结构文字描述 隐马尔可夫模型是关于时序的概率模型,描述了:由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列;再由各个状态生成一个观测而产生观测随机序列 的过程。数学定义I=(i1,i2,...,iT)I=(i_1,i_2,...,i_T)I=(i1,i2,...,iT原创 2020-05-09 23:13:17 · 365 阅读 · 1 评论 -
北大开源中文分词工具包 pkuseg
如何使用北大开源中文分词工具包 pkuseg;pkuseg特点:分词准确率高,多领域分词,支持用户自训练模型。pkuseg与jieba、THULAC等国内代表分词工具的比较。转载 2020-06-22 21:22:55 · 1498 阅读 · 0 评论 -
【吴恩达团队】TensorFlow2.0中的自然语言处理
如何使用TensorFlow2.0实现英文情感分析(IMDB影评情感分析、讽刺新闻分类)、文本生成。原创 2020-06-21 20:43:35 · 2034 阅读 · 0 评论 -
自然语言处理概述
自然语言处理自然语言理解自然语言生成语料预处理中文语料预处理英文语料预处理词干提取与词形还原比较原创 2020-06-20 14:29:54 · 299 阅读 · 0 评论 -
【NLP-CS224N2019】NLP简介与词向量
B站课程2017B站课程2019课程主页课程资料原创 2020-04-20 21:11:48 · 352 阅读 · 0 评论 -
jieba分词库的安装与使用
Anaconda安装jiebaGitHub: jieba方式一:直接在Anaconda Prompt输入:conda install -c conda-forge jieba。方式二:1.下载jieba压缩包:jieba2. 将压缩包解压到anaconda下的pkgs目录下,3. 进入pkgs目录下的jieba-0.39(或其他版本),打开命令行窗口(shift+右键),输入pyth...原创 2020-03-16 10:06:45 · 3088 阅读 · 0 评论 -
LDA主题模型
主题模型 主题模型(topic model)是以非监督学习的方式对文集 的隐含语义结构(latent semantic structure) 进行聚类(clustering) 的统计模型。 主题模型主要被用于自然语言处理(Natural language processing)中的语义分析(semantic analysis)和文本挖掘(text mining)问题,例如按主题对文本进行收...原创 2020-03-20 13:52:00 · 1826 阅读 · 0 评论 -
【NLP】词向量模型(word2vec)
转载 2020-04-03 09:53:33 · 278 阅读 · 0 评论