
创新研究
文章平均质量分 96
xsdjj
这个作者很懒,什么都没留下…
展开
-
文本分类——NLV算法研究与实现
内容提要1 引言2 NLV算法理论2.1 训练模型2.2 分类模型3 NLV算法实现3.1 算法描述4 实验及性能评估4.1 实验设计4.1.1 实验环境4.1.2 数据集4.1.3 实验目标4.1.4 关于预处理4.2 实验说明4.3 实验结果4.3.1 选参前提实验4.3.2 NLV分类实验4.3.3 分类对比实验5 分析总结1 引言 分类器的分类效率是衡量分类器性能的一项重要指标。为了...原创 2018-11-07 15:22:13 · 6437 阅读 · 1 评论 -
中文分词——知更鸟分词(RS)设计与实现
内容提要分词概述算法分类常见项目知更鸟分词实现算法描述数据结构代码实现运行结果分词概述 英文文本的处理相对简单,每一个单词之间有空格或标点符号隔开。如果不考虑短语,仅以单词作为唯一的语义单元的话,处理英文单词切分相对简单,只需要分类多有单词,去除标点符号。中文自然语言处理首先要解决的难题就是中文分词技术。 中文分词(Chinese Word Segmentation) 指的是将一个汉字序...原创 2018-11-05 23:56:06 · 1936 阅读 · 0 评论 -
特征选择——Matrix Projection算法研究与实现
内容提要引言MP特征选择思想MP特征选择算法MP特征选择分析实验结果分析总结引言 一般选择文本的词组作为分类器输入向量的特征语义单元,而作为单词或词语的词组,在任何一种语言中都有数万或数十万个。另外,对于Web文本检索应用来说,互联网每天可能都会产生各种各样的新词汇。这样文本分类问题就面临着特征向量的维数灾难问题。有许多理由要求必须将特征的数量减少到尽可能的小,其中时间和空间复杂度就是很重要...原创 2018-11-07 00:13:58 · 2141 阅读 · 0 评论 -
文本分类——快速kNN设计实现
内容提要介绍普通kNN实现快速kNN实现实验对比分析总结介绍 文本分类——常见分类模型 kNN分类模型的主要思想:通过给定一个未标注文档d,分类系统在训练集中查找与它距离最接近的k篇相邻(相似或相同)标注文档,然后根据这k篇邻近文档的分类标注来确定文档d的类别。普通kNN实现 一般常规的kNN计算新输入文档与训练集中样本之间的距离,都是新输入文档与每一训练集样本计算相似度。数据结构...原创 2018-11-07 18:56:21 · 5225 阅读 · 0 评论