
数据结构
文章平均质量分 96
xsdjj
这个作者很懒,什么都没留下…
展开
-
文本分类——快速kNN设计实现
内容提要介绍普通kNN实现快速kNN实现实验对比分析总结 介绍 文本分类——常见分类模型 kNN分类模型的主要思想:通过给定一个未标注文档d,分类系统在训练集中查找与它距离最接近的k篇相邻(相似或相同)标注文档,然后根据这k篇邻近文档的分类标注来确定文档d的类别。 普通kNN实现 一般常规的kNN计算新输入文档与训练集中样本之间的距离,都是新输入文档与每一训练集样本计算相似度。数据结构...原创 2018-11-07 18:56:21 · 5225 阅读 · 0 评论 -
中文分词——知更鸟分词(RS)设计与实现
内容提要分词概述算法分类常见项目知更鸟分词实现算法描述数据结构代码实现运行结果 分词概述 英文文本的处理相对简单,每一个单词之间有空格或标点符号隔开。如果不考虑短语,仅以单词作为唯一的语义单元的话,处理英文单词切分相对简单,只需要分类多有单词,去除标点符号。中文自然语言处理首先要解决的难题就是中文分词技术。 中文分词(Chinese Word Segmentation) 指的是将一个汉字序...原创 2018-11-05 23:56:06 · 1936 阅读 · 0 评论