
数据挖掘
文章平均质量分 74
冰水比水冰
我是码农,却假装是程序员。
展开
-
在Eclipse中安装StatET插件
在Eclipse中安装StatET插件1.概述众所周知,很多人进行数据挖掘最喜欢使用的语言是R语言,而可以选择的IDE确有很多种,例如Emacs + ESS,RStudio等等。今天,我所写的是使用Eclipse + StatET来搭建R语言环境。2.安装Eclipse我使用的是Ubuntu13.10的系统,在 http://download.ec原创 2014-07-27 14:39:33 · 6006 阅读 · 0 评论 -
使用ICTCLAS2015进行分词
使用ICTCLAS2015进行分词 在今年的Imagine Cup中使用到了语义分析的部分,其中需要分词作为基础,我是用的是中科院的ICTCLA2015,本篇博客我来讲讲如何使用ICTCLAS2015进行分词ICTCLAS2015简介中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Co原创 2015-03-24 07:41:59 · 7474 阅读 · 0 评论 -
KNN 在手写识别中的应用(Java 实现)
这篇博文主要介绍了一种基于机器学习的分类方法,K-邻近(KNN),并且使用这种方法来完成了一个简单的手写数字识别系统。KNN 概述什么是 KNNKNN(K–nearest-neighbor),即 K-邻近算法, 所谓 K 邻近,就是 K 个最近邻居的意思,说的是每个样本都可以用与它最接近的K 个邻居来表示。工作原理存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样原创 2015-09-07 15:48:24 · 5645 阅读 · 0 评论