Spark
文章平均质量分 86
zchenack
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spark安装搭建与使用
Spark安装搭建与使用Spark安装搭建与使用Spark简介Spark框架Spark常见API功能Spark RDDSpark下载与安装Spark windows集成开发环境搭建利用Spark调用Ansj进行中文分词Spark简介Apache Spark是一个开源分布式的数据处理平台,支持集群进行数据处理。类似于hadoop,却又能提供灵活的编程接口(而不是map和reduce过程)原创 2017-10-28 15:31:40 · 1116 阅读 · 0 评论 -
Spark中文文本聚类
Spark文本聚类Spark文本聚类Spark mlib简介中文文本分词TFIDF特征word2vec介绍文本表示Kmeans LDA聚类聚类是常见的无监督学习算法,用于找到相似的Item,在无标记数据的情况下经常使用。这里考虑,当我们拥有大量文本,需要找到相似的文本(粗分类)时,使用Spark进行实验。Spark mlib简介mlib是Spark提供的机器学习算法库,提供特征工程、分类原创 2017-11-17 20:21:33 · 3275 阅读 · 0 评论 -
ubuntu搭建Hadoop-2.2.0(单机)
对于Hadoop的搭建,需要事先安装Java 与 SSH原创 2014-06-05 16:55:20 · 531 阅读 · 0 评论
分享