mahout 简介

ApacheMahout起源于2008年,最初为ApacheLucene的子项目,并于2010年成为顶级项目。其主要目标是创建适用于大规模数据集的可扩展机器学习算法。这些算法可以在ApacheHadoop平台上通过MapReduce模式执行,同时也支持单节点或非Hadoop环境。Mahout提供了包括聚类、分类、推荐引擎和频繁项集挖掘在内的多种功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Apache Mahout起源于2008年,当时它是Apache Lucene的子项目。使用Hadoop库,可以将其功能有效地扩展到Apache Hadoop云平台中。2010年4月Apache mahout最终成了Apache的顶级项目。
Apache Mahout的主要目标是建立可伸缩的机器学习算法。这种可伸缩性是针对大规模的数据集而言的。Apache Mahout的算法运行在Apache Hadoop平台下,它通过MapReduce模式实现。但是,Apache Mahout并不严格要求算法的实现要基于Hadoop平台,单个节点或非Hadoop平台也可以。
Apache Mahout核心库的非分存式算法也具有良好的性能。
Apache Mahout 项目包含聚类、分类、推荐引擎、频繁项集的挖掘。
聚类:将诸如文本、文档 之类的数据分成局部相关的组;
分类:利用已经存在的分类法文档训练分类器,对未分类的文档 进行分类;
推荐引擎(协同过滤):获得用户的行为并从中发现用户可能喜欢的事物
频繁项集的挖掘:利用一个项集(查询记录或购物目录)去识别经常一起出现的项目。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值