Mahout0.6-PrepareTwentyNewsgroups bug修复

解决Mahout 0.6 版本中PrepareTwentyNewsgroups命令执行时报错问题,通过对比Mahout 0.5 版本的代码差异,提出两种修复方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

PrepareTwentyNewsgroups(Mahout0.6)

在第三部分的1.1.2中执行如下命令对20Newsgroups预处理

$MAHOUT0P6_HOME/bin/mahoutprepare20newsgroups –p 20_newsgroups -o 20news-train -aorg.apache.lucene.analysis.standard.StandardAnalyzer -c UTF-8

会报出无法找到org.apache.lucene.analysis.standard.StandardAnalyzer类的错误,而在Mahout0.5中可以正常执行,对照0.6版本和0.5版本查找差异,发现代码如下

Mahout0.5中为:

Analyzer analyzer;

      try {

        analyzer =Class.forName(analyzerName).asSubclass(Analyzer.class).newInstance();

      } catch(InstantiationException e) {

        analyzer =(Analyzer)Class.forName(analyzerName).getConstructor(Version.class).newInstance(Version.LUCENE_30);

      }

Mahout0.6中为:

Analyzer analyzer analyzer = ClassUtils.instantiateAs(analyzerName, Analyzer.class);

修改方法为:

1)将Mahout0.6中代码改为如下,重新打包

      try{

      analyzer = ClassUtils.instantiateAs(analyzerName,Analyzer.class);

      }catch(InstantiationException e){

      analyzer = (Analyzer) Class.forName(analyzerName).getConstructor(Version.class).newInstance(Version.LUCENE_30);

      }

2)将Mahout0.6中的PrepareTwentyNewsgroups的class文件拷贝到Mahout0.6中覆盖相应文件。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值