Mallet 是专门用于机器学习方面的软件包,此软件包基于 java 。通过 mallet 工具,可以进行自然语言处理,文本分类,主题建模。文本聚类,信息抽取等。下面是从如何配置 mallet 环境到如何使用 mallet 进行介绍。
一. 实验环境配置
1. 下载并安装 JDK ,并正确设置环境变量
在我的电脑-右键属性-高级-环境变量-用户变量中需设置三个环境变量:
? JAVA_HOME : 该环境变量的值就是 Java 所在的目录,
例如 C:/Program Files/Java/jdk1.6.0_10
PATH : 指定一个路径列表,用于搜索可执行文件。
该环境变量值为: %JAVA_HOME%/bin
CLASSPATH : 指定一个路径列表,是用于搜索 Java 编译或者运行时需要用到的类。
该环境变量的值为: %JAVA_HOME%/lib/tools.jar ; %JAVA_HOME%/lib/dt.jar
测试:开始-运行输入cmd进入控制台
分别输入 javac 和 java ,没有出错则表示配置成功。 注意:每次配置后都需要关闭控制台重新打开。
2. 下载 apache-ant ,不需安装,只需正确设置环境变量。 apache-ant 是一个基于 Java 的编译工具。
下载 http://ant.apache.org/bindownload.cgi ,解压 放到你要的目录
配置环境变量
ANT_HOME :设置为 apache-ant 的解压目录,例如: C:/server/apache-ant-1.8.0
classpath : %ANT_HOME%/lib
Path : %ANT_HOME%/bin
测试:运行cmd
输入 ant ,结果如下则表示配置成功
Buildfile : build.xml does not exist!
Build failed
3 .下载 mallet 最新版本 mallet-2.0.6,地址: http://mallet.cs.umass.edu/download.php
配置环境变量:
? MALLET_HOME=MALLET的解压目录,例如C:/mallet
? Path中添加 %MALLET_HOME%/bin
? classpath:%mallet_home%/class;%mallet_home%/lib;%mallet_home%/lib/mallet-deps.jar
? 测试:运行cmd ,用 [cd 文件夹] 命令将控制台的原有目录进入到 mallet 的解压目录
? 输入 ant
如果出现 Build successful 字样,则表示配置成功
参考资料:http://blog.youkuaiyun.com/xianggelilaling/archive/2010/05/30/5634815.aspx
Mallet安装和配置
最新推荐文章于 2024-05-26 09:59:41 发布