solr mmseg4j linux,solr4.5安装配置 linux+tomcat6.0+mmseg4j-1.9.1分词

本文详细指导了如何在JDK1.6和Tomcat6环境中安装Solr 4.5.0,包括solr.war部署、示例文件夹配置、Solr_home设置,以及MMSEG4J的集成过程,包括分词器的配置和词库管理。适合初学者快速上手。

首先先介绍下solr的安装配置

(我这用的solr-4.5.0)

运行环境

JDK 1.5或更高版本 下载地址(Solr 4以上版本,要求JDK1.6)  我用的JDK1.6 )

一个java servlet容器,如Tomcat 下载地址 (我用的Tomcat 6,注:JDK1.7 跟Tomcat 7貌似有兼容性问题,记于 2013.12.12)

分词mmseg4j 下载地址 (我用的1.9)

为防止大家各种目录搞混,安装前先告诉大家我自己所创建使用的目录

整个运行环境我创建了四个目录,分别用于

1、solr源码保存,位于/down/solr

2、solr web运行环境,位于/usr/local/tomcat/webapps

3、solr 实例运行环境,位于/usr/local/solr

4、jdk,位于/usr/java/jdk1.6.0_13

接下来的各种配置,将以此目录进行说明。

安装步骤(这里以jdk1.6 tomcat6.0 为例,他们的安装方式不属于此文的讲解范围)

停止的servlet容器

从下载的solr包中复制solr.war到你的servlet容器的webapps目录

cp /down/solr/example/webapps/solr.war /usr/local/tomcat/webapps/solr

从下载的solr包中复制示例Solr的文件夹到您的solr实例环境。

cp /down/solr/example/solr /usr/local/solr

打开 etv/profile 文件,添加如下配置,请修改为你的jdk安装目录:

fb8048b92084d92c1d3bc9b22473e185.png

export JAVA_HOME=/usr/java/jdk1.6.0_13

export JAVA_BIN=/usr/java/jdk1.6.0_13/bin

export PATH=$PATH:$JAVA_HOME/bin

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export JAVA_HOME JAVA_BIN PATH CLASSPATH

fb8048b92084d92c1d3bc9b22473e185.png

设置你的solr_home目录,也就是前面所述“solr 实例运行环境"所在目录  /usr/local/solr,打开以下文件,修改solr_home目录

vi /usr/local/tomcat/webapps/solr/WEB-INF/web.xml

找到如下配置,取消注释,修改value为 /usr/local/solr

solr/home

/usr/local/solr/

java.lang.String

另外还有一处要修改,但本人第一次配置solr的时候没改此处一样能运行,后面不知道那个环节路径错了,导致无法运行,也没去深究,修改以下配置就能运行

打开下面文件

vi /usr/local/solr/collection1/conf/solrconfig.xml

修改此处路径为绝对路径

启动Servlet容器。

servlet容器可能已经开始的端口不是8080其他在...检查servlet容器的文档,如果你不知道这是什么。

如果已经在该端口上运行一个servlet容器,你可能无法启动。关闭另外一个或更改你是在运行的端口。

有关使用一个以上的索引,或者Solr中的多于一个实例的工作信息,请参阅MultipleIndexes。

以上步骤,配置完毕,并验证成功后,继续来配置mmseg4j分词  下载地址

首先,在你创建的solr实例目录下,新建lib,dic两个文件夹,一个用于存放jar文件(lib),一个用于存放词库(dic)

cd /usr/local/solr mkdir lib mkdir dic

解压你下载的mmseg4j,将mmseg4j/dist目录下的jar文件拷贝至刚新建的lib文件夹,将mmseg4j/data目录下的文件拷贝纸刚新建的dic文件夹

打开 /usr/local/solr/collection1/conf/solrconfig.xml文件,添加配置

打开 /usr/local/solr/collection1/conf/schema.xml文件,分别在相应位置添加如下配置。

OK,到此为止词库已经配置成功,重启tomcat打开

根据原作 https://pan.quark.cn/s/459657bcfd45 的源码改编 Classic-ML-Methods-Algo 引言 建立这个项目,是为了梳理和总结传统机器学习(Machine Learning)方法(methods)或者算法(algo),和各位同仁相互学习交流. 现在的深度学习本质上来自于传统的神经网络模型,很大程度上是传统机器学习的延续,同时也在不少时候需要结合传统方法来实现. 任何机器学习方法基本的流程结构都是通用的;使用的评价方法也基本通用;使用的一些数学知识也是通用的. 本文在梳理传统机器学习方法算法的同时也会顺便补充这些流程,数学上的知识以供参考. 机器学习 机器学习是人工智能(Artificial Intelligence)的一个分支,也是实现人工智能最重要的手段.区别于传统的基于规则(rule-based)的算法,机器学习可以从数据中获取知识,从而实现规定的任务[Ian Goodfellow and Yoshua Bengio and Aaron Courville的Deep Learning].这些知识可以分为四种: 总结(summarization) 预测(prediction) 估计(estimation) 假想验证(hypothesis testing) 机器学习主要关心的是预测[Varian在Big Data : New Tricks for Econometrics],预测的可以是连续性的输出变量,分类,聚类或者物品之间的有趣关联. 机器学习分类 根据数据配置(setting,是否有标签,可以是连续的也可以是离散的)和任务目标,我们可以将机器学习方法分为四种: 无监督(unsupervised) 训练数据没有给定...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值