最近准备学习搜索引擎,在图书馆借了本《搜索引擎开发》,作者高晓松,关于搜索引擎的入门图书市面上实在不多。
从apache上下载了最新版本的nutch,1.2版本的,高晓松的书用的是较早的版本0.9,解压缩后的文件夹里少了几个文件,又没接触过,只得找着书本操作,一步步地进行,cygwin的安装还算顺利,没出什么问题,只是,nutch在使用ant进行重编译的时候遇到了几个麻烦,到现在还是不知道怎么操作。谈java当时学的不够深入,eclipse也不是很熟悉,唉,不管了。nutch配置完成基本上还是能通过localhost:8080访问的,但是配置还是有问题,尝试搜索的时候除了500错误。准本考研的事,暂时先放这吧,慢慢再回头深久一下。有学习nutch和lecene的吗,希望能够一起学习。