
java
文章平均质量分 67
lwl_ls
这个作者很懒,什么都没留下…
展开
-
j2sdk jdk jre jvm的联系与区别
j2sdk(Software Development Kit for Java 2) ,简称JDK.它包括了JDK(Java Development Kit),JRE(Java Runtime Enviroment),Java Plug-in.我们通常所说的JDK以及下载并安装的JDK就是指它了.JDK(Java Development Kit), Java开发工具包.JDK是一组API,也可转载 2008-02-17 14:21:00 · 1601 阅读 · 0 评论 -
lucene点滴
<br /><br />feild和term的关系是什么?<br />[在feild中切分出term]<br /> <br />===============<br /> <br />为了减小索引文件的大小,Lucene对索引还使用了压缩技术。首先,对词典文件中的关键词进行了压缩,<br />关键词压缩为<前缀长度,后缀>,例如:当前词为“阿拉伯语”,上一个词为“阿拉伯”,那么“阿拉伯语”压缩为<3,语>。<br />其次大量用到的是对数字的压缩,数字只保存与上一个值的差值(这样可以减小数字的长度,进而减少原创 2010-07-27 09:51:00 · 667 阅读 · 0 评论 -
[lucene] setOmitTermFreqAndPositions与setOmitNorms
<br />+ 测试setOmitTermFreqAndPositions与setOmitNorms后搜索速度的变化 元数据: zhwiki-20100529-pagelinks.sql(675587k) -单次搜索(均是清空缓存后的测试): 不Omit: 90ms Omit: 34ms -1002次搜索 不Omit: 34985ms Omit: 19025ms+ 兼容性: 旧索引未omit,后面添加的新索引omit,最后合成的最终索引,search的时候可以原创 2010-07-20 13:46:00 · 1514 阅读 · 0 评论 -
org.apache.lucene.search.Hits.java搜索索引
/** * Tries to add new documents to hitDocs. * Ensures that the hit numbered min has been retrieved. */ private final void getMoreDocs(int min) throws IOException { if原创 2008-10-28 20:45:00 · 2987 阅读 · 0 评论 -
lucene 源码分析
//org.apache.lucene.index => DocumentsWriter.java /* Invert one occurrence of one field in the document */ public void invertField(Fieldable field, Analyzer analyzer, final in原创 2008-09-23 20:38:00 · 1425 阅读 · 0 评论 -
centos下装jdk,nutch,tomcat
centos下装jdk./jdk-6u6-linux-i586-rpm.bin在当前目录下出现jdk-6u6-linux-i586.rpm;rpm -ivh jdk-6u6-linux-i586.rpm // must use rootthen can run java in the shell. // no need to set the env然后有了/usr/java/jdk1.6.0_原创 2008-05-08 17:26:00 · 1584 阅读 · 0 评论 -
Tomcat启动分析
Tomcat笔记(1)heavyz, 2003-03-221 - Tomcat Server的组成部分 1.1 - Server A Server element represents the entire Catalina servlet container. (Singleton) 1.2 - Service A Service element represents the转载 2008-05-08 22:33:00 · 681 阅读 · 0 评论 -
lucene在BSD上跑起来了!
安装ant:sysname# cd /usr/ports/devel/apache-ant sysname# make install===> Vulnerability check disabled, database not found=> apache-ant-manpage-20030908.tgz doesnt seem to exist in /usr/ports/distfile原创 2008-03-22 00:50:00 · 927 阅读 · 0 评论 -
开源搜索引擎资源
开放源代码搜索引擎为人们学习、研究并掌握搜索技术提供了极好的途径与素材,推动了搜索技术的普及与发展,使越来越多的人开始了解并推广使用搜索技术。使用开源搜索引擎,可以大大缩短构建搜索应用的周期,并可根据应用需求打造个性化搜索应用,甚至构建符合特定需求的搜索引擎系统。搜索引擎的开源,无论是对技术人员还是普通用户,都是一个福音。 搜索引擎的工作流程主要分为三步:从互联网抓取网页→创建抓取网页转载 2008-03-18 18:30:00 · 1869 阅读 · 1 评论 -
Linux下安装JDK以及Tomcat
Linux下安装JDK以及Tomcat 作者:scorpio 2008-01-18 11:09:24 标签: 杂谈转载 2008-03-07 08:12:00 · 1074 阅读 · 0 评论 -
BSD菜鸟装jdk
1../java_ee_sdk-5_04-linux.bin无法安装:ELF interpreter /lib/ld-linux.so.2 not foundAbort trap2.于是打算jre,jdk一个个装:diablo-jdk-freebsd6.i386.1.5.0.07.01.tbzdiablo-jre-freebsd6.i386.1.5.0.07.01.tbz解为diabl原创 2008-03-09 16:31:00 · 1243 阅读 · 0 评论 -
java对汉字的读取
<br /> FileInputStream fInStream = new FileInputStream(args[0]); InputStreamReader inStreamReader = new InputStreamReader(fInStream, "GB2312"); System.out.println(inStreamReader.getEncoding()); char[] charBuf = new char[100]; i原创 2010-08-11 14:50:00 · 1172 阅读 · 0 评论