Lucene2

private void getLucene()
{
File filePath = new File("E:\\xbliucss");
File indexPath = new File("E:\\xbliucss");
//创建一个标准解析器
StandardAnalyzer sAnalyzer = new StandardAnalyzer();
//给文档加索引
IndexWriter indexWriter = new IndexWriter(filePath, sAnalyzer, true);
File[] fileList = filePath.listFiles();
Long startTime = new Date().getTime();
//增加Document到索引中
for (int i = 0; i < fileList.length; i++)
{
if (fileList[i].isFile() && fileList[i].getName().endsWith(".txt"))
{
System.out.println("File: " + fileList[i].getCanonicalPath()
+ "正在被索引");
String temp = fileReaderAll(fileList[i].getCanonicalPath(),
"GBK");
System.out.println(temp);

Document document = new Document();

//保存文件路径
Field filedPath = new Field("path", fileList[i].getPath(),
Field.Store.YES, Field.Index.NO);

//保存文件内容
Field filedBody = new Field("body", temp, Field.Store.YES,
Field.Index.TOKENIZED,
Field.TermVector.WITH_POSITIONS_OFFSETS);

document.add(filedPath);
document.add(filedBody);
indexWriter.addDocument(document);
}
}
indexWriter.optimize();//对索引进行优化
indexWriter.close();
long endTime = new Date().getTime();
System.out.println("这花费了:" + (endTime - startTime) + "毫秒把文档增加到索引里面去"
+ indexPath.getPath());
}
private String fileReaderAll(String fileName, String charset)
{
FileInputStream fis = new FileInputStream(fileName);
InputStreamReader is = new InputStreamReader(fis, charset);
BufferedReader reader = new BufferedReader(is);
String line = "";
String temp = "";
while ((line = reader.readLine()) != null)
{
temp += line;
}
reader.close();
return temp;
}
public void queryFile()
{
Hits hits = null;
String queryStr = "中华";
Query query = null;
IndexSearcher iSearcher = new IndexSearcher("E:\\xbliucss"); //检索工具,索引存放的目录
Analyzer analyzer = new StandardAnalyzer();//标准解析器
QueryParser qParse = new QueryParser("body", analyzer); //查询器,返回一个Query对象
query = qParse.parse(queryStr);
if (iSearcher != null)
{
hits = iSearcher.search(query);
}
Iterator<?> iterator = hits.iterator();
while (iterator.hasNext())
{
//一条记录对应一个Hit对象
Object next = iterator.next();
if (next instanceof Hit)
{
Hit hit = (Hit)next;
Document document = hit.getDocument();
Field field = document.getField("path");//path:对应索引时的标识
String filePath = field.stringValue();//获取文件路径
System.out.println("文件路径:" + filePath);

Field field2 = document.getField("body");//body:对应索引时的标识
String fileBody = field2.stringValue();//获取文件内容
System.out.println("文件内容:" + fileBody);
}
}
System.out.println("共找到" + hits.length() + "个结果。");
}
资源下载链接为: https://pan.quark.cn/s/22ca96b7bd39 在 IT 领域,文档格式转换是常见需求,尤其在处理多种文件类型时。本文将聚焦于利用 Java 技术栈,尤其是 Apache POI 和 iTextPDF 库,实现 doc、xls(涵盖 Excel 2003 及 Excel 2007+)以及 txt、图片等格式文件向 PDF 的转换,并实现在线浏览功能。 先从 Apache POI 说起,它是一个强大的 Java 库,专注于处理 Microsoft Office 格式文件,比如 doc 和 xls。Apache POI 提供了 HSSF 和 XSSF 两个 API,其中 HSSF 用于读写老版本的 BIFF8 格式(Excel 97-2003),XSSF 则针对新的 XML 格式(Excel 2007+)。这两个 API 均具备读取和写入工作表、单元格、公式、样式等功能。读取 Excel 文件时,可通过创建 HSSFWorkbook 或 XSSFWorkbook 对象来打开相应格式的文件,进而遍历工作簿中的每个 Sheet,获取行和列数据。写入 Excel 文件时,创建新的 Workbook 对象,添加 Sheet、Row 和 Cell,即可构建新 Excel 文件。 再看 iTextPDF,它是一个用于生成和修改 PDF 文档的 Java 库,拥有丰富的 API。创建 PDF 文档时,借助 Document 对象,可定义页面尺寸、边距等属性来定制 PDF 外观。添加内容方面,可使用 Paragraph、List、Table 等元素将文本、列表和表格加入 PDF,图片可通过 Image 类加载插入。iTextPDF 支持多种字体和样式,可设置文本颜色、大小、样式等。此外,iTextPDF 的 TextRenderer 类能将 HTML、
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值