1、实现纯文本文档的DocumentHandler接口
2、
public class PlainTextHandler implements DocumentHandler
throws DocumentHandlerException{
String bodyText="";
try{
BufferReader br=new BufferedReader(new InputStreamReader(is));
String line=null;
while ((line==br.readline()!=null)){
bodyText+=line;
}
br.close();
}
catch(IOException e)}{
throw new DocumentHandlerException("cannot read the textdocument",e);
}
if(!bodyText.equals("")){
Documentdoc=new Document();
deoc.add(Field.Unstored("body",bodyText));
return doc;
}
return null;
}
public static void main(String[] args) throwsException{
PlainTextHandler handler=new PlainTextHandler();
Documentdoc=handler.getDocument(new File(args[0]));
System.out.println(doc);
}
}
本文介绍了一个简单的纯文本文档处理程序实现,该程序通过实现DocumentHandler接口来读取文本文件,并将文件内容封装到Document对象中。主要步骤包括使用BufferedReader逐行读取文件内容并拼接成字符串,然后创建Document对象并将读取到的内容添加到其中。

被折叠的 条评论
为什么被折叠?



