Tika DefaultParser 如何找到实现类

本文介绍了如何通过在METE-INF/services下配置文件的方式,指定Apache Tika支持的各种文件解析器,包括PDF、Office文档、图片等各类常见文件类型的解析方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

通过在METE-INF下的services包里建立相应的文件,文件名是
org.apache.tika.parser.Parser接口的名字。而文件内容是其所有实现类的全名。在DefaultParser里通过
https://connect8.uc.att.com/dstsystems/SyncEvents/WaitingRoom.asp?RM=1&LessonID=0&CreateEvent=0&MeetID=84354464&EMail=gge@dstsystems.com&Lname=HT&fName=Hengtian&MeetingKey=

List<Parser> parsers = new ArrayList<Parser>();
if (loader != null) {
Iterator<Parser> iterator =
ServiceRegistry.lookupProviders(Parser.class, loader);
while (iterator.hasNext()) {
parsers.add(iterator.next());
}
}
来得到所有实现类

org.apache.tika.parser.asm.ClassParser
org.apache.tika.parser.audio.AudioParser
org.apache.tika.parser.audio.MidiParser
org.apache.tika.parser.dwg.DWGParser
org.apache.tika.parser.epub.EpubParser
org.apache.tika.parser.feed.FeedParser
org.apache.tika.parser.font.TrueTypeParser
org.apache.tika.parser.html.HtmlParser
org.apache.tika.parser.image.ImageParser
org.apache.tika.parser.image.TiffParser
org.apache.tika.parser.iwork.IWorkParser
org.apache.tika.parser.iwork.IWorkPackageParser
org.apache.tika.parser.jpeg.JpegParser
org.apache.tika.parser.mbox.MboxParser
org.apache.tika.parser.microsoft.OfficeParser
org.apache.tika.parser.microsoft.ooxml.OOXMLParser
org.apache.tika.parser.mp3.Mp3Parser
org.apache.tika.parser.hdf.HDFParser
org.apache.tika.parser.netcdf.NetCDFParser
org.apache.tika.parser.odf.OpenDocumentParser
org.apache.tika.parser.pdf.PDFParser
org.apache.tika.parser.pkg.PackageParser
org.apache.tika.parser.rtf.RTFParser
org.apache.tika.parser.txt.TXTParser
org.apache.tika.parser.video.FLVParser
org.apache.tika.parser.xml.DcXMLParser
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值