java获取文件的mime type

本文介绍了在Java中获取文件MimeType的五种方法,包括使用Files.probeContentType、URLConnection.getContentType、MimeTypesFileTypeMap、jMimeMagic库及Apache Tika工具集。每种方法都有其适用场景和优缺点。

方法一

@Test
public void whenUsingJava7_thenSuccess() {
    Path path = new File("product.png").toPath();
    String mimeType = Files.probeContentType(path);
    assertEquals(mimeType, "image/png");
}

此方法需要java 7及以上。Files.probeContentType使用已经安装的FileTypeDetector实现类的probeContentType方法来解析获得文件的的Mime Type。
如果其中一个实现能够识别解析该文件则立即返回,如果不能则使用系统默认实现类来解析识别。对于使用系统默认实现可能导致的失败会由于系统的差异而不同。另外如果文件不存在或者文件没有后缀名也会导致失败。

目前测试基本文件类型都能够解析成功,附上Files.probeContentType源码

    public static String probeContentType(Path path)
        throws IOException
    {
        // try installed file type detectors
        for (FileTypeDetector detector: FileTypeDetectors.installeDetectors) {
            String result = detector.probeContentType(path);
            if (result != null)
                return result;
        }

        // fallback to default
        return FileTypeDetectors.defaultFileTypeDetector.probeContentType(path);
    }

方法二

  1. 我们可以使用URLConnection.getContentType()方法来获取Mine Type,但是这个方法的主要缺陷就是太慢了。
@Test
public void whenUsingGetContentType_thenSuccess(){
    File file = new File("product.png");
    URLConnection connection = file.toURL().openConnection();
    String mimeType = connection.getContentType();
 
    assertEquals(mimeType, "image/png");
}
  1. 我们还可以使用URLConnection.getContentType()方法来获取Mine Type。这个方法依赖于内部的FileNameMap类,通过文件扩展名来匹配MineType。同时也可以调用guessContentTypeFromStream()方法传入一个输入流,通过文件的前几个字符判断文件的MineType。
@Test
public void whenUsingGuessContentTypeFromName_thenSuccess(){
    File file = new File("product.png");
    String mimeType = URLConnection.guessContentTypeFromName(file.getName());
 
    assertEquals(mimeType, "image/png");
}
  1. 一个相对较快的方式是使用URLConnection.getFileNameMap()。这个方法先通过URLConnection获取其内置的所有Mine Type列表,之后通过文件名取得对应值。URLConnection内置的类型是有限,默认加载路径为JRE_HOME/lib/content-types.properties,可以设置content.types.user.table属性自定义拓展改该列表。
@Test
public void whenUsingGetFileNameMap_thenSuccess(){
    File file = new File("product.png");
    FileNameMap fileNameMap = URLConnection.getFileNameMap();
    String mimeType = fileNameMap.getContentTypeFor(file.getName());
 
    assertEquals(mimeType, "image/png");
}
System.setProperty("content.types.user.table","<path-to-file>");

第二点中的方法和第三点本质上是相同的,通过查看URLConnection.guessContentTypeFromName源码可知。

    public static String guessContentTypeFromName(String fname) {
        return getFileNameMap().getContentTypeFor(fname);
    }

方法三

MimeTypesFileTypeMap通过文件后缀获取Mie Type,这里的参数可以是文件名也可以是File对象。

@Test
public void whenUsingMimeTypesFileTypeMap_thenSuccess() {
    File file = new File("product.png");
    MimetypesFileTypeMap fileTypeMap = new MimetypesFileTypeMap();
    String mimeType = fileTypeMap.getContentType(file.getName());
 
    assertEquals(mimeType, "image/png");
}

MimeTypesFileTypeMap通过查找加载mime.types文件来进行类型解析,该类加载文件的顺序如下:

  1. MimeTypesFileTypeMap 类以编程方式添加的。
  2. USER.HOME目录下的mime.types文件。
  3. JAVA.HOME/lib/mime.types。
  4. 工程resources目录下 META-INF/mime.types。
  5. 工程resources目录META-INF/mimetypes.default(通常只有activation.jar 下面有)。

这里所说的加载顺序应该来自MimeTypesFileTypeMap类的构造方法中定义的,第一点中的以编程方式添加应该是下面的dbv.addElement((Object)null);行,window下反编译出来是null。如果找不到具体加载的哪个文件可以本地debug试试。

    public MimetypesFileTypeMap() {
        Vector dbv = new Vector(5);
        MimeTypeFile mf = null;
        dbv.addElement((Object)null);
        LogSupport.log("MimetypesFileTypeMap: load HOME");

        String system_mimetypes;
        try {
            system_mimetypes = System.getProperty("user.home");
            if (system_mimetypes != null) {
                String path = system_mimetypes + File.separator + ".mime.types";
                mf = this.loadFile(path);
                if (mf != null) {
                    dbv.addElement(mf);
                }
            }
        } catch (SecurityException var6) {
        }

        LogSupport.log("MimetypesFileTypeMap: load SYS");

        try {
            system_mimetypes = System.getProperty("java.home") + File.separator + "lib" + File.separator + "mime.types";
            mf = this.loadFile(system_mimetypes);
            if (mf != null) {
                dbv.addElement(mf);
            }
        } catch (SecurityException var5) {
        }

        LogSupport.log("MimetypesFileTypeMap: load JAR");
        this.loadAllResources(dbv, "META-INF/mime.types");
        LogSupport.log("MimetypesFileTypeMap: load DEF");
        mf = this.loadResource("/META-INF/mimetypes.default");
        if (mf != null) {
            dbv.addElement(mf);
        }

        this.DB = new MimeTypeFile[dbv.size()];
        dbv.copyInto(this.DB);
    }

mime.types定义样例如下:
type=application/octet-stream exts=bin
其他样例参考

方法四

jMimeMagic是一个限制性许的库,可以通过该库去获取Mine type。maven 依赖配置如下(版本可依据当前最新配置):

<dependency>
    <groupId>net.sf.jmimemagic</groupId>
    <artifactId>jmimemagic</artifactId>
    <version>0.1.5</version>
</dependency>

使用代码如下:

@Test    
public void whenUsingJmimeMagic_thenSuccess() {
    File file = new File("product.png");
    Magic magic = new Magic();
    MagicMatch match = magic.getMagicMatch(file, false);
 
    assertEquals(match.getMimeType(), "image/png");
}

该函数可以使用流数据,因此文件可以不存在。

这说的应该是getMagicMatch方法的重载函数,可以直接使用bye[],如果使用File作为参数文件是必须存在的。

方法五

Apache Tika是一个工具集,可检测并从各种文件中提取元数据和文本。
它具有丰富而强大的API,并带有tika-core,我们可以利用它来检测fi的MIME类型。
maven依赖配置如下:

<dependency>
    <groupId>org.apache.tika</groupId>
    <artifactId>tika-core</artifactId>
    <version>1.18</version>
</dependency>

java示例代码如下

@Test
public void whenUsingTika_thenSuccess() {
    File file = new File("product.png");
    Tika tika = new Tika();
    String mimeType = tika.detect(file);
 
    assertEquals(mimeType, "image/png");
}

The library relies on magic markers in the stream prefix, for type resolution.(这句没懂,大概意思应该是通过文件前面几个字符判断Mine Type)。

总结

在这篇文章中我们使用了好几种方式获取文件的Mine Type,除此之外我们也分析了几种方法。文章中使用的完整代码gitHub链接

Java中,根据URL获取文件MIME类型通常涉及以下几种方法,适用于文件下载、HTTP请求处理等场景: ### 1. 使用 `URLConnection` 获取 MIME 类型 Java 的标准库提供了 `java.net.URLConnection` 类,可以通过 `getContentType()` 方法获取远程文件MIME 类型。这种方法适用于能够直接访问 URL 内容的场景。 ```java import java.net.URL; import java.net.URLConnection; public class MimeTypeFetcher { public static String getMimeTypeFromURL(String urlString) throws Exception { URL url = new URL(urlString); URLConnection connection = url.openConnection(); return connection.getContentType(); } } ``` 需要注意的是,该方法依赖于服务器正确设置响应头中的 `Content-Type` 字段[^2]。 ### 2. 使用 `javax.activation.MimetypesFileTypeMap` 如果需要基于文件扩展名进行 MIME 类型推断,可以使用 `javax.activation.MimetypesFileTypeMap`。此方法适用于已知文件名或扩展名的情况。 ```java import javax.activation.MimetypesFileTypeMap; public class MimeTypeByExtension { public static String getMimeTypeFromFile(String filename) { MimetypesFileTypeMap fileTypeMap = new MimetypesFileTypeMap(); return fileTypeMap.getContentType(filename); } } ``` 这种方法在服务器未提供准确 MIME 类型时可作为补充手段[^1]。 ### 3. 结合 HTTP 客户端库获取 MIME 类型 对于更复杂的场景,可以使用 Apache HttpClient 或 OkHttp 等 HTTP 客户端库,它们提供了更强大的功能来处理 HTTP 响应头。 #### 使用 Apache HttpClient 示例: ```java import org.apache.http.HttpResponse; import org.apache.http.client.methods.HttpHead; import org.apache.http.impl.client.CloseableHttpClient; import org.apache.http.impl.client.HttpClients; public class HttpClientMimeType { public static String getMimeTypeFromURL(String urlString) throws Exception { try (CloseableHttpClient httpClient = HttpClients.createDefault()) { HttpHead request = new HttpHead(urlString); HttpResponse response = httpClient.execute(request); return response.getEntity().getContentType().getValue(); } } } ``` 此方法适用于需要更灵活控制 HTTP 请求的场景。 ### 4. 处理未知或动态 URL 对于某些动态生成的 URL,如 `http://jprice.360buyimg.com/getSkuPriceImgService.action?skuId=1850001109&origin=1&webSite=1&type=1`,服务器可能未正确设置 `Content-Type`。此时可以结合文件扩展名解析,或使用 `Tika` 等库进行内容分析。 #### 使用 Apache Tika 解析 MIME 类型: ```java import org.apache.tika.Tika; public class TikaMimeType { public static String getMimeTypeFromURL(String urlString) throws Exception { Tika tika = new Tika(); return tika.detect(new java.net.URL(urlString)); } } ``` Apache Tika 可以根据文件内容自动检测 MIME 类型,适用于服务器未提供正确类型的情况[^2]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值