获取文件MD5值，Htnl5 File API文件拆分

最新推荐文章于 2025-03-18 19:14:34 发布

qq_16239775

最新推荐文章于 2025-03-18 19:14:34 发布

阅读量678

点赞数

分类专栏： html 文章标签： Html5 File-api 文件拆分

html 专栏收录该内容

3 篇文章

订阅专栏

本文介绍如何使用HTML5 File API将大文件分片并计算MD5值，包括监听文件变化、文件分片、使用FileReader读取二进制字符串及通过SparkMD5计算MD5。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

 
 背景 

 
 自从html5 file api出现以来，我们可以做的事情越来越多，越来越有趣了，之前介绍过 《HTML5实现断点续传》、《HTML5实现拖拽下载》等关于File API的一些实例，今天和大家分享一下，如何用HTML5 file api读取文件的MD5码。 

 
 MD5码在文件的唯一性识别上有很重要的应用，业内常用MD5进行文件识别、文件秒传、文件安全性检查等。 

 
 废话不多说，直接说重点。 

 
 实现 

 
 首先监听文本框的变化，告诉浏览器，你就看着这个input 如果有变化你就立刻执行之后的东西。 

[javascript]view plain copy
 
document.getElementById("file").addEventListener("change", function() { //...}  

 
 读取文件很容易通过input的files对象就可以读取到用户所选择的文件 

[javascript]view plain copy
 
file = document.getElementById("file").files[0]  

 
 之后就是分割文件了，由于文件可能会很大，比如说10G，20G所以一次性把它交个内存来处理会显得很残忍。于是我们把文件以2M作为一个片段进行分割，算出总共需要分成多少片 

[javascript]view plain copy
 
var chunkSize = 2097152;  
[javascript]view plain copy
 
chunks = Math.ceil(file.size / chunkSize);  

 
 接着分割文件 

[javascript]view plain copy
 
//file的slice方法，注意它的兼容性，在不同浏览器的写法不同  
blobSlice = File.prototype.mozSlice || File.prototype.webkitSlice || File.prototype.slice  
//然后指定file和开始结束的片段，就可以得到切割的文件了。  
blobSlice.call(file, start, end)  

 
 一切做好之后，就要去读取文件的具体信息了。 

 
 这里我们用了Javascript的 FileReader() 方法，这个方法可以去读取用户本地文件的详细内容。 

 
 用法如下： 

[javascript]view plain copy
 
var fileReader = new FileReader();  
//blobSlice.call(file, start, end)就是之前分割文件的方法。  
//这里只要维护好start和end，就能一片一片的把文件传给fileRader对象了fileReader.readAsBinaryString(blobSlice.call(file, start, end));  
//最终每一段文件处理完毕都会触发fileReader的onload事件  
fileReader.onload = function(e)  
{   
//e.target.result 就是我们要的片段信息   
//这里缓存获取到的片段，当所有片段完毕之后就可以进行MD5的计算了。  
}  

 
 好了，到这里万事俱备只欠东风了。 由于原生的Javascript没有直接计算MD5的方法，这里我们引用了一个比较好的spark-md5库来辅助我们进行MD5的计算。 比较好的一点是，spark-md5处理文件的话也可以按片来计算。 

[javascript]view plain copy
 
spark = new  parkMD5();  
spark.appendBinary(filepice1);  
spark.appendBinary(filepice2);  
spark.appendBinary(filepice3);....  
//所有的分片处理好之后调用下面的方法就能获取到文件的MD5了  
spark.end();  

 
 至此整个过程都已经结束了。 

 
 简单的描述就是：利用input选择文件 -> 对文件进行分片 -> 用FileReader方法读取文件 -> 交由Spark-md5进行处理。 

 
 代码 

 
 附上完成的代码： 

[javascript]view plain copy
 
//注意此方法引用了SparkMD5库 library:https://github.com/satazor/SparkMD5  
//监听文本框变化  
document.getElementById("file").addEventListener("change", function() {  
    //声明必要的变量  
    var fileReader = new FileReader(), box = document.getElementById('box');  
    //文件分割方法（注意兼容性）  
    blobSlice = File.prototype.mozSlice || File.prototype.webkitSlice || File.prototype.slice,   
    file = document.getElementById("file").files[0],   
  
    //文件每块分割2M，计算分割详情  
    chunkSize = 2097152,                  
    chunks = Math.ceil(file.size / chunkSize),   
    currentChunk = 0,   
  
    //创建md5对象（基于SparkMD5）  
    spark = new SparkMD5();  
  
    //每块文件读取完毕之后的处理  
    fileReader.onload = function(e) {  
        console.log("读取文件", currentChunk + 1, "/", chunks);  
        //每块交由sparkMD5进行计算  
        spark.appendBinary(e.target.result);  
        currentChunk++;  
  
        //如果文件处理完成计算MD5，如果还有分片继续处理  
        if (currentChunk < chunks) {  
            loadNext();  
        } else {  
            console.log("finished loading");  
            box.innerText = 'MD5 hash:' + spark.end();  
            console.info("计算的Hash", spark.end());  
        }  
    };  
  
     //处理单片文件的上传  
     function loadNext() {  
         var start = currentChunk * chunkSize, end = start + chunkSize >= file.size ? file.size : start + chunkSize;  
  
         fileReader.readAsBinaryString(blobSlice.call(file, start, end));  
     }  
  
      loadNext();  
});