Python 判断两个文件是否二进制相同的方法

原创于 2025-09-23 10:01:04 发布 · 335 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #哈希算法 #开发语言

【Python】专栏收录该内容

62 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

Python 判断两个文件是否二进制相同的方法

在开发过程中，经常需要判断两个文件是否在二进制层面完全相同。本文介绍两种常用的实现方法，各有其适用场景。

方法一：直接分块比较文件内容

这种方法通过逐块读取文件内容并进行比较，当发现差异时立即返回结果，不需要读取完整文件。

import os
import hashlib

# 方法一：直接比较文件内容
def are_files_equal_direct(file1_path, file2_path):
    # 实现代码同上...
    if os.path.getsize(file1_path) != os.path.getsize(file2_path):
        return False
    
    block_size = 4096
    with open(file1_path, 'rb') as f1, open(file2_path, 'rb') as f2:
        while True:
            block1 = f1.read(block_size)
            block2 = f2.read(block_size)
            if not block1 and not block2:
                return True
            if block1 != block2:
                return False

# 方法二：通过哈希值比较
def get_file_hash(file_path, block_size=65536):
    # 实现代码同上...
    hasher = hashlib.md5()
    with open(file_path, 'rb') as f:
        while chunk := f.read(block_size):
            hasher.update(chunk)
    return hasher.hexdigest()

def are_files_equal_hash(file1, file2):
    # 实现代码同上...
    return get_file_hash(file1) == get_file_hash(file2)

# 使用示例
if __name__ == "__main__":
    file1 = "example1.bin"
    file2 = "example2.bin"
    
    # 检查文件是否存在
    if not os.path.exists(file1) or not os.path.exists(file2):
        print("指定的文件不存在")
    else:
        # 使用直接比较法
        direct_result = are_files_equal_direct(file1, file2)
        print(f"直接比较结果: {'相同' if direct_result else '不同'}")
        
        # 使用哈希比较法
        hash_result = are_files_equal_hash(file1, file2)
        print(f"哈希比较结果: {'相同' if hash_result else '不同'}")