用Python写脚本,完全备份和增量备份

本文介绍了一个备份脚本的实现过程,包括周一的全备和其它时间的增量备份。使用Python进行开发,涉及cPickle、tarfile等模块,并利用md5校验确保文件一致性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需求:
在/root/backup下面有两个文件夹dst和src。要求在周一的时候进行完全备份,其余日子进行增量备份。从src备份到dst。

思路及关键点:

  1. 建立一个文件,以字典方式记录src的文件名以及文件对应的md5的值
  2. 完全备份的时候将文件名和md5值写在一个文件里面。cPickle的知识点。
  3. 增量备份的时候比较文件名是否在key里面,没有就要备份;有的话,这个文件的md5值是否改变,改变了就要备份
  4. os.path.join()拼接路径,os.listdir(),os.chdir()
  5. time.strftime()判断周几
  6. cPickle,可以无损记录所有Python的变量类型。文件操作。
  7. tarfile对文件打包的使用
  8. hashlib用于计算文件md5的值。注意不要一次打开一个文件,4k地打开,防止打开一个超大文件爆内存。
  9. with file()可以打开一个文件之后不f.close()
#!/usr/bin/env python

import time
import os
import cPickle as p
import tarfile
import hashlib

baseDir = '/root/backup'
srcDir = 'src'
dstDir = 'dst'
fullName = "full_%s_%s.tar.gz" % (srcDir, time.strftime('%Y%m%d'))
incrName = "incr_%s_%s.tar.gz" % (srcDir, time.strftime('%Y%m%d'))
md5file = 'md5.data'

def md5sum(fname):
    m = hashlib.md5()

    with file(fname) as f:
        while True:
            data = f.read(4096)
            if len(data) == 0:
                break
            m.update(data)

    return m.hexdigest()

def fullBackup():
    md5Dict = {}
    fileList = os.listdir(os.path.join(baseDir,srcDir))

    for eachFile in fileList:
        md5Dict[eachFile] = md5sum(os.path.join(baseDir,srcDir,eachFile))

    with file(os.path.join(baseDir,dstDir,md5file),'w') as f:
        p.dump(md5Dict,f)

    tar = tarfile.open(os.path.join(baseDir,dstDir,fullName),'w:gz')
    os.chdir(baseDir)
    tar.add(srcDir)
    tar.close()

def incrBackup():
    newmd5 = {}
    fileList = os.listdir(os.path.join(baseDir,srcDir))
    for eachFile in fileList:
        newmd5[eachFile] = md5sum(os.path.join(baseDir,srcDir,eachFile))
    with file(os.path.join(baseDir,dstDir,md5file)) as f:
        storedmd5 = p.load(f)

    tar = tarfile.open(os.path.join(baseDir,dstDir,incrName),'w:gz')
    os.chdir(baseDir)
    for eachKey in newmd5:
        if (eachKey not in storedmd5) or (newmd5[eachKey] != storedmd5[eachKey]):
            tar.add(os.path.join(srcDir,eachKey))
    tar.close()

    with file(os.path.join(baseDir,dstDir,md5file),'w') as f:
        p.dump(newmd5,f)


def main():
    if time.strftime('%a') == 'Mon':
        fullBackup()
    else:
        incrBackup()

if __name__ == '__main__':
    main()

~                 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值