python同步远程文件夹_利用python实现两个文件夹的同步

部署运行你感兴趣的模型镜像

其实无论windows还是Linux,简单地去实现两个两个文件夹的同步只需系统自带的复制命令加参数就可以了。

WINDOWS :

xcopy 源文件夹\* 目标文件夹 /s /e /y

Linux :

cp -r 源文件夹/* 目标文件夹

这里使用python来实现这些基本功能,并增加一些去重之类的增强功能。

1、复制源文件夹中文件至目标文件夹

要想同步两个文件夹中的数据,基本思路首先需要遍历源文件夹中的信息,将源文件夹中的文件复制到目标文件夹。

遍历文件夹采用os中的listdir函数就可以了。

import os

path_s = 'F:\\test\\s'

path_t = 'F:\\test\\t'

for filename in os.listdir(path_s):

filename_s = path_s+os.sep+filename

print '[*] Source :',filename_s

filename_t = path_t+os.sep+filename

print '[*] Target :',filename_t

with open(filename_s,'rb') as f_s:

with open(filename_t,'wb') as f_t:

f_t.write(f_s.read())

但是很明显这里没有考虑源文件夹中还会存在文件夹甚至多重文件夹的情况。

2、源文件夹中存在多重文件夹

一个简单的思路就是:在遍历源文件夹内的文件时,先判定当前文件这是文件还是文件夹。如果当前文件是文件夹的话,开始遍历此文件夹内的文件,如果里面还有文件夹,遍历这个文件夹,依次类推。利用递归的方法,代码如下:

import os

path_s = 'F:\\test\\s'

path_t = 'F:\\test\\t'

def copy_file(paths,patht):

for filename in os.listdir(paths):

filename_s = paths+os.sep+filename

filename_t = patht+os.sep+filename

if os.path.isdir(filename_s):

if not os.path.exists(filename_t):

os.mkdir(filename_t) #在目标文件夹中创建对应的文件夹

copy_file(filename_s,filename_t) # 递归

else:

print '[*] Source :',filename_s

print '[*] Target :',filename_t

with open(filename_s,'rb') as f_s:

with open(filename_t,'wb') as f_t:

f_t.write(f_s.read())

copy_file(path_s,path_t)

目前,简单的文件夹复制功能已经实现了。

3、目标文件夹中已有文件不再复制

一个简单的方法就是在目标文件夹中复制文件之前先利用函数“os.path.exists”判定这个文件是否存在。

import os

path_s = 'F:\\test\\s'

path_t = 'F:\\test\\t'

def copy_file(paths,patht):

for filename in os.listdir(paths):

filename_s = paths+os.sep+filename

filename_t = patht+os.sep+filename

if os.path.isdir(filename_s):

if not os.path.exists(filename_t):

os.mkdir(filename_t)

copy_file(filename_s,filename_t)

else:

if os.path.exists(filename_t):

print '[*] "%s" already exists! ' % filename_t

else:

print '[*] Source :',filename_s

print '[*] Target :',filename_t

with open(filename_s,'rb') as f_s:

with open(filename_t,'wb') as f_t:

f_t.write(f_s.read())

copy_file(path_s,path_t)

这个办法避免了一部分已有文件的重复复制操作,减少了部分不必要的读写操作,但是却无法消除内容相同但名称、路径不同的重复文件。

4、利用MD5判定重复文件

目前判定两个文件是否相同,除了按字节逐个对比这个笨方法外,简单常用的办法就是利用MD5和CRC校验,或是按一定规律挑取文件的指定位置的数据块就行对比。

这次利用文件的MD5值,将目标文件夹中已有文件的MD5值保存到列表或字典中,每在源文件夹中读取一个文件就判定该文件的MD5值是否已经存在于MD5列表,没有的话再进行复制操作,并将该文件的MD5值写入列表。

import os

import hashlib

path_s = 'F:\\test\\s'

path_t = 'F:\\test\\t'

list_file = {}

def create_file_list(path):

for name in os.listdir(path):

filename = path+os.sep+name

if os.path.isdir(filename):

create_file_list(filename)

else:

with open(filename,'rb') as f:

md5 = hashlib.md5(f.read()).hexdigest()

if md5 not in list_file:

list_file[md5] = 1

def copy_file(paths,patht):

for filename in os.listdir(paths):

filename_s = paths+os.sep+filename

filename_t = patht+os.sep+filename

if os.path.isdir(filename_s):

if not os.path.exists(filename_t):

os.mkdir(filename_t)

copy_file(filename_s,filename_t)

else:

if os.path.exists(filename_t):

print '[*] "%s" already exists! ' % filename_t

else:

with open(filename_s,'rb') as f_s:

data = f_s.read()

file_md5 = hashlib.md5(data).hexdigest()

if file_md5 not in list_file:

list_file[file_md5] = 1

print '[*] Source :',filename_s

print '[*] Target :',filename_t

with open(filename_t,'wb') as f_t:

f_t.write(data)

else:

print '[*] "%s"\'s MD5 already exists! ' % filename_t

create_file_list(path_t)

copy_file(path_s,path_t)

如下图,运行后内容相同的几个文件,只有第一次读取到的时候才写入目标文件夹,其他路径下的文件并没有复制到目标文件夹。

基于Python——实现两个文件夹中的文件拷贝

[背景]当复制一个文件夹中的某文件到另一个文件夹中时是一件很容易的事情,可是如果存在很多文件夹中的文件需要一一拷贝,就会变的很繁琐,稍有不慎就会遗漏,今天就用Python来解决这个问题—— [代码实现 ...

利用python合并两个文件

1格式如下 在做利用zabbix的api来批量添加主机的时候,需要处理ip和hostname,在借用别人写的py程序的基础上,自己有改装了以下脚本,为自己使用.需要时ip和hostname为一个统一格 ...

利用Python批量重命名文件夹下文件

#!/usr/bin/python # -*- coding: UTF-8 -*- # -*- coding:utf8 -*- import os from string import digits ...

使用python实现两个文件夹里文件的对比(包含内容的对比)

#-*-coding:utf-8-*- #=============================================================================== ...

Python批量复制迁移文件夹

前言 Python可以利用shutil库进行对文件夹,文件的迁移.而在本次的实践当中,难点在于目标文件夹的名称和数据源文件夹的名称,需要利用 工作单位提供的中间数据去进行对比连接起来. 例如:目标源的 ...

Path,Files巩固,题目:从键盘接收两个文件夹路径,把其中一个文件夹中(包含内容)拷贝到另一个文件夹中

这个题目用传统的File,InputStream可以做,但是如果用Files,Path类做,虽然思路上会困难一些,但是代码简洁了很多,以下是代码: import java.io.IOException ...

利用 Python 进行批量更改文件后缀

利用 Python 进行批量更改文件后缀 代码 import os files = os.listdir('.') for file_name in files: portion = os.path. ...

Linux下对比两个文件夹的方法

最近拿到一份源代码,要命的是这份源代码是浅克隆模式的git包,所以无法完整显示里面的修改的内容. 今天花了一点点时间,找了一个在Linux对比两个文件夹的方法. 其实方法很简单,用meld 去对比两个 ...

Python模糊查询本地文件夹去除文件后缀(7行代码)

Python模糊查询本地文件夹去除文件后缀 import os,re def fuzzy_search(path): word= input('请输入要查询的内容:') for filename in ...

随机推荐

Backbone的一点使用心得

Backbone的其实感觉上上手很难,大概在一年前就想实践下,结果总是没有付诸行动,这次需求中狠狠心决定一定要使用一次看看,感受下. 可是第一步真的比较困难,因为直接看API好像没有感觉就在网上找实例 ...

SQL SERVER触发器游标小记

今天接到个需求用触发器来实现通过条件对其他表的更新.好久没摸SQL SERVER,电脑里也没SQL SERVER安装包,同事遂发来个安装包,一看吓一跳,3.6G!!!!经过漫长等待后,开始作业.需求如 ...

gradlew常用命令

./gradlew -v 查看版本 ./gradlew clean 清理.下载依赖 ./gradlew build  构建 libgdx项目中的gradlew run: ./gradlew deskt ...

3d中的坐标系的概念

世界坐标系 世界坐标系是一个特殊的坐标系,它建立了描述其它坐标系所需要的参考框架.从另一方面说能够用世界坐标描述其它坐标系的位置,而不能用更大的.外部的坐标系来描述世界坐标系. 物体坐标系 物体坐标系 ...

nodejs事件循环

1. 只有一个主线程,node开始执行脚本时,会先进事件循环初始化(同步任务,发出异步请求,规划定时器生效时间,执行promise.nextTick等),这是事件循环还未开始. 2. nodejs每一 ...

Go语言单元测试与基准测试

目录 单元测试 概述 go test参数解读 单元测试日志 基准测试 基础测试基本使用 基准测试原理 自定义测试时间 测试内存 控制计时器 Go语言拥有一套单元测试和性能测试系统,仅需要添加很少的代码 ...

Spring Boot整合MyBatis(使用Spring Tool Suite工具)

1. 创建Spring Boot项目 通过Spring Tool Suite的Spring Starter Project对话框,其实是把项目生成的工作委托http://start.spring.io ...

App store 应用审核由于 IPv6 网络问题被拒的一点分析

App store 应用审核由于 IPv6 网络问题被拒的一点分析   六月以后陆续有一些软件提交市场的时候被拒了,症状基本就是无法登陆啥的.我们公司的应用也未能幸免. 很多同学也想了不少办法,申诉. ...

《modern-php》 - 阅读笔记 - 最佳实践

过滤.验证和转义数据 过滤数据 不要相信任何外部数据! 常见的有以下几种数据需要过滤:HTML,SQL查询,用户提交的信息(邮件地址.电话号码.身份证) HTML htmlentities() HTM ...

Windows Server Core Command (管理服务器核心的具体操作命令)

从 Windows Server 2008 开始,管理员可以选择安装具有特定功能但不包含任何不必要功能的 Windows Server 的最小安装服务器核心(Server Core),它为一些特定服务 ...

您可能感兴趣的与本文相关的镜像

Python3.11

Python3.11

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值