python---filecmp 实现文件,目录,遍历子目录的差异对比功能。

2021-05-05 13:30

阅读:747

  ilecmp可以实现文件,目录,遍历子目录的差异对比功能。

  自带filecmp模块,无需安装。

常用方法说明

  filecmp提供3个操作方法,cmp(单文件对比),cmpfile(多文件对比),dircmp(目录对比).

  单文件对比,filecmp.cmp(f1,f2[,shallow])

  f1 f2为文件,相同True,不同False,shallow默认为True,只根据os.stat()方法返回的文件基本信息进行对比。比如最后访问时间,修改时间,状态改变时间等,会忽略文件内容的对比,当shallow为False时,则os.stat()与文件内容同时进行校验。

1 >>>filrcmp.cmp("/temp/a1","/temp/a2")
2 >>>True
3 
4 >>>filrcmp.cmp("/temp/a1","/temp/a3")
5 >>>False

  多文件对比,采用filecmp.cmpfiles(dir1, dir2, common[, shallow])
  比较两个文件夹内指定文件是否相等。参数dir1, dir2指定要比较的文件夹,参数common指定要比较的文件名列表。函数返回包含3个list元素的元组,分别表示匹配、不匹配以及错误的文件列表。错误的文件指的是不存在的文件,或文件被琐定不可读,或没权限读文件,或者由于其他原因访问不了该文件。

 

  目录对比,通过 filecmp(a,b[,ignore[,hide]])类创建一个目录比较对象
  用于比较文件夹,通过该类比较两个文件夹,可以获取一些详细的比较结果(如只在A文件夹存在的文件列表),并支持子文件夹的递归比较。

dircmp#提供了三个方法用于报告比较的结果:
report():#只比较指定文件夹中的内容(文件与文件夹)
report_partial_closure():#比较文件夹及第一级子文件夹的内容
report_full_closure():#递归比较所有的文件夹的内容
技术图片
#dircmp还提供了下面这些属性用于获取比较的详细结果
left_list:#左边文件夹中的文件与文件夹列表;
right_list:#右边文件夹中的文件与文件夹列表;
common:#两边文件夹中都存在的文件或文件夹;
left_only:#只在左边文件夹中存在的文件或文件夹;
right_only:#只在右边文件夹中存在的文件或文件夹;
common_dirs:#两边文件夹都存在的子文件夹;
common_files:#两边文件夹都存在的子文件;
common_funny:#两边文件夹都存在的子文件夹;
same_files:#匹配的文件;
diff_files:#不匹配的文件;
funny_files:#两边文件夹中都存在,但无法比较的文件;
subdirs:#将common_dirs 目录映射到新的dircmp对象,格式为字典的类型。
技术图片
技术图片
 1 #!/usr/bin/python3
 2 #coding:utf-8
 3 import os,sys
 4 import filecmp
 5 import re
 6 import shutil
 7 ‘‘‘
 8     校验源与备份目录的差异
 9 ‘‘‘
10  
11 holderlist = []
12 def compareme(dir1,dir2):    #递归获取更新项函数
13     dircomp = filecmp.dircmp(dir1,dir2)
14     only_in_one = dircomp.left_only      #源目录新文件或目录 
15     diff_in_one = dircomp.diff_files     #不匹配文件,源目录文件已发生变化
16     dirpath = os.path.abspath(dir1)      #定义源目录绝对路径
17     
18     #将更新文件或目录追加到holderlist
19     [ holderlist.append(os.path.abspath(os.path.join(dir1,x))) for x in only_in_one ]
20     [ holderlist.append(os.path.abspath(os.path.join(dir1,x))) for x in diff_in_one ]
21     if len(dircomp.common_dirs) > 0:  #判断是否存在相同子目录,以便递归
22         for item in dircomp.common_dirs:   #递归子目录
23             compareme(os.path.abspath(os.path.join(dir1,item)),os.path.abspath(os.path.join(dir2,item)))
24     return holderlist
25     
26 def main():
27     if len(sys.argv) > 2:    #输入源目录与备份目录
28         dir1 = sys.argv[1]
29         dir2 = sys.argv[2]
30     else :
31         print(‘Usage:‘,sys.argv[0],‘datadir backdir‘)
32         sys.exit()
33     source_files = compareme(dir1,dir2)    #对比源目录与备份目录
34     dir1 = os.path.abspath(dir1)    #取绝对路径后,后面不会自动加上‘/‘
35  
36     if not dir2.endswith(‘/‘):
37         dir2 = dir2+‘/‘            #备份目录路径加‘/‘
38     
39     dir2 = os.path.abspath(dir2)
40     destination_files = []
41     createdir_bool = False
42     
43     for item in source_files:     #遍历返回的差异文件或目录清单
44         destination_dir = re.sub(dir1,dir2,item)    #将源目录差异路径清单对应替换成备份目录,即需要在dir2中创建的差异目录和文件
45         destination_files.append(destination_dir)
46         if os.path.isdir(item):      #如果差异路径为目录且不存在,则在备份目录中创建
47             if not os.path.exists(destination_dir):
48                 os.makedirs(destination_dir)
49                 createdir_bool = True   #再次调用copareme函数标记
50     if createdir_bool :       #重新调用compareme函数,重新遍历新创建目录的内容
51         destination_files = []
52         source_files = []
53         source_files = compareme(dir1,dir2)    #调用compareme函数
54         for item in source_files:           #获取源目录差异路径清单,对应替换成备份目录
55             destination_dir = re.sub(dir1,dir2,item)
56             destination_files.append(destination_dir)
57             
58     print(‘update item:‘)
59     print(source_files)     #输出更新项列表清单
60     copy_pair = zip(source_files,destination_files)  #将源目录与备份目录文件清单拆分成元组
61     for item in copy_pair:
62         if os.path.isfile(item[0]):        #判断是否为文件,是则进行复制操作
63             shutil.copyfile(item[0],item[1])
64             
65 if __name__ == ‘__main__‘ :
66     main()
技术图片

 


评论


亲,登录后才可以留言!