python自动化办公(二)
创始人
2025-05-28 17:15:49
0

上接python自动化办公(一)

文章目录

  • 文件和目录操作
    • 使用shutil库
    • 文件查找
      • glob
      • fnmatch
      • hashlib

文件和目录操作

使用shutil库

shutil库也是Python标准库,它可以处理文件、文件夹、压缩包,能实现文件复制、移动、压缩、解压缩等功能。

函数说明
copy复制文件和权限
copy2复制文件和元数据
copyfile将一个文件的内容复制到另外一个文件当中
copyfileobj将一个文件的内容复制到另外一个文件当中
copytree复制整个文件目录
move递归地移动文件或目录,原文件或目录就不存在了
rmtree删除一个目录以及目录内的所有内容
make_archive创建压缩包并返回文件路径
unpack_archive解压缩文件

复制文件是比较复杂的事情。文件主要由两部分组成,一部分是文件的数据,另一部分是用来描述该文件的元数据。元数据指文件的访问时间、修改时间、作者等信息。所以复制文件时要弄清楚是仅复制内容还是同时要复制元数据。

# shutil.copyfile(A,B)仅仅是复制A文件的内容到B文件。A和B必须是文件,不可以是目录。B文件得有写入权限
shutil.copyfile('./python_zen.txt','./copy01.txt')
#手动新建文件夹copyfiles
#复制文件到某个文件夹
shutil.copy('./copy01.txt','./copyfiles/')
#整体复制文件夹
shutil.copytree('./copyfiles/','./copyfiles01/')
#移动文件
shutil.move('./copyfiles01/copy01.txt','./copyfiles/copy02.txt')
#整体移动目录,移动目录本身
shutil.move('./copyfiles01/','./copyfiles/')

在os模块里,os.rmdir方法和os.removedirs方法都要求被删除的目录非空,否则会报错。而shutil.rmtree方法不管目录是否非空,都直接删除整个目录。

#删除整个目录
shutil.rmtree('./copyfiles/copyfiles01/')
#删除单个文件
import os
os.unlink('./copy01.txt')
#压缩
#参数分别为(保存)压缩包路径及名称,格式,要压缩文件的路径
shutil.make_archive('./压缩包','zip',base_dir='./copyfiles/')

更多参数可以直接网上搜,这应该够用了

#解压
#压缩包路径及名称,解压至指定文件夹
shutil.unpack_archive('./压缩包.zip','./解压文件')

文件查找

glob

glob是Python自带的一个文件操作相关模块,用它可以查找符合条件的文件。

import glob
#匹配条件,*匹配任意个字符,?匹配单个字符,[]匹配指定范围字符如[0-9]
glob.glob('*.txt')

在这里插入图片描述

fnmatch

fnmatch也是Python自带的库,是专门用来进行文件名匹配的模块,使用它可以完成更为复杂的文件名匹配。

#找出目标文件夹里所有结尾带数字的文件
import os,fnmatch
for foldName,subfolders,filenames in os.walk('./'):for filename in filenames:if fnmatch.fnmatch(filename,'*[0-9].*'):print(filename)

在这里插入图片描述
fnmatchcase和fnmatch函数类似,只是fnmatchcase函数强制区分字母大小写。

以上两个函数都返回True或者False,filter函数则返回匹配的文件名列表。

fileList=[]
for foldName,subfolders,filenames in os.walk('./'):for filename in filenames:fileList.append(filename)
print('fileList:\n',fileList)
print(fnmatch.filter(fileList,'*[0-9].*'))

在这里插入图片描述

hashlib

如果要找出重复文件,重复文件可能有不同的文件名,不能简单用文件名和文件大小来判断。从科学角度,最简单的办法就是通过MD5来确定两个文件是不是一样的。
Python自带的hashlib库里提供了获取文件MD5值的方法。

import hashlib
m=hashlib.md5()
f=open('./python_zen.txt','rb')
m.update(f.read())
f.close()
md5_value=m.hexdigest()
print(md5_value)

在这里插入图片描述

#文件树状图
import os
def filetree(path,depth):if depth==0:print('文件夹:'+path)for file in os.listdir(path):print('|    '*depth+'+--'+file)directory=path+'/'+fileif os.path.isdir(directory):filetree(directory,depth+1)
filetree('./',0)

在这里插入图片描述

# 手动随意创建一个空文件夹,删除空文件夹
import os,shutil
path='./'
for file in os.listdir(path):directory=path+fileif os.path.isdir(directory) and len(os.listdir(directory))==0:print(directory,os.listdir(directory))shutil.rmtree(directory)
# 删除重复文件
import os,shutil,hashlib
path='./重复文件'
list=[]
print('重复文件文件夹内容:')
for foldName,subfolders,filenames in os.walk(path):for filename in filenames:print(foldName,filename)
print('重复文件为:')
for file in os.listdir(path):fileName=path+'/'+filem=hashlib.md5()with open(fileName,'rb') as mfile:m.update(mfile.read())md5_value=m.hexdigest()if md5_value in list:print(fileName)os.unlink(fileName)#删除重复文件else:list.append(md5_value)

在这里插入图片描述

相关内容

热门资讯

公募加仓非银金融,后市机会如何... 基金增配保险、券商股。 最新数据显示,公募基金2025年四季度的非银金融仓位提高1个百分点。继有色金...
赵慧芳主任中医治疗产后“月子病... 赵慧芳主任中医治疗产后“月子病”的临床智慧 产后调理是中华民族传承千年的养生智慧,在中医理论中占据重...
江西万年青水泥股份有限公司20... 本公司及董事会全体成员保证信息披露的内容真实、准确、完整,没有虚假记载、误导性陈述或重大遗漏。 一、...
科学应对甲状腺结节,别让“结节... 随着健康意识的提升 超声检查在体检中普及率不断提高 甲状腺结节的检出率也显著上升 不少人拿着“结节”...
春节前,政府债发行提速 来源:郁言债市 01 1月资金面,两轮波动,中枢平稳 回顾开年以来资金利率走势,月内资金经历两轮波动...
【央行多措并举护航,专家预期节... 【央行多措并举护航,专家预期节前流动性保持充裕】1月29日,中国人民银行以固定利率、数量招标方式开展...
季节性因素叠加市场需求不足,1... 来源:界面新闻 记者 辛圆 国家统计局周六公布数据显示,1月份,中国制造业采购经理人指数(PM...
广东高乐股份有限公司2025年... 本公司及董事会全体成员保证公告内容的真实、准确、完整,不存在虚假记载、误导性陈述或者重大遗漏。 一、...
将连续4年巨亏!存量游戏流水下... 1月30日晚间,凯撒文化(002425)发布2025年业绩预告,公司预计2025年度归母净利润约亏损...
国家统计局:制造业生产保持扩张 来源:第一财经 国家统计局服务业调查中心首席统计师霍丽慧解读2026年1月中国采购经理指数,制造业采...
行业软件公司SEO方案,如何高... 终于,我把那台用了五年的电脑砸了。 屏幕碎得跟我的心情一样。就因为一个SEO方案。 我是做纺织ERP...
千人样本调查|你接受预制年夜饭... 春节临近,年夜饭是阖家团圆的核心仪式,前几年开始流行半成品类的年夜饭预制菜,公开数据显示,2025年...
银价推涨光伏组件报价,下游企业... 来源:第一财经 受成本端银价上涨影响,本周光伏组件价格再次上调。据行业机构Infolink Cons...
黄金史诗级暴跌,原因可能与一纸... 当地时间1月30日,随着美联储前理事凯文·沃什(Kevin Warsh)正式被美国总统特朗普提名为下...
深圳国资七亿下场扫货白石洲? 来源:市场资讯 (来源:深圳房产在线) 最近看到,近日一则消息引发关注,就是今年1月发生一宗白石洲大...
国投智能2025业绩承压 AI... 来源:财联社 财联社1月30日讯(记者 方彦博)2025年,AI应用的商业化落地是众多AI企业面临的...
原创 男... 在爱情的海洋中,星座的波涛有时能揭示出隐藏的情感暗流。当男人在愤怒的风暴中显露出四种迹象时,或许他并...
农业银行董事长谷澍会见英格兰银... 来源:市场资讯 来源:中国农业银行 1月29日,农业银行董事长谷澍会见了英格兰银行副行长兼英国审慎监...
“易中天”,业绩大爆发!需求增... “易中天”2025年度业绩持续爆发! 1月30日晚间,中际旭创发布2025年度业绩预告,预计2025...
双平台战略提速:仙乐健康谋“A... 中国营养健康食品行业的龙头企业仙乐健康,在1月30日向市场投下了一枚重磅消息:公司已正式向香港联交所...