社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

Python 办公自动化|自动整理文件,一键完成!

AirPython • 5 年前 • 533 次点击  

大家好,又到了 Python 办公自动化专题,本文跟大家分享一个文件整理脚本的实现过程。


具体的功能很简单,给定一个打算整理的文件夹目录,这个脚本可以将该目录下的 所有文件 都揪出来,并且根据后缀名归类到不同的文件夹里,就像下图一样,简直是整理爱好者的福音



通过本例还可以学到:osglobshutil三个标准库的综合运用


现在让我们一起来捋一捋实现的逻辑


首先是导入需要的依赖库


import os
import shutil
import glob

os 库可以完成操作系统层面大量操作,例如文件夹的创建、移动、重命名、删除等,有些功能实现的不是很完美,就用到shutil库跟其互补了,例如文件的复制、移动等。glob库可以利用通配符进行文件的搜索 获取,非常强大

# 设置建立分类总文件夹的路径,这里按自己的实际路径修改
mkdir_path = r'C:\Users\chenx\文件夹分类'
# 设置需要遍历整理的文件夹路径,可以依据自己的实际需求修改
goal_dir = r'C:\xxxxxxxx)'

if not os.path.exists(mkdir_path):
    os.mkdir(mkdir_path)


os.mkdir可以在指定路径创建文件夹,但如果文件夹已经存在则会报错,因此谨慎一点可以利用 os.path.exists 先对文件夹的存在与否进行判断


接下来是代码核心循环,为了方便理解先简化成如下形式:


for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
    if os.path.isfile(file):
        print(file)


glob.glob(f'{goal_dir}/**/*', recursive=True) 中 **/* 通配符的重要用法,* 可以代表任意个字符,包括 0 个字符,recursive参数的设置确保遍历


由于需要 找出所有的文件而非文件夹,这里用 os.path.isfile 进行判断。


最后可以输出文件的绝对路径先看看代码有没出现错误,让我们继续往下写





    
for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
    if os.path.isfile(file):
        filename = os.path.basename(file)
        if '.' in filename:
            suffix = filename.split('.')[-1]
        else:
            suffix = 'others'


这里发生了什么呢?


确认遍历到的是文件后,先用 os.path.basename 获取绝对路径中的文件名,接下来就是获取后缀名了


可以简单用 split 根据 . 将字符串 “劈开”,然后取最后一个元素就是后缀名了


需要注意的是,这里必须要考虑一个特殊情况:有些文件没有后缀名(文件类型就叫文件),且名字中也没有.,这时用字符串方法 split 就会报错。


如下图:



因此需要先判断文件中有没有.


由于我们是利用后缀名建立文件夹,所以索性将文件名中没有.的 文件 类型统一分类到others文件夹了


这个实现逻辑大致上没有问题,但是依然忽略了一种极端情况:有些文件没有后缀名,且文件名中有个.,哈哈哈哈这种就会被上面的实现逻辑拆解出错误的后缀名了;更好的方法是有个函数可以直接获取文件的后缀名,利用这个对文件进行分类,感兴趣的读者可以自己尝试


接下来就可以根据后缀名产生文件夹了,这里依然要注意先判断文件夹是否已经产生


for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
    if os.path.isfile(file):
        filename = os.path.basename(file)
        if '.' in filename:
            suffix = filename.split('.')[-1]
        else:
            suffix = 'others'
        if not os.path.exists(f'{mkdir_path}/{suffix}'):
            os.mkdir(f'{mkdir_path}/{suffix}')
        shutil.copy(file, f'{mkdir_path}/{suffix}')


为了避免移动文件夹而造成的异常,尤其是系统盘,因此这里用的是复制。按照需要也可以换成 shutil.move 最后我们可以加上分类文件夹和所有文件的计数并输出


完整代码如下:


import os
import shutil
import glob

mkdir_path = r'C:\Users\chenx\文件夹分类'
goal_dir = r'C:\xxxxxxxx'

if not os.path.exists(mkdir_path):
    os.mkdir(mkdir_path)

file_num = 0
dir_num = 0

for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
    if os.path.isfile(file):
        filename = os.path.basename(file)
        if '.' in filename:
            suffix = filename.split('.')[-1]
        else:
            suffix = 'others'
        if not os.path.exists(f'{mkdir_path}/{suffix}'):
            os.mkdir(f'{mkdir_path}/{suffix}')
            dir_num += 1
        shutil.copy(file, f'{mkdir_path}/{suffix}')
        file_num += 1

print(f'整理完成,有{file_num}个文件分类到了{dir_num}个文件夹中')





推荐阅读


介绍一种 Python 更方便的爬虫代理池实现方案

黑科技 | 美好的一天,就应该以这款自动化应用脚本开始

如何结合爬虫与自动化,帮助小姐姐刷抖音完全解放掉双手




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/71305