社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

案例加源码,Python批量合并pdf文件

蚂蚁学Python • 2 年前 • 654 次点击  

1、准备一个要合并的目录

里面可以放很多个PDF文件,一两个可以,一两百也不算多

2、安装基础库PyPDF2

命令:

 pip install pypdf2
 -i https://pypi.tuna.tsinghua.edu.cn/simple

3、编写代码

import os
from PyPDF2 import PdfReader, PdfWriter

input_dir = "待合并PDF文档"
output = PdfWriter()
for file in os.listdir("待合并PDF文档"):
    print("合并文件:", file)
    file_path = os.path.join(input_dir, file)
    input = PdfReader(open(file_path, "rb"))
    pageCount = len(input.pages)
    for iPage in range(pageCount):
        output.add_page(input.pages[iPage])

with open("合并的python文档.pdf""wb"as outputfile:
    # 注意这里的写法和正常的上下文文件写入是相反的
    output.write(outputfile)

有几点语法解释:

  1. os.listdir,可以扫描这个目录下的所有文件
  2. os.path.join,可以实现目录和文件路径的拼接
  3. PdfReader、可以读取一个pdf文件
  4. PdfWriter、可以生成一个pdf文件
  5. len(input.pages),用于获得pdf reader得到的页数
  6. output.add_page,可以给pdf writer添加pdf内容

4、运行代码

得到结果文档:

5、代码地址:

https://gitee.com/antpython/ant-codes-publish/tree/master/%E6%89%B9%E9%87%8F%E5%90%88%E5%B9%B6pdf%E6%96%87%E4%BB%B6

6、蚂蚁老师的全套课程

长按图片扫码购买,蚂蚁老师提供答疑服务


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/152433