Py学习  »  Python

Python提取PDF文件中的表格文本保存为Excel文件

Python小屋 • 3 年前 • 417 次点击  
“Python小屋”编程比赛正式开始

推荐图书:

《Python程序设计(第3版)》,(ISBN:978-7-302-55083-9),董付国,清华大学出版社,2020年6月第1次印刷,2021年1月第6次印刷

京东购买链接:https://item.jd.com/12668739.html

天猫、当当均有销售,可以选择自己常用平台搜索“董付国 第3版”找到本书。
配套资源:教学大纲、电子教案、微课视频、PPT课件、例题源码、习题答案、考试系统。
《Python程序设计(第3版)》配套教学大纲
《Python程序设计(第3版)》课后习题答案

=======================

问题描述:

提取PDF文件中的表格文字,保存为Excel文件,PDF中每个表格的文本写入Excel文件中的一个工作表。

操作步骤:

1、创建Word文件,测试内容如下,共2页,第1页中有两个表格,并且第一个表格中有合并单元格,第2页中有一个表格。

2、把Word文件转换为PDF文件。

3、安装扩展库pdfplumber

4、编写代码。

5、运行程序,得到Excel文件。



温馨提示:
关注微信公众号“Python小屋”,在公众号后台发送消息“大事记”可以查看董付国老师与Python有关的重要事件;发送消息“教材”可以查看董付国老师出版的Python系列教材(已累计印刷超过115次)的适用专业详情;发送消息“历史文章”可以查看董付国老师推送的超过1000篇原创技术文章;发送消息“会议”或“培训”可以查看近期董付国老师的培训安排;发送消息“微课”可以查看董付国老师免费分享的超过500节Python微课视频;发送消息“课件”可以查看董付国老师免费分享的Python教学资源;发送消息“小屋刷题”可以下载“Python小屋刷题神器”,免费练习1318道客观题和178道编程题,题库持续更新;发送消息“编程比赛”了解Python小屋编程大赛详情。
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/106489
 
417 次点击