Py学习  »  Python

跟小白学Python数据分析——批量提取PDF表格数据

小蚊子数据分析 • 5 年前 • 833 次点击  

我们现在有一份PDF数据,里面有三页,每页都有一样数据结构但数据不同的数据表,现在需要使用Python将它批量提取出来


长按识别下方二维码,并关注公众号

回复“PDF”获取案例数据


上回已经介绍了使用pdfplumber模块提取PDF表格数据,还没学习的请点击 跟小白学Python数据分析——提取PDF表格数据 今天我们继续使用它,只需要在上回的基础上使用for循环即可。
有了上回经验,我们就直接上代码:
 1import pdfplumber
2import pandas as pd
3
4# 创建一个空数据框
5df = pd.DataFrame()
6
7# 使用with语句打开pdf文件
8with pdfplumber.open("D:\\python\\cai\\5.pdf"as pdf:
9    # 使用for循环遍历每个pages
10    for page in pdf.pages:
11        # 取出当前页表格,结果为列表
12        d=page.extract_table()
13        # 将列表转为数据框
14        df1 = pd.DataFrame(d[1:], columns=d[0]) 
15        #添加至df数据框中
16        df = df.append(df1)

执行代码后,将得到了df数据框


是不是so easy 呢?


如果你喜欢本文,可以点击右下角在看
如果你在跟着学习,请在留言区留言:打卡
如果你刚看到本文,可以查看本系列历史文章跟着学习:
跟小白学Python数据分析——Anaconda安装
跟小白学Python数据分析——使用spyder
跟小白学Python数据分析——数据导入1
跟小白学Python数据分析——数据导入2

跟小白学Python数据分析——描述性统计分析

跟小白学Python数据分析——分组分析

跟小白学Python数据分析——列表

跟小白学Python数据分析——数据框

跟小白学Python数据分析——记录抽取

跟小白学Python数据分析——记录合并

跟小白学Python数据分析——数据导出

跟小白学Python数据分析——For循环

跟小白学Python数据分析——批量合并CSV文件

跟小白学Python数据分析——批量拆分Excel文件

跟小白学Python数据分析——提取PDF表格数据

-----------------

希望系统、快速学习Python数据分析知识,可以学习

数据分析专家@文彤老师

跟文彤老师学Python数据分析》系列视频课程

包含以下三门课程

Python数据分析--玩转Pandas

Python数据分析--玩转数据可视化

玩转Python统计分析


以上顺序也是学习的建议顺序

课程提供讲义(含代码)与数据供练习

学习过程有问题可加Q群与老师交流讨论

如还有其他问题也可添加课程助理微信号咨询,添加时请注明所咨询的课程

参加课程学习,可享受6折优惠

购买课程直接点击文末“ 阅读原文”进入即可

  

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/62925