Py学习  »  Python

重磅新书 |《Python 数据分析基础(第2版)》—“十三五”全国统计规划教材首本出炉

狗熊会 • 5 年前 • 512 次点击  

点击关注了解更多精彩内容!!

阮敬   编著 ▍

Python 数据分析基础

第2版

Elements of Data Analytics Using Python

2nd Edition


“十三五” 全国统计规划教材  本教材正式出炉 


写在前面的话:

今天小编跟大家分享一本刚刚上市的重磅新书《Python数据分析基础》(第2版)。不同于市面上的大多数入门或者教授语法的python书籍,该书是十三五全国统计规划教材正式出版的首本教材。该书从统计和数据分析的视角出发,由浅入深层层递进,帮助读者们建立起完整数据分析的思维方式并get到数据分析和软件应用的能力。书中通过丰富的案例和详尽的解析,让原本艰深的编程语言学习和理论领悟变得更通俗易懂,是一本非常值得pick的书籍。

内容简介

数据来源:KDnuggests

如上图,势不可挡的 python已经成为世界上最受欢迎的编程语言;摩根大通发表评论说不懂编程就是文盲!那么该如何玩转风靡全宇宙的 python呢?不用等了,《Python数据分析基础》(第2版)直接了当的给你全部答案!

该书通过真实案例,全面介绍python3编程基础及其数据分析工具的应用,培养读者通过数据提出问题、分析问题、解决问题以及对分析结果评价的能力。

全书内容包括:Python 3 基本配置和编程基础、面向对象编程及并行处理、数据预处理、数据描述与可视化、统计推断、相关分析、关联分析、回归分析、主成分和因子分析、聚类、判别与分类、列联分析、对应分析、定性数据分析、时间序列分析、神经网络与深度学习等,将数据分析工作中的基本理论、方法和应用进行深入剖析。

《Python数据分析基础》(第2版)

中国统计出版社,2018年9月


第1版简介

该书的前一版的编写主要以文字阐述替代复杂公式推导,深入浅出剖析数据分析方法的基本原理和步骤,重点在于厘清数据分析的基本思路,合理得到恰当的分析结果。在分析过程中,基于python 2.7,从基础编程入手,主要通过调用python基本库和常用工具库的方式(对于部分特殊分析方法手把手教会读者自行编制算法),用大量的实例来展示数据分析每一步骤的细节。

本版(第2版)修订内容

现行第2版本在第1版的优点和特色的基础上,适应社会对数据分析需求的变化,做了许多优化、改进和创新,具体内容如下:

01

全书基于 python 3.6 对全部内容进行了更新。

02

将第1版的编程基础部分根据教学难度和教学要求调整为两个章节。即第1章强调编程基础,第2章强调编程的高级技能,并补充了类特性、异常捕获与容错处理、并行计算等编程的进阶内容。

03

增加了“神经网络与深度学习” 章节。深度学习是当前数据科学、人工智能领域较为热门的研究内容,第2版增加了对神经网络和深度学习基本思想、基本框架以及基本步骤的介绍,以及如何利用python 提供的 tensorflow 框架工具进行解决实际问题的案例,帮助读者理解深度学习的理论基础和基本算法。

04

可读和易用性进一步提高。本书第1版在去年9月份正式出版之后,被全国几十所高等院校采纳为基础课、专业课和选修课的教材。经过多次与授课教师和学生的沟通交流及意见反馈,第2版针对教学过程中的突出问题进行了仔细斟酌和调整,力争使得本书内容更加生动、深入浅出和言简意赅。

05

第2版除了继续提供书中案例数据(请访问中国统计出版社官网www.zgtjcbs.com 下载),同时还为教师读者提供python编程基础和编程进阶章节的课程课件PPT(请教师读者自行联系作者索取)。

适用读者

本书既可作为高等院校数据科学与大数据技术、统计学及相关专业本科生和专业硕士与低年级学术型研究生的编程类、数据分析类课程教材,也可作为社会科学领域数据分析的自学教材,同时还可以作为从事数据分析与管理工作的参考用书,也适合想用python来解决实际数据分析问题的工程技术和管理人员。

作者简介




阮敬博士,教授,博士生导师。现任首都经济贸易大学研究生院副院长,北京市丰台区政协委员。兼任中国现场统计研究会经济与金融统计分会副理事长、中国统计教育学会常务理事兼高等教育分会秘书长、中国商业统计学会常务理事、北京大数据协会副秘书长等职。近年来主持国家级、省部级以及世界500强企业和国家部委等数据分析项目50余项。国内外发表论文50余篇,出版专著译著和教材8部,先后12次荣获全国应用统计专业学位研究生教育指导委员会优秀教学成果奖、全国统计科学研究优秀成果奖、北京市哲学社会科学优秀成果奖、北京市统计科学研究优秀成果奖等科研和教学奖励。

十三五”全国统计规划教材出版前言(节选)

全国统计教材编审委员会成立于1988年,是国家统计局领导下的全国统计教材建设工作的最高指导机构和咨询机构。自编审委员会成立以来,分别制定并实施了“七五”至“十三五”全国统计教材建设规划,这些规划教材被全国各院校师生广泛使用,对中国的统计和教育事业做出了积极贡献。本轮规划教材将以全新的面貌和更积极的精神,继续服务全国院校师生。

……

围绕新时代中国特色社会主义教育事业和统计事业新特点,全国统计教材编审委员会将组织编写和出版适应新时代特色、高质量、高水平的优秀统计规划教材,以培养出应用型、复合型、高素质、创新型的统计人才。

……

本轮规划教材要把编写大数据内容统计规划教材作为重点工作,以培养新一代适应大数据时代需要的统计人才。

为了适应新时代对统计人才的需要,组织编写出版高质量、高水平教材,本轮规划教材在组织编写和出版中,将坚持以下原则:

1、坚持质量第一的原则。

2、坚持高水平原则。

3、坚持创新的原则。

4、坚持多层次、多样性规划的原则。

5、坚持教材编写与教材研讨并重的原则。

6、坚持创品牌、出精品、育经典的原则。

7、坚持向国际优秀统计教材学习和看齐的原则。

8、坚持积极利用新的教学方式和教学科技成果的原则。

总之,全国统计教材编审委员会将不忘初心,牢记使命,积极组织各院校统计专家学者参与编写和评审本轮规划教材,虚心听取读者的积极建议,努力组织编写出版好本轮规划教材,使本轮规划教材能够在以往的基础上,百尺竿头,更进一步,为我国的统计和教育事业做出更大贡献。

国家统计局

全国统计教材编审委员会

全书目录

第 1 章 Python 编程基础 ......001

1.1 Python 系统配置 ......001

1.2 Python 基础知识 ......006

           1.2.1 帮助 …... 006

           1.2.2 标识符 …… 007

           1.2.3 行与缩进 …… 007

           1.2.4 变量与对象 ……008

           1.2.5 数字与表达式 …… 010

           1.2.6 运算符 ……011

           1.2.7 字符串 …...012

1.3 数据结构与序列 ......020

    1.3.1 列表 ……021

           1.3.2 元组 ……024

           1.3.3 字典 ……025

           1.3.4 集合 ……027

           1.3.5 推导式 ……028

1.4 语句与控制流 ......029

           1.4.1 条件语句 …… 029

           1.4.2 循环语句 …… 031

1.5 函数 ......035

           1.5.1 函数的参数 …… 035

           1.5.2 全局变量与局部变量 …… 036

           1.5.3 匿名函数 …… 037

           1.5.4 递归和闭包 …… 038

           1.5.5 柯里化与反柯里化 …… 039

           1.5.6 常用的内置高阶函数 …… 040

      1.6 迭代器、生成器和装饰器 ......041

           1.6.1 迭代器 …… 041

           1.6.2 生成器 …… 042

           1.6.3 装饰器 …… 044

第 2 章 Python 编程进阶 .....047

2.1 类 ......047

            2.1.1 声明类 …… 047

            2.1.2 方法 …… 049

            2.1.3 属性 …… 052

            2.1.4 继承 …… 054

            2.1.5 特性 …… 060

2.2 异常捕获与容错处理 ......064

           2.2.1 错误和异常 …… 064

           2.2.2 异常处理 …… 066

2.3 模块 ......069

2.4 包 ......070

            2.4.1 包的组成与调用 …… 071

            2.4.2 常用数据分析工具库 …… 071

2.5 文件 I/O ......074

2.6 多核并行计算 ......077

            2.6.1 多进程 …… 078

            2.6.2 并行 …… 081

第3章 数据预处理 .....084

3.1 numpy 基础 ......084

            3.1.1 向量 …… 086

            3.1.2 数组 …… 088

3.2 pandas 基础 ......109

            3.2.1 pandas 的数据结构…… 109

            3.2.2 pandas 的数据操作…… 123

第4章 数据描述 .....148

4.1 统计量 ......148

            4.1.1 集中趋势…… 148

            4.1.2 离散程度 …… 152

            4.1.3 分布形状 …… 154

4.2 统计表 ......156

            4.2.1 统计表的基本要素 …… 156

            4.2.2 统计表的编制 …… 157

第5章 统计图形与可视化 ......161

5.1 matplotlib 基本绘图 ......161

            5.1.1 函数绘图 …… 161

            5.1.2 图形基本设置 …… 166

            5.1.3 面向对象绘图 …… 172

            5.1.4 绘图样式…… 174

5.2 pandas 基本绘图 ......174

5.3 基本统计图形 ......176

           5.3.1 折线图 …… 177

           5.3.2 面积图 …… 179

           5.3.3 直方图 …… 179

           5.3.4 条形图 …… 181

           5.3.5 龙卷风图 …… 184

           5.3.6 饼图 …… 185

           5.3.7 阶梯图 …… 186

           5.3.8 盒须图 …… 187

           5.3.9 小提琴图 …… 189

           5.3.10 散点图 …… 190

           5.3.11 气泡图 …… 192

           5.3.12 六边形箱图 …… 193

           5.3.13 雷达坐标图 …… 194

           5.3.14 轮廓图 …… 195

           5.3.15 调和曲线图 …… 195

           5.3.16 等高线图 …… 196

           5.3.17 极坐标图 …… 196

           5.3.18 词云图 …… 197

           5.3.19 数据地图 …… 200

5.4 其他绘图工具 ......202

第6章 简单统计推断 ......204

6.1 简单统计推断的基本原理 ......204

            6.1.1 数据分布 …… 204

            6.1.2 参数估计 …… 207

            6.1.3 假设检验 …… 209

6.2 单总体参数估计及假设检验 ......213

           6.2.1 单总体的参数估计…… 213

           6.2.2 单总体参数的假设检验 …… 215

6.3 两总体参数的假设检验 ......218

           6.3.1 独立样本的假设检验 …… 219

           6.3.2 成对样本的假设检验 …… 222

第7章 方差分析 ......225

7.1 方差分析的基本原理 ......225

7.2 一元方差分析 ......229

    7.2.1 一元单因素方差分析 …… 229

    7.2.2 一元多因素方差分析 …… 234

7.3 协方差分析 ......241

第8章 非参数检验 ......244

8.1 非参数检验的基本问题 ......244

8.2 单样本非参数检验 ......244

            8.2.1 中位数 (均值)的检验 …… 245

            8.2.2 分布的检验 …… 247

            8.2.3 游程检验 …… 248

8.3 两个样本的非参数检验 ......249

     8.3.1 独立样本中位数比较的 Wilcoxon 秩和检验 …… 249

            8.3.2 独立样本的分布检验 …… 251

            8.3.3 成对(匹配)样本中位数的检验 …… 252

            8.3.4 两样本的游程检验 …… 252

8.4 多个样本的非参数检验 ......253

            8.4.1 多个样本的分布检验 …… 253

            8.4.2 独立样本位置的检验 …… 254

第9章 相关分析与关联分析 ......257

9.1 相关分析 ......257

            9.1.1 函数关系与相关关系 …… 257

            9.1.2 简单相关分析 …… 258

            9.1.3 偏相关分析 …… 262

            9.1.4 点二列相关分析 …… 263

            9.1.5 非参数相关分析 …… 264

9.2 关联分析 ......267

            9.2.1 基本概念与数据预处理 …… 267

            9.2.2 Apriori 算法 …… 269

            9.2.3 FP-growth 算法 …… 273

第10章 回归分析 ......275

10.1 线性回归 ......275

             10.1.1 回归分析的基本原理 …… 275

             10.1.2 一元线性回归 …… 279

             10.1.3 多元线性回归 …… 286

             10.1.4 含有定性自变量的线性回归 …… 290

10.2 非线性回归 ......294

             10.2.1 可线性化的非线性分析 …… 294

             10.2.2 非线性回归模型 …… 297

10.3 多项式回归 ......300

10.4 分位数回归 ......303

第11章 离散因变量模型 ......309

11.1 线性概率模型 ......309

11.2 二元选择模型 ......311

            11.2.1 线性概率模型的缺陷与改进 …… 311

            11.2.2 二元选择模型的基本原理 …… 311

            11.2.3 BINARY PROBIT 模型 …… 313

            11.2.4 BINARY LOGIT 模型 …… 317

11.3 多重选择模型......319

11.4 计数模型 ......322

第12章 主成分与因子分析 ......325

12.1 数据降维 ......325

             12.1.1 数据降维的基本问题 …… 325

             12.1.2 数据降维的基本原理 …… 326

12.2 主成分分析 ......327

             12.2.1 主成分分析的基本概念与原理 …… 327

             12.2.2 主成分分析的基本步骤和过程 …… 328

12.3 因子分析 ......328

             12.3.1 因子分析的基本原理 …… 337

             12.3.2 因子分析的基本步骤和过程 …… 339

第13章 列联分析与对应分析 ......350

13.1 列联分析 ......350

             13.1.1 列联表 …… 350

             13.1.2 列联表的分布 …… 353

             13.1.3 χ2分布与χ2检验…… 354

             13.1.4 χ2分布的期望值准则 …… 355

13.2 对应分析 ......356

             13.2.1 对应分析的基本思想 …… 356

             13.2.2 对应分析的步骤和过程 …… 357

第14章 聚类 ......369

14.1 聚类的基本原理 ......369

             14.1.1 聚类的基本原则 …… 370

             14.1.2 单一指标的系统聚类过程 …… 371

             14.1.3 多指标的系统聚类过程 …… 373

14.2 聚类的步骤和过程 ......378

             14.2.1 系统聚类 …… 378

             14.2.2 K-MEANS 聚类 …… 384

             14.2.3 DBSCAN 聚类 …… 385

第15章 判别与分类 ......387

15.1 判别和分类的基本思想 ......387

             15.1.1 判别 …… 387

             15.1.2 分类 …… 388

             15.1.3 效果评估 …… 389

15.2 常用判别方法和分类算法  ......390

             15.2.1 距离判别和线性判别 …… 390

             15.2.2 贝叶斯判别 …… 396

             15.2.3  k-近邻…… 398

             15.2.4 决策树 …… 400

             15.2.5 随机森林 …… 405

             15.2.6 支持向量机 …… 407

第16章 神经网络与深度学习 ......410

16.1 神经网络 ......410

             16.1.1 基本概念与原理 …… 410

             16.1.2 感知机 …… 412

             16.1.3 多层神经网络 …… 415

16.2 深度学习 ......419

             16.2.1 基本概念与原理…… 419

             16.2.2 卷积神经网络 …… 420

             16.2.3 Tensorflow …… 423

第17章 时间序列分析 ......438

17.1 时间序列的基本问题 ......438

            17.1.1 时间序列的组成部分 …… 438

            17.1.2 时间序列的平稳性 …… 440

      17.2 ARIMA 模型的分析过程 ......445

            17.2.1 ARIMA 模型…… 445

           17.2.2 ARMA 模型的识别、估计与预测…… 446

附录:各章图形(彩图) ......455


该书已经正式上市京东自营,

点击下面的阅读原文尽情订购吧!


-The end-



直达京东自营优惠订购此书!


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/csKVJf84dQ
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/26659
 
512 次点击