第 1 章 Python 编程基础 ......001
1.1 Python 系统配置 ......001
1.2 Python 基础知识 ......006
1.2.1 帮助 …... 006
1.2.2 标识符 …… 007
1.2.3 行与缩进 …… 007
1.2.4 变量与对象 ……008
1.2.5 数字与表达式 …… 010
1.2.6 运算符 ……011
1.2.7 字符串 …...012
1.3 数据结构与序列 ......020
1.3.1 列表 ……021
1.3.2 元组 ……024
1.3.3 字典 ……025
1.3.4 集合 ……027
1.3.5 推导式 ……028
1.4 语句与控制流 ......029
1.4.1 条件语句 …… 029
1.4.2 循环语句 …… 031
1.5 函数 ......035
1.5.1 函数的参数 …… 035
1.5.2 全局变量与局部变量 …… 036
1.5.3 匿名函数 …… 037
1.5.4 递归和闭包 …… 038
1.5.5 柯里化与反柯里化 …… 039
1.5.6 常用的内置高阶函数 …… 040
1.6 迭代器、生成器和装饰器 ......041
1.6.1 迭代器 …… 041
1.6.2 生成器 …… 042
1.6.3 装饰器 …… 044
第 2 章 Python 编程进阶 .....047
2.1 类 ......047
2.1.1 声明类 …… 047
2.1.2 方法 …… 049
2.1.3 属性 …… 052
2.1.4 继承 …… 054
2.1.5 特性 …… 060
2.2 异常捕获与容错处理 ......064
2.2.1 错误和异常 …… 064
2.2.2 异常处理 …… 066
2.3 模块 ......069
2.4 包 ......070
2.4.1 包的组成与调用 …… 071
2.4.2 常用数据分析工具库 …… 071
2.5 文件 I/O ......074
2.6 多核并行计算 ......077
2.6.1 多进程 …… 078
2.6.2 并行 …… 081
第3章 数据预处理 .....084
3.1 numpy 基础 ......084
3.1.1 向量 …… 086
3.1.2 数组 …… 088
3.2 pandas 基础 ......109
3.2.1 pandas 的数据结构…… 109
3.2.2 pandas 的数据操作…… 123
第4章 数据描述 .....148
4.1 统计量 ......148
4.1.1 集中趋势…… 148
4.1.2 离散程度 …… 152
4.1.3 分布形状 …… 154
4.2 统计表 ......156
4.2.1 统计表的基本要素 …… 156
4.2.2 统计表的编制 …… 157
第5章 统计图形与可视化 ......161
5.1 matplotlib 基本绘图 ......161
5.1.1 函数绘图 …… 161
5.1.2 图形基本设置 …… 166
5.1.3 面向对象绘图 …… 172
5.1.4 绘图样式…… 174
5.2 pandas 基本绘图 ......174
5.3 基本统计图形 ......176
5.3.1 折线图 …… 177
5.3.2 面积图 …… 179
5.3.3 直方图 …… 179
5.3.4 条形图 …… 181
5.3.5 龙卷风图 …… 184
5.3.6 饼图 …… 185
5.3.7 阶梯图 …… 186
5.3.8 盒须图 …… 187
5.3.9 小提琴图 …… 189
5.3.10 散点图 …… 190
5.3.11 气泡图 …… 192
5.3.12 六边形箱图 …… 193
5.3.13 雷达坐标图 …… 194
5.3.14 轮廓图 …… 195
5.3.15 调和曲线图 …… 195
5.3.16 等高线图 …… 196
5.3.17 极坐标图 …… 196
5.3.18 词云图 …… 197
5.3.19 数据地图 …… 200
5.4 其他绘图工具 ......202
第6章 简单统计推断 ......204
6.1 简单统计推断的基本原理 ......204
6.1.1 数据分布 …… 204
6.1.2 参数估计 …… 207
6.1.3 假设检验 …… 209
6.2 单总体参数估计及假设检验 ......213
6.2.1 单总体的参数估计…… 213
6.2.2 单总体参数的假设检验 …… 215
6.3 两总体参数的假设检验 ......218
6.3.1 独立样本的假设检验 …… 219
6.3.2 成对样本的假设检验 …… 222
第7章 方差分析 ......225
7.1 方差分析的基本原理 ......225
7.2 一元方差分析 ......229
7.2.1 一元单因素方差分析 …… 229
7.2.2 一元多因素方差分析 …… 234
7.3 协方差分析 ......241
第8章 非参数检验 ......244
8.1 非参数检验的基本问题 ......244
8.2 单样本非参数检验 ......244
8.2.1 中位数 (均值)的检验 …… 245
8.2.2 分布的检验 …… 247
8.2.3 游程检验 …… 248
8.3 两个样本的非参数检验 ......249
8.3.1 独立样本中位数比较的 Wilcoxon 秩和检验 …… 249
8.3.2 独立样本的分布检验 …… 251
8.3.3 成对(匹配)样本中位数的检验 …… 252
8.3.4 两样本的游程检验 …… 252
8.4 多个样本的非参数检验 ......253
8.4.1 多个样本的分布检验 …… 253
8.4.2 独立样本位置的检验 …… 254
第9章 相关分析与关联分析 ......257
9.1 相关分析 ......257
9.1.1 函数关系与相关关系 …… 257
9.1.2 简单相关分析 …… 258
9.1.3 偏相关分析 …… 262
9.1.4 点二列相关分析 …… 263
9.1.5 非参数相关分析 …… 264
9.2 关联分析 ......267
9.2.1 基本概念与数据预处理 …… 267
9.2.2 Apriori 算法 …… 269
9.2.3 FP-growth 算法 …… 273
第10章 回归分析 ......275
10.1 线性回归 ......275
10.1.1 回归分析的基本原理 …… 275
10.1.2 一元线性回归 …… 279
10.1.3 多元线性回归 …… 286
10.1.4 含有定性自变量的线性回归 …… 290
10.2 非线性回归 ......294
10.2.1 可线性化的非线性分析 …… 294
10.2.2 非线性回归模型 …… 297
10.3 多项式回归 ......300
10.4 分位数回归 ......303
第11章 离散因变量模型 ......309
11.1 线性概率模型 ......309
11.2 二元选择模型 ......311
11.2.1 线性概率模型的缺陷与改进 …… 311
11.2.2 二元选择模型的基本原理 …… 311
11.2.3 BINARY PROBIT 模型 …… 313
11.2.4 BINARY LOGIT 模型 …… 317
11.3 多重选择模型......319
11.4 计数模型 ......322
第12章 主成分与因子分析 ......325
12.1 数据降维 ......325
12.1.1 数据降维的基本问题 …… 325
12.1.2 数据降维的基本原理 …… 326
12.2 主成分分析 ......327
12.2.1 主成分分析的基本概念与原理 …… 327
12.2.2 主成分分析的基本步骤和过程 …… 328
12.3 因子分析 ......328
12.3.1 因子分析的基本原理 …… 337
12.3.2 因子分析的基本步骤和过程 …… 339
第13章 列联分析与对应分析 ......350
13.1 列联分析 ......350
13.1.1 列联表 …… 350
13.1.2 列联表的分布 …… 353
13.1.3 χ2分布与χ2检验…… 354
13.1.4 χ2分布的期望值准则 …… 355
13.2 对应分析 ......356
13.2.1 对应分析的基本思想 …… 356
13.2.2 对应分析的步骤和过程 …… 357
第14章 聚类 ......369
14.1 聚类的基本原理 ......369
14.1.1 聚类的基本原则 …… 370
14.1.2 单一指标的系统聚类过程 …… 371
14.1.3 多指标的系统聚类过程 …… 373
14.2 聚类的步骤和过程 ......378
14.2.1 系统聚类 …… 378
14.2.2 K-MEANS 聚类 …… 384
14.2.3 DBSCAN 聚类 …… 385
第15章 判别与分类 ......387
15.1 判别和分类的基本思想 ......387
15.1.1 判别 …… 387
15.1.2 分类 …… 388
15.1.3 效果评估 …… 389
15.2 常用判别方法和分类算法 ......390
15.2.1 距离判别和线性判别 …… 390
15.2.2 贝叶斯判别 …… 396
15.2.3 k-近邻…… 398
15.2.4 决策树 …… 400
15.2.5 随机森林 …… 405
15.2.6 支持向量机 …… 407
第16章 神经网络与深度学习 ......410
16.1 神经网络 ......410
16.1.1 基本概念与原理 …… 410
16.1.2 感知机 …… 412
16.1.3 多层神经网络 …… 415
16.2 深度学习 ......419
16.2.1 基本概念与原理…… 419
16.2.2 卷积神经网络 …… 420
16.2.3 Tensorflow …… 423
第17章 时间序列分析 ......438
17.1 时间序列的基本问题 ......438
17.1.1 时间序列的组成部分 …… 438
17.1.2 时间序列的平稳性 …… 440
17.2 ARIMA 模型的分析过程 ......445
17.2.1 ARIMA 模型…… 445
17.2.2 ARMA 模型的识别、估计与预测…… 446
附录:各章图形(彩图) ......455