有电子版:机器学习的机制(The Mechanics of Machine Learning)
1. 前言
1.1 欢迎!
1.2 这本书适合你吗?
1.3 工具介绍
1.4 你将学到什么
1.5 在线支持材料
1.6 致谢
2. 机器学习是如何工作的
2.1 学会学习:以公寓数据为例
2.2 随机森林回归器
2.3 随机森林分类器
2.4 全景概览
3. 应用机器学习初体验
3.1 计算机环境检查
3.2 预测纽约市公寓租金
3.3 预测乳腺癌
3.4 手写数字分类
3.5 小结
4. 开发工具
4.1 你的机器学习开发环境
4.2 Dataframe 道场
4.3 使用 matplotlib 生成图表
4.4 用 NumPy 表示和处理数据
5. 探索与清洗数据集
5.1 数据初探
5.2 训练并评估初始模型
5.3 探索并清洗公寓租金数据
5.4 比较清洗后数据训练的模型
5.5 登录与输出日志(Log in, exp out)
6. 类别特征的奥秘
6.1 建立基线
6.2 编码类别变量
6.3 从字符串中提取特征
6.4 合成数值特征
6.5 目标编码类别变量
6.6 注入外部邻里信息
6.7 我们的最终模型
6.8 类别特征工程总结
7. 探索与清理推土机数据集
7.1 加载推土机数据
7.2 初步浏览数据
7.3 基线模型
7.4 数据清理
7.5 处理缺失数据
7.6 使用全部特征训练模型
7.7 小结
8. 推土机特征工程
8.1 合成日期相关特征
8.2 ProductSize 是一个有序变量
8.3 对 Hydraulics_Flow 进行独热编码
8.4 对 Enclosure 进行独热编码
8.5 拆分 fiProductClassDesc
8.6 使用 log(price) 进行训练
8.7 特征工程对模型性能的影响
8.8 小结
9. 训练、验证与测试
9.1 测试三部曲
9.2 校正训练集与验证集
9.3 调优随机森林模型
9.4 获取真正的泛化能力衡量
9.5 小结
访问:mlbook.explained.ai/
#人工智能##程序员#
1. 前言
1.1 欢迎!
1.2 这本书适合你吗?
1.3 工具介绍
1.4 你将学到什么
1.5 在线支持材料
1.6 致谢
2. 机器学习是如何工作的
2.1 学会学习:以公寓数据为例
2.2 随机森林回归器
2.3 随机森林分类器
2.4 全景概览
3. 应用机器学习初体验
3.1 计算机环境检查
3.2 预测纽约市公寓租金
3.3 预测乳腺癌
3.4 手写数字分类
3.5 小结
4. 开发工具
4.1 你的机器学习开发环境
4.2 Dataframe 道场
4.3 使用 matplotlib 生成图表
4.4 用 NumPy 表示和处理数据
5. 探索与清洗数据集
5.1 数据初探
5.2 训练并评估初始模型
5.3 探索并清洗公寓租金数据
5.4 比较清洗后数据训练的模型
5.5 登录与输出日志(Log in, exp out)
6. 类别特征的奥秘
6.1 建立基线
6.2 编码类别变量
6.3 从字符串中提取特征
6.4 合成数值特征
6.5 目标编码类别变量
6.6 注入外部邻里信息
6.7 我们的最终模型
6.8 类别特征工程总结
7. 探索与清理推土机数据集
7.1 加载推土机数据
7.2 初步浏览数据
7.3 基线模型
7.4 数据清理
7.5 处理缺失数据
7.6 使用全部特征训练模型
7.7 小结
8. 推土机特征工程
8.1 合成日期相关特征
8.2 ProductSize 是一个有序变量
8.3 对 Hydraulics_Flow 进行独热编码
8.4 对 Enclosure 进行独热编码
8.5 拆分 fiProductClassDesc
8.6 使用 log(price) 进行训练
8.7 特征工程对模型性能的影响
8.8 小结
9. 训练、验证与测试
9.1 测试三部曲
9.2 校正训练集与验证集
9.3 调优随机森林模型
9.4 获取真正的泛化能力衡量
9.5 小结
访问:mlbook.explained.ai/
#人工智能##程序员#