Py学习  »  机器学习算法

《可解释机器学习》中文版重磅开源!这位复旦研究生厉害了

开源最前线 • 3 年前 • 729 次点击  

来源:程序员书库(ID:CodingBook) 猿妹


机器学习模型被许多人称为“黑匣子”,也就是说尽管我们可以从中获得准确的预测,但我们无法清楚地解释或确定这些预测背后的逻辑。我们要如何从模型中提取重要信息呢,需要哪些功能和工具?

机器学习在改进产品、研究方面具有巨大的潜力,但是计算机通常不解释他们的预测,这是采用机器学习的障碍,今天就和大家分享一本系统介绍可解释性机器学习的书籍——《Interpretable Machine Learning》


通过这本书,你将学习简单的可解释模型,例如决策树,决策规则和线性回归。后面的章节将重点介绍与模型无关的一般方法,这些方法可用来解释黑匣子模型,例如特征重要性和累积的局部效应,以及使用Shapley值和LIME解释单个预测。

该书侧重于表格数据(也称为关系数据或结构化数据)的机器学习模型,而较少涉及计算机视觉和自然语言处理任务。

原本这本书只有英文版,不过最近,一位来自复旦大学的研究生朱明超将这本书翻译成中文版,对这本书感兴趣的小伙伴们不要错过了。


章节介绍

这本书的重点是机器学习的可解释性。你将学习简单的、可解释的模型,如线性回归、决策树和决策规则等。后面几章重点介绍了解释黑盒模型的模型无关的一般方法,如特征重要性和累积局部效应,以及用 Shapley 值和 LIME 解释单个实例预测。

对各种解释方法进行了深入的解释和批判性的讨论。它们是如何工作的?优点和缺点是什么?如何解释它们的输出?本书将使你能够选择并正确应⽤最适合你的机器学习项⽬的解释⽅法。你阅读本书后,内化基础知识还使你能够更好地理解和评估 arxiv.org 上发表的有关可解释性的新论⽂。

《可解释的机器学习》该书总共包含 7 章内容。章节目录如下:
  • 第一章:前言

  • 第二章:可解释性

  • 第三章:数据集

  • 第四章:可解释的模型

  • 第五章:模型无关方法

  • 第六章:基于样本的解释

  • 第七章:水晶球



谁适合读这本书?

建议机器学习从业者、数据科学家、统计学家和任何对使机器学习模型可解释的⼈阅读本书。

如果你是机器学习初学者,建议学习基础知识。关于机器学习的入门知识,我推荐 Andrew Ng 的 “机器学习” 在线课程。


如果你是对机器学习或深度学习的原理感兴趣,顺便推荐另一个 项目,该项目描述其原理和代码实现过程,这个项目也是朱明超创建的。



最后附上《可解释机器学习》一书的项目地址:
https://github.com/MingchaoZhu/InterpretableMLBook



●编号1007,输入编号直达本文

●输入m获取文章目录

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/63056
 
729 次点击