我们为什么在这里?我们大多数人来到这里的原因很简单:我们想解决人工智能问题。那么,人工智能和这本书的书名有什么关系呢?人工智能的现代定义之一是对理性代理的研究和设计[RN09]。从这个意义上说,我们将一个系统描述为智能的,当它最大化某些预期的性能概念时。机器学习的子领域处理的是问题和算法的子集,其中代理可以获得经验(通常以某种形式的数据),可以利用这些经验来改进性能的概念[MRT12]。大多数情况下,性能是由代理人在新的和看不见的情况下如何行动来衡量的,这些情况不构成其训练经验的一部分。例如,可以训练一名代理人将英文翻译成法文,其训练经验包括大量翻译的联合国文件。然而,在评估时,它可能会在与它所见过的文件不同的联合国新文件上进行测试。很自然地,代理在它所看到的训练经验和它所评估的新情况下的表现之间存在着差距。代理泛化的能力是通过性能上的差距有多小来衡量的。
希望前面的段落已经解释了在机器学习的背景下,以及在更大的AI背景下,什么是泛化。那么,标题中还保留着哪些“分布外”词呢?如前所述,泛化是指减少一个agent在已知训练情境下的表现与同一agent在未知测试情境下的表现之间的差距。然而,有许多不同类型的未知。统计学习通常处理的一类泛化是分布的:当从训练示例生成的数据与测试示例生成的数据无法区分时。根据定义,非分布内的泛化问题称为分布外泛化问题,这是本书的主题。
这项工作的目标很简单。我们想要回顾,分布外泛化的知识。因此,这项工作的很大一部分将致力于理解(有时是微妙的)不同方法和假设之间的差异和相似性,通常以一种孤立的方式呈现。重点将放在与人工智能或现代大规模机器学习应用等想法上。此外,我们将特别注意研究不同方法的缺点,以及下一步可能是重要的。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询!点击“阅读原文”,了解使用专知,查看获取5000+AI主题知识资源