[动手学深度学习] 1引言

1.1 日常生活中的机器学习

1.2 机器学习中的关键组件

首先介绍一些核心组件。无论什么类型的机器学习问题，都会遇到这些组件：

1. 可以用来学习的数据（data）；

2. 如何转换数据的模型（model）；

3. 一个目标函数（objective function），用来量化模型的有效性；

4. 调整模型参数以优化目标函数的算法（algorithm）。

1.3 各种机器学习问题

1.3.1 监督学习

回归：假设有一组房屋销售数据，销售价格（即标签）是一个数值。当标签取任意数值时，我们称之为回归问题，此时的目标是生成一个模型，使它的预测非常接近实际标签值。

分类：分类问题希望模型能够预测样本属于哪个类别（category，正式称为类（class））。例如，手写数字可能有10类，标签被设置为数字0～9。

标记问题学习预测不相互排斥的类别的问题称为多标签分类（multi‐label classification）。举个例子，一篇典型的文章可能会用5～10个标签。

搜索：在信息检索领域，我们希望对一组项目进行排序。以网络搜索为例，目标不是简单的“查询（query）‐网页（page）”分类，而是在海量搜索结果中找到用户最需要的那部分。该问题的一种可能的解决方案：首先为集合中的每个元素分配相应的相关性分数，然后检索评级最高的元素。

推荐系统：向特定用户进行“个性化”推荐。例如，对于电影推荐，科幻迷和喜剧爱好者的推荐结果页面可能会有很大不同。类似的应用也会出现在零售产品、音乐和新闻推荐等等。

序列学习输入和输出都是可变长度的序列，例如机器翻译和从语音中转录文本。

1.3.2 无监督学习

如果工作没有十分具体的目标，就需要“自发”地去学习了。比如，老板可能会给我们一大堆数据，然后要求用它做一些数据科学研究，却没有对结果有要求。这类数据中不含有“目标”的机器学习问题通常被为无监督学习（unsupervised learning）。

聚类（clustering）、主成分分析（principal component analysis）、因果关系（causality）和概率图模型（probabilistic graphical models）、生成对抗性网络（generative adversarial networks）。

1.3.3 与环境互动

我们可能会期望人工智能不仅能够做出预测，而且能够与真实环境互动。

1.3.4 强化学习

在强化学习问题中，智能体（agent）在一系列的时间步骤上与环境交互。在每个特定时间点，智能体从环境接收一些观察（observation），并且必须选择一个动作（action），然后通过某种机制（有时称为执行器）将其传输回环境，最后智能体从环境中获得奖励（reward）。此后新一轮循环开始，智能体接收后续观察，并选择后续操作，依此类推。

1.4 起源

1.5 深度学习的发展

1.6 深度学习的成功案例

1.7 特点

[动手学深度学习] 1安装-windows