1.2 机器学习中的关键组件
首先介绍一些核心组件。无论什么类型的机器学习问题,都会遇到这些组件:
1. 可以用来学习的数据(data);
2. 如何转换数据的模型(model);
3. 一个目标函数(objective function),用来量化模型的有效性;
4. 调整模型参数以优化目标函数的算法(algorithm)。
1.3 各种机器学习问题
1.3.1 监督学习
回归:假设有一组房屋销售数据,销售价格(即标签)是一个数值。当标签取任意数值时,我们称之为回归问题,此时的目标是生成一个模型,使它的预测非常接近实际标签值。
分类 :分类问题希望模型能够预测样本属于哪个类别(category,正式称为类(class))。例如,手写数字可能有10类,标签被设置为数字0~9。
标记问题学习预测不相互排斥的类别的问题称为多标签分类(multi‐label classification)。举个例子,一篇典型的文章可能会用5~10个标签。
搜索:在信息检索领域,我们希望对一组项目进行排序。以网络搜索为例,目标不是简单的“查询(query)‐网页(page)”分类,而是在海量搜索结果中找到用户最需要的那部分。该问题的一种可能的解决方案:首先为集合中的每个元素分配相应的相关性分数,然后检索评级最高的元素。
推荐系统:向特定用户进行“个性化”推荐。例如,对于电影推荐,科幻迷和喜剧爱好者的推荐结果页面可能会有很大不同。类似的应用也会出现在零售产品、音乐和新闻推荐等等。
序列学习输入和输出都是可变长度的序列,例如机器翻译和从语音中转录文本。
1.3.2 无监督学习
如果工作没有十分具体的目标,就需要“自发”地去学习了。比如,老板可能会给我们一大堆数据,然后要求用它做一些数据科学研究,却没有对结果有要求。这类数据中不含有“目标”的机器学习问题通常被为无监督学习(unsupervised learning)。
聚类(clustering)、主成分分析(principal component analysis)、因果关系(causality)和概率图模型(probabilistic graphical models)、生成对抗性网络(generative adversarial networks)。
1.3.3 与环境互动
我们可能会期望人工智能不仅能够做出预测,而且能够与真实环境互动。
1.3.4 强化学习
在强化学习问题中,智能体(agent)在一系列的时间步骤上与环境交互。在每个特定时间点,智能体从环境接收一些观察(observation),并且必须选择一个动作(action),然后通过某种机制(有时称为执行器)将其传输回环境,最后智能体从环境中获得奖励(reward)。此后新一轮循环开始,智能体接收后续观察,并选择后续操作,依此类推。
1.4 起源
1.5 深度学习的发展
1.6 深度学习的成功案例
1.7 特点
[动手学深度学习] 1安装-windows