机器学习与深度学习常见面试题（下）

广而告之

SIGAI-AI学习交流群的目标是为学习者提供一个AI技术交流与分享的平台。操作指引：关注本微信公众号，回复“芝麻开门”，即可收到入群二维码，扫码即可。

同时在本微信公众号中，回复“SIGAI”+日期，如“SIGAI0515”，即可获取本期文章的全文下载地址（仅供个人学习使用，未经允许，不得用于商业目的）。

导言

为了帮助参加校园招聘、社招的同学更好的准备面试，SIGAI曾整理出了一些常见的机器学习、深度学习面试题（上篇），获得了小伙伴们的广泛好评，并强烈要求推出下篇的面试问题集锦。千呼万唤始出来，今日特地奉上，希望帮助各位更好的理解机器学习和深度学习的算法原理和实践应用。

1、为什么随机森林能降低方差？

随机森林的预测输出值是多课决策树的均值，如果有n个独立同分布的随机变量xi，它们的方差都为σ2，则它们的均值的方差为：

2、对于带等式和不等式约束的优化问题，KKT条件是取得极值的充分条件还是必要条件？对于SVM呢？

对于一个一般的问题，KKT条件是取得极值的必要条件而不是充分条件。对于凸优化问题，则是充分条件，SVM是凸优化问题

3、解释维数灾难的概念

当特征向量数理很少时，增加特征，可以提高算法的精度，但当特征向量的维数增加到一定数量之后，再增加特征，算法的精度反而会下降

4、Logistic回归为什么用交叉熵而不用欧氏距离做损失函数？

如果用欧氏距离，不是凸函数，而用交叉熵则是凸函数

5、解释hinge loss损失函数

如果样本没有违反不等式约束，则损失为0；如果违反约束，则有一个正的损失值

6、解释GBDT的核心思想

用加法模拟，更准确的说，是多棵决策树树来拟合一个目标函数。每一棵决策树拟合的是之前迭代得到的模型的残差。求解的时候，对目标函数使用了一阶泰勒展开，用梯度下降法来训练决策树

7、解释XGBoost的核心思想

在GBDT的基础上，目标函数增加了正则化项，并且在求解时做了二阶泰勒展开

8、解释DQN中的经验回放机制，为什么需要这种机制？

将执行动作后得到的状态转移构造的样本存储在一个列表中，然后从中随机抽样，来训练Q网络。为了解决训练样本之间的相关性，以及训练样本分布变化的问题

9、什么是反卷积？

反卷积也称为转置卷积，如果用矩阵乘法实现卷积操作，将卷积核平铺为矩阵，则转置卷积在正向计算时左乘这个矩阵的转置WT，在反向传播时左乘W，与卷积操作刚好相反，需要注意的是，反卷积不是卷积的逆运算

10、反卷积有哪些用途？

实现上采样；近似重构输入图像，卷积层可视化

11、PCA（主成分分析）优化的目标是什么？

最小化重构误差/最大化投影后的方差

12、LDA（线性判别分析）优化的目标是什么？

最大化类间差异与类内差异的比值

13、解释神经网络的万能逼近定理

只要激活函数选择得当，神经元的数理足够，至少有一个隐含层的神经网络可以逼近闭区间上任意一个连续函数到任意指定的精度

14、softmax回归训练时的目标函数时凸函数吗？

是，但有不止一个全局最优解

15、SVM为什么要求解对偶问题？为什么对偶问题与原问题等价？

原问题不容易求解，含有大量的不易处理的不等式约束。原问题满足Slater条件，强对偶成立，因此原问题与对偶问题等价

16、神经网络是生成模型还是判别模型？

判别模型，直接输出类别标签，或者输出类后验概率p(y|x)

17、logistic回归是生成模型还是判别模型？

判别模型，直接输出类后验概率p(y|x)，没有对类条件概率p(x|y)或者联合概率p(x, y)建模

18、Batch Normalization 和 Group Normalization有何区别？

BN是在 batch这个维度上进行归一化，GN是计算channel方向每个group的均值和方差

19、GAN中模型坍塌（model collapse）是指什么？

模型坍塌，即产生的样本单一，没有了多样性。

20、目前GAN训练中存在的主要问题是什么？

（1）训练不易收敛（2）模型坍塌

21、Shufflenet为什么效果会好？

通过引入“通道重排”增加了组与组之间信息交换。

22、模型压缩的主要方法有哪些？

（1）从模型结构上优化：模型剪枝、模型蒸馏、automl直接学习出简单的结构

（2）模型参数量化将FP32的数值精度量化到FP16、INT8、二值网络、三值网络等

23、目标检测中IOU是如何计算的？

检测结果与 Ground Truth 的交集比上它们的并集，即为检测的准确率 IoU

24、给定0-1矩阵，如何求连通域？

可采用广度优先搜索

25、OCR任务中文本序列识别的主流方法是什么？

RNN+CTC

26、在神经网络体系结构中，哪些会有权重共享？？

（1）卷积神经网络

（2）递归神经网络

（3）全连接网络

答案（1）&（2）

27、一个典型人脸识别系统的识别流程？

人脸检测--》人脸对齐--》人脸特征提取--》人脸特征比对

28、平面内有两个矩形，如何快速计算它们的IOU？

29、使用深度卷积网络做图像分类如果训练一个拥有1000万个类的模型会碰到什么问题？

提示：内存/显存占用；模型收敛速度等

30、HMM和CRF的区别？

前者描述的是 P(X,Y)=P(X|Y)*P(Y), 是 generative model; 后者描述的是 P(Y|X), 是 discriminative model. 前者你要加入对状态概率分布的先验知识，而后者完全是 data driven。

31、深度学习中为什么不用二阶导去优化？

Hessian矩阵是n*n，在高维情况下这个矩阵非常大，计算和存储都是问题

32、深度机器学习中的mini-batch的大小对学习效果有何影响？

mini-batch太小会导致收敛变慢，太大容易陷入sharp minima，泛化性不好

33、线性回归对于数据的假设是怎样的？

http://en.wikipedia.org/wiki/Linear_regression

（1）线性，y是多个自变量x之间的线性组合

（2）同方差性，不同的因变量x的方差都是相同的

（3）弱外生性，假设用来预测的自变量x是没有测量误差的

（4）预测变量之中没有多重共线性

34、什么是共线性, 跟过拟合有啥关联?

共线性：多变量线性回归中，变量之间由于存在高度相关关系而使回归估计不准确。

共线性会造成冗余，导致过拟合。

解决方法：排除变量的相关性／加入权重正则。

35、Bias和Variance的区别？

Bias量了学习算法的期望预测与真实结果的偏离程度，即刻画了算法本身的拟合能力。

Variance度量了同样大小的训练集的变动所导致的学习性能变化，即刻画了数据扰动所造成的影响。

36、对于支持向量机，高斯核一般比线性核有更好的精度，但实际应用中为什么一般用线性核而不用高斯核？

如果训练样本的量很大，训练得到的模型中支持向量的数量太多，在每次做预测时，高斯核需要计算待预测样本与每个支持向量的内积，然后做核函数变换，这会非常耗；而线性核只需要计算WTX+b

37、高斯混合模型中，为什么各个高斯分量的权重之和要保证为1？

为了保证这个函数时一个概率密度函数，即积分值为1

38、介绍beam search算法的原理

这是一种解码算法，每次选择概率最大的几个解作为候选解，逐步扩展

39、介绍seq2seq的原理

整个系统由两个RNN组成，一个充当编码器，一个充当解码器；编码器依次接收输入的序列数据，当最后一个数据点输入之后，将循环层的状态向量作为语义向量，与解码器网络的输入向量一起，送入解码器中进行预测

40、介绍CTC的原理

CTC通过引入空白符号，以及消除连续的相同符号，将RNN原始的输出序列映射为最终的目标序列。可以解决对未对齐的序列数据进行预测的问题，如语音识别

41、介绍广义加法模型的原理

广义加法模型用多个基函数的和来拟合目标函数，训练的时候，依次确定每个基函数

42、为什么很多时候用正态分布来对随机变量建模？

现实世界中很多变量都服从或近似服从正态分布。中心极限定理指出，抽样得到的多个独立同分布的随机变量样本，当样本数趋向于正无穷时，它们的和服从正态分布

▲向上滑动查看更多推荐文章

科普类

【获取码】SIGAI0413

机器学习——波澜壮阔四十年

【获取码】SIGAI0620

理解计算：从√2到AlphaGo ——第1季从√2谈起

【获取码】SIGAI0702

理解计算：从√2到AlphaGo ——第2季神经计算的历史背景

【获取码】SIGAI0702

理解计算：从√2到AlphaGo ——第3季神经网络的数学模型

【获取码】SIGAI0702

理解计算：从√2到AlphaGo ——第4季凛冬将至

【获取码】SIGAI1019

理解计算：从√2到AlphaGo ——第5季导数的前生今生

【获取码】SIGAI0829

AI时代大点兵——国内外知名AI公司2018年最新盘点【完整版】

【获取码】SIGAI1008

非算法类人工智能从业者须知的十件事

数学类

【获取码】SIGAI0417

【获取码】SIGAI0511

【获取码】SIGAI0518

【获取码】SIGAI0531

机器学习类

【获取码】SIGAI0428

用一张图理解SVM的脉络

【获取码】SIGAI0505

理解神经网络的激活函数

【获取码】SIGAI0522

【实验】理解SVM核函数和参数的作用

【获取码】SIGAI0601

【群话题精华】五月集锦—机器学习和深度学习中一些值得思考的问题

【获取码】SIGAI0602

【获取码】SIGAI0606

【获取码】SIGAI0611

【获取码】SIGAI0613

【获取码】SIGAI0618

【获取码】SIGAI0627

【获取码】SIGAI0704

【获取码】SIGAI0706

【获取码】SIGAI0720

【获取码】SIGAI0725

【获取码】SIGAI0711

【获取码】SIGAI0802

【获取码】SIGAI0808

机器学习和深度学习核心知识点总结--写在校园招聘即将开始前

【获取码】SIGAI0822

【获取码】SIGAI0824

【获取码】SIGAI0831

【获取码】SIGAI0903

【获取码】SIGAI0905

【获取码】SIGAI0914

【获取码】SIGAI0917

【获取码】SIGAI0921

【获取码】SIGAI1008

深度学习类

【获取码】SIGAI0907

网络表征学习综述

【获取码】SIGAI0917

机器学习中的目标函数总结

【获取码】SIGAI0822

机器学习中的最优化算法总结

【获取码】SIGAI0426

卷积神经网络为什么能够称霸计算机视觉领域？

【获取码】SIGAI0827

DenseNet详解

【获取码】SIGAI0508

深度卷积神经网络演化历史及结构改进脉络-40页长文全面解读

【获取码】SIGAI0515

循环神经网络综述—语音识别与自然语言处理的利器

【获取码】SIGAI0625

【获取码】SIGAI0709

【获取码】SIGAI0711

【获取码】SIGAI0718

【获取码】SIGAI0723

【获取码】SIGAI0802

【获取码】SIGAI0806

【获取码】SIGAI0808

机器学习和深度学习核心知识点总结--写在校园招聘即将开始前

【获取码】SIGAI0810

理解SpatialTransformer Networks

【获取码】SIGAI0824

【获取码】SIGAI0905

【获取码】SIGAI0921

【获取码】SIGAI0928

【获取码】SIGAI1015

【获取码】SIGAI1017

【获取码】SIGAI1022

机器视觉类

【获取码】SIGAI0420

人脸识别算法演化史

【获取码】SIGAI0424

基于深度学习的目标检测算法综述

【获取码】SIGAI0426

卷积神经网络为什么能够称霸计算机视觉领域？

【获取码】SIGAI0503

人脸检测算法综述

【获取码】SIGAI0525

【SIGAI综述】行人检测算法

【获取码】SIGAI0604

FlowNet到FlowNet2.0：基于卷积神经网络的光流预测算法

【获取码】SIGAI0608

【获取码】SIGAI0615

【获取码】SIGAI0622

【获取码】SIGAI0629

【获取码】SIGAI0716

【获取码】SIGAI0727

基于内容的图像检索技术综述--传统经典方法

【获取码】SIGAI0817

基于内容的图像检索技术综述--CNN方法

【获取码】SIGAI0910

视觉多目标跟踪算法综述（上）-附开源代码下载链接整理

【获取码】SIGAI0914

计算机视觉技术self-attention最新进展

【获取码】SIGAI0919

【获取码】SIGAI0924

【获取码】SIGAI0926

【获取码】SIGAI1012

自然语言处理

【获取码】SIGAI0803

基于深度神经网络的自动问答概述

【获取码】SIGAI0820

文本表示简介

工业应用类

【获取码】SIGAI0529

机器学习在自动驾驶中的应用-以百度阿波罗平台为例【上】

本文为SIGAI原创

如需转载，欢迎发消息到本订号

最后12小时知识库全场半价

Hello Geek--1024程序员日惊喜大放送

知识库小视频全场半价

最后十二个小时哦！！！

安卓用户可在微信小程序购买；ios用户请移步www.sigai.cn购买

今天看啥 - 高品质阅读平台
本文地址：http://www.jintiankansha.me/t/BwMX6Ojipg