社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【机器学习】中国大学慕课《机器学习》课后习题(二)(回归)

机器学习初学者 • 3 年前 • 508 次点击  

部分习题来自黄海广老师的慕课《机器学习》的课后习题,答案暂不公布,可以留言讨论。

课程链接:

https://www.icourse163.org/course/WZU-1464096179

回归部分习题

单选题

1. 以下哪组变量之间存在线性回归关系?( )

A.  方形的边长与面积

B. 学生的性别与他的成绩

C. 儿子的身高与父亲的身高

D. 正三角形的边长与周长


2.回归问题和分类问题的区别是?( )

A. 问题有标签,分类问题没有

B. 回归问题输出值是连续的,分类问题输出值是离散的

C. 回归问题输出值是离散的,分类问题输出值是连续的

D. 回归问题与分类问题在输入属性值上要求不同


3. 以下说法错误的是?( )

A. 最小二乘法不需要选择学习率

B. 残差是预测值与真实值之间的差值

C. 正则项的目的是为了避免模型过拟合

D. 损失函数越小,模型训练得一定越好


4.哪些算法不需要数据归一化?( )

A. K-means

B. KNN

C. 决策树

D. SVM


5.以下哪些方法不能用于处理欠拟合?( )

A. 模型复杂度

B. 增加新的特征

C. 增大正则化系数

D. 对特征进行变换,使用组合特征或高维特征


6.以下哪些方法不能用于处理过拟合?( )

A. 增加数据属性的复杂度

B. 对数据进行清洗

C. 增大训练数据的量

D. 利用正则化技术


7.下列关于线性回归分析中的残差(Residuals)说法正确的是?( )

A. 均值总是小于零

B. 残差均值总是为零

C. 残差均值总是大于零

D. 以上说法都不对


8.为了观察测试 Y 与 X 之间的线性关系,X 是连续变量,使用下列哪种图形比较适合?( )

A. 直方图

B. 柱形图

C. 散点图

D. 以上都不对


9.假如你在训练一个线性回归模型,则:

1. 如果数据量较少,容易发生过拟合。

2. 如果假设空间较小,容易发生过拟合。

关于这两句话,下列说法正确的是?( )

A. 1 错误,2 正确

B. 1 和 2 都错误

C. 1 正确,2 错误

D. 1 和 2 都正确


10.关于特征选择,下列对 Ridge 回归和 Lasso 回归说法正确的是?( )

A. Ridge 回归适用于特征选择

B. Lasso 回归适用于特征选择

C. 两个都适用于特征选择

D. 以上说法都不对


11.构建一个最简单的线性回归模型需要几个系数(只有一个特征)?( )

A. 1 个

B. 2 个

C. 3 个

D. 4 个


12. 向量x=[1,2,3,4,-9,0]的L1范数是多少?( )

A. 1

B. 19

C. 6

D. √111         

               

多选题

13. 以下哪些是使用数据规范化(特征缩放)的原因?( )

A. 它通过减少迭代次数来获得一个好的解,从而加快了梯度下降的速度

B. 它防止矩阵X^T X不可逆(奇异/退化)

C. 它通过降低梯度下降的每次迭代的计算成本来加速梯度下降

D. 它不能防止梯度下降陷入局部最优



14. 线性回归中,我们可以使用最小二乘法来求解系数,下列关于最小二乘法说法正确的是?( )

A.不需要选择学习率

B.当特征数量很多的时候,运算速度会很慢

C.不需要迭代训练

D.只适用于线性模型,不适合逻辑回归模型等其他模型


15. 欠拟合的处理主要有哪些方式:( )

A.添加新特征

B.增加模型复杂度

C.减小正则化系数

D.增大正则化系数


16. 假如使用一个较复杂的回归模型来拟合样本数据,使用 Ridge回归,调试正则化参数,来降低模型复杂度,若正则化系数较大时,关于偏差(bias)和方差(variance),下列说法正确的是?( )

A.偏差减小

B.偏差增大

C,方差减小

D.方差增大


判断题

17. 如果两个变量相关,那么它们一定是线性关系。( )


18. 过拟合的处理可以通过减小正则化系数。( )


19.随机梯度下降,每次迭代时候,使用一个样本。( )


20. L_2正则化往往用于防止过拟合,而L_1正则化往往用于特征选择。( )



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/123107
 
508 次点击