类型一:基础概念类问题
问题1:过拟合与欠拟合(定义、产生的原因、解决的方法各是什么)。
问题2:L1正则与L2正则(有哪些常见的正则化方法?作用各是什么?区别是什么?为什么加正则化项能防止模型过拟合)。
间题3:模型方差和偏差(能解释一下机器学习中的方差和偏差吗?哪些模型是降低模型方差的?哪些模型是降低模型偏差的?举例说明一下)。
问题4:奥卡姆剃刀(说一说机器学习中的奥卡剪梯刀原理)。
问题5:模型评估指标(回归模型和分类模型各有哪些常见的评估指标?各白的含义是什么?解释一下AUC?你在平时的实践过程中用到过哪些评估捐标?为什要选择这些指标)。
问题6:风险函数(说一下经验风险和结构风险的含义和异同点)。
问题7:优化算法(机器学习中常见的优化算法有哪些?梯度下降法和牛顿法的原理推导)。
问题8:激活函放(神经网络模型中常用的激活函数有哪些?说一下各自的特点)。
问题9:核函数(核函数的定义和作用是什么?常用的核函数有哪些?你用过些核函数?说一下高斯核函数中的参数作用)。
问题10:梯度消失与梯度爆炸(解释一下梯度消失与梯度爆炸问题,各自有什么解决方案)。
问题11:有监督学习和无监督学习(说一下有监督学习和无监督学习的特点,举例说明一下)。
问题12:生成模型与判别模型(你知道生成模型和判别模型吗?各自的将点是什么?哪些模型是生成模型,哪些模型是判别模型)。
类型二:模型原理类
问题13:线性回归(线性回归模型的原理、损失函数、正则化项)。
问题14:KNN模型(KNN模型的原理、三要素、优化方案以及模望的优缺点)。
问题15:朴素贝叶斯(朴素贝叶斯模型的原理推导,拉普拉斯平滑,后验概率最大化的含义以及模型的优/缺点)。
问题16:决策树(决策树模型的原理、特征评价指标、剪枝过程和原理、几种常见的决策树模型、各自的优/缺点)。
问题17:随机森林模型(RF模型的基本原理,RF模型的两个“随机”。从偏差和方差角度说一下RF模型的优缺