
面试
yiyue21
这个作者很懒,什么都没留下…
展开
-
机器学习EM算法的执行流程(85)
85、EM算法的执行流程(建议自己推导1遍,不会就尝试着跟着写几遍,理解逻辑)EM算法(最大期望算法)是一种迭代类型的算法,是一种在概率模型中寻找参数最大似然估计或最大后验估计的算法,适用于带有隐变量的概率模型的估计。什么是隐变量呢?就是观测不到的变量,举例:我手上的数据是男生和女生的身高合集,如果明确知道样本的情况(即男性、女性的数据是分开的)就可以用极大似然估计。然而如果样本是混合的,并没...原创 2019-05-31 10:00:38 · 515 阅读 · 0 评论 -
机器学习特征选择的目标/方式(22-23)
特征选择的目标,方式我们做完特征转换后,实际上可能会存在很多特征属性,但是太多的特征属性会导致模型构建的效率降低,模型的效果可能变的不好,那么就需要我们从这些特征属性中选择影响最大的特征属性作为最后模型构建的特征属性列表。通常从两方面来选择特征:特征是否发散:如果一个特征不发散,比如方差为0,那么这样的特征对于样本的区分没什么作用特征与目标的相关性:如果与目标相关性比较高,我们就优...原创 2019-06-01 19:13:17 · 1184 阅读 · 0 评论 -
机器学习的过拟合和欠拟合问题(1-4)
一般情况下,模型的训练需要考虑两个方面的内容:1. 模型预测的准不准 ---> 可以通过模型的效果来评估2. 模型的复杂度高不高 ---> 通过模型的训练时间、预测时间、资源消耗来衡量,也可以通过模型在训练数据上的效果和在测试数据上的效果的差异情况来衡量在模型开发过程中,主要期望是模型能够非常好的拟合训练数据,但是在这个过程中可能会存在两个问题:--1. 过拟合--2. 欠...原创 2019-06-10 15:18:14 · 552 阅读 · 0 评论 -
模型参数、超参(28)
模型参数 需要在训练数据上通过某种算法方式找出来的特征参数,也就是需要训练的参数,eg:线性回归中的θ值超参数: 在模型训练过程中算法需要使用到的参数值,这个参数值会影响最终模型参数的求解,所以需要开发人员给定,比如:Ridge算法中的正则化项系数alpha参数 给定方式: -1. 可以根据算法的特性、业务的背景、开发人员的工作经验来给定。-2. 使用sklearn中支持...原创 2019-06-10 17:21:47 · 2235 阅读 · 0 评论