机器学习常见问题整理?

本文整理了机器学习中常见的问题,包括项目流程、算法分类、特征选择与降维的区别、模型诊断、过拟合与欠拟合的调优、不需要归一化的算法、有监督与无监督学习的区别、生成模型与判别模型、正则化及其类型、决策树与集成学习的区别,以及LR和SVM的联系与差异。内容详实,适合初学者参考。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习项目流程?

答:理解实际问题,抽象成数学模型(分类、回归、聚类)——>获取数据——>特征预处理与特征选择——>训练模型与调优——>模型诊断(过拟合、欠拟合等)——>模型融合——>上线运行。

机器学习算法的分类?

答:监督学习、非监督学习、半监督学习、强化学习。

特征选择与降维的区别?

答:两者达到的效果是一样的,都是试图去减少特征数据集中的属性(特征)的数目;
但是两者所采用的方式方法却不同:降维的方法主要是通过属性间的关系,如组合不同的属性得新的属性,这样就改变了原来的特征空间;而特征选择的方法是从原始特征数据集中选择子集,是一种包含的关系,没有更改原始的特征空间。

特征选择的方法?

答:主要有三种方法:1)Filter;2)Wrapper;3)Embedded
1、Filter方法(过滤式)

其主要思想是:对每一维的特征“打分”,即给每一维的特征赋予权重,这样的权重就代表着该维特征的重要性,然后依据权重排序。

主要的方法有:
Chi-squared test(卡方检验)
information gain(信息增益)
correlation coefficient scores(相关系数)
2、Wrapper方法(包裹式)

其主要思想是:将子集的选择看作是一个搜索寻优问题,生成不同的组合,对组合进行评价,再与其他的组合进行比较。这样就将子集的选择看作是一个是一个优化问题,这里有很多的优化算法可以解决,尤其是一些启发式的优化算法,如GA,PSO,DE,ABC等,详见“优化算法——人工蜂群算法(ABC)”,“优化算法——粒子群算法(PSO)”。

主要方法有:recursive feature elimination algorithm(递归特征消除算法)

3、Embedded方法(嵌入式)

其主要思想是:在模型既定的情况下学习出对提高模型准确性最好的属性。这句话并不是很好理解&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值