
机器学习
文章平均质量分 97
一二¬
Java开发
展开
-
【机器学习】随机森林
随机森林(Random Forest)是集成算法Bagging的代表算法,在学习随机森林之前先了解一下什么是集成学习(Ensemble Learning )。原创 2024-08-27 15:39:10 · 1425 阅读 · 0 评论 -
【机器学习】数据预处理-特征工程与特征选择
特征工程的处理流程为首先去掉无用特征,接着去除冗余的特征,如共线特征,并利用存在的特征、转换特征、内容中的特征以及其他数据源生成新特征,然后对特征进行转换(数值化、类别转换、归一化等),最后对特征进行处理(异常值、最大值、最小值,缺失值等), 以符合模型的使用。方差越大,特征所带的信息量越多。最近邻算法KNN,单棵决策树,支持向量机 SVM,神经网络,回归算法,都需要遍历特征或升维来进行运算,所以他们本身的运算量就很大,需要的时间就很长,因此方差过滤这样的特征选择对他们来说就尤为重要。原创 2024-08-27 15:16:31 · 2304 阅读 · 0 评论