- 博客(1)
- 收藏
- 关注
原创 【机器学习-数据预处理】
否则直接从数据中学习贝叶斯网的结构不但复杂性较高(随着变量的增加,指数级增加),网络维护代价昂贵,而且它的估计参数较多,为系统带来了高方差,影响了它的预测精度。作为与实际生产紧密联系的方向,我们实验室的集料研究方向的所有数据均为自己筛分采集存储,自己掌握数据来源才是最可靠的,在数据有问题的时候可以对原始数据进行追溯,排查问题点。异常值是指那些数据集中存在的不合理的值,此处的不合理指的是偏离正常范围的值而不是错误值,如一颗集料的重量为1kg、外接矩形的边长为1m等。因此我们要将更多的目光放在数据的质量上。
2022-09-23 17:13:51
791
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人