data preprocessing简要笔记

数据预处理是机器学习和数据分析的重要步骤,包括数据清洗、转换、归一化和降维等。它能去除噪声,提高模型性能。箱线图作为一种有效的数据可视化工具,帮助我们理解数据分布。本文探讨了数据预处理的各个阶段,如描述性数据总结、数据清洗、数据转换和数据减少,并提及了噪声处理的方法。逃课虽然短暂快乐,但理解和掌握这些基础知识至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

why preprocess the data? 

 

 

 

 

 

 Descriptive data summarization

 

这个Empirical formula:挺有意思,当时是怎么发现的呢。

    

 

 

 

箱线图(Boxplot)也称箱须图(Box-whisker Plot)_To be a better man-优快云博客 

 

 

 

 

 

 

 

 

 

Data Cleaning 

 

 

 

 

 

 

 

 

 

data transformation 

 

 

 

 

 

 

 

 

 

 

Data Reduction 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Discretization and concept hierarchy generation

 

 

 

 

 

 

 

 

 

 

 

 

 

w​​​​​​数据和数据预处理(ML&DM)_一只黑猩猩-优快云博客 

请参考以上🔗的noise处理部分 

参考资料:

        UCAS.Data Mining.刘莹

 PS:真是逃课一时爽,还账火葬场,再忙,也不能逃课了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值