一.主要内容:
1.数据的平滑处理
2.数据的标准化处理
3.数据的极差归一化变换
4.缺失数据的填充
二.为何要进行预处理?
我们得到的实际数据容易受到噪声的影响,可能存在重复与缺失,也可能存在多种量纲,他们往往是不完美的。因此我们再分析挖掘数据时,首先就要进行预处理。
三.正文部分
1.
数据的平滑处理,主要用到MATLAB的smooth函数。
原理(以yy=smooth(y);举例):
yy(1)=y(1)
yy(2)=(y(1)+y(2)+y(3))/3
yy(3)=(y(1)+y(2)+y(3)+y(4)+y(5))/5
yy(4)=(y(2)+y(3)+y(4)+y(5)+y(6))/5
…
调用格式如下:
yy=smooth(y); %默认窗宽为5,即当前数与前两个后两个的平均
yy=smooth(y,span); %span为制定移动平均滤波器的窗宽,为正奇数
yy=smooth(y,method); %method为平滑的方法,一般有Moving,Lowess,loess,Sgolay,rlowess与rloess
yy=smooth(y,span,method);
yy=smooth(y,'sgolay',degree); %使用sgolay方法平滑,degree为参数指定多项式模型的阶数,是

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



