批量数据采集过程中方差的计算

项目中需要判断数据稳定性,通过计算方差实现。本文介绍两种方法:迭代计算方差和滑动窗口法。第一种采用C语言实现,从网上找到的matlab思路转化而来;第二种涉及窗口不动和前移两种情况,窗口前移实现相对复杂,文中给出了具体代码实现。

最近项目用需要判断开始数据是否稳定,即采集到的数据是否符合期望,我用方差来判断采集到的数据是否稳定。有两种判断方法:第一种是数据不断的进来,我累积的进行方差计算;第二钟是利用滑动窗口的思想,数据个数达到窗口大小时计算方差值,采用循环数组的模式来实现此功能。

第一种实现方法就是采用迭代式的思想进行方差计算。我实在网上看到一位大神的博客中有对此方法的描述,他用matlab代码进行了说明,(原文章地址:http://blog.chinaunix.net/uid-25418340-id-3547169.html),我用C语言实现了;下面附上代码:

double GetVariance(uint64_t value)
{
	static uint8_t cnt = 0;
	static double Var = 0;
	static double Esp = 0;
	double TempValue = 0;
	
	cnt = cnt + 1;
	if(cnt == 1)
	{
		Var = 0;
		Esp = value;
		return Var;
	}
	TempValue = value - Esp;
	Esp = (value + Esp*(cnt - 1))/cnt; 
	Var = Var + TempValue*(value - Esp);
	return (Var/cnt);
}
这样在程序中不断调用该函数即可迭代式的计算出方差,而不需要知道数据的个数。

第二种方法是采用滑动窗口的思想,这里需要说明一下,我做的时候有两种情况,一种是窗口不动,数据不断前移,FIFO,这种实现起来最简单;还有一种情况是窗口向前移动,这种实现起来就比较复杂了,我用单步调试好多次,才搞清楚之间的区别。

(1)窗口不动,数据前移:

double Function(uint16_t value)
{
	static uint8_t cnt=0;
	static uint8_t len=7;
	static uint16_t sample[7]={0};
	uint8_t i=0;
	double var;
	if(cnt < len)
	{
		sample[cnt++] = value;
		return 0;
	}
	else
	{
		for(;i+1<cnt;i++)
		{
			sample[i]=sample[i+1];
		}
		sample[i]=value;
		var=Variance(sample,7);
}
}

其中 Variance()是我写的计算方差函数,这样就实现了滑动计算数据方差值。

(2)窗口前移,这种实现数据的滑动,设定好窗口大小后,按照FIFO原则,数据不断进入出去,但是这种实现数据滑动后对计算方差增加了难度,这里只说出如何实现窗口向前滑动的代码:

void Function(uint16_t value)
{
	static uint8_t cnt=0;
	static uint8_t len=7;
	static uint8_t index=0;
	static int order[7]={0};
	static int sample[7]={0};
	uint8_t i=0;
	
	sample[index] = value;
	if(cnt < len)
	{
		cnt++;
	}
	else
	{
		for(i=0;i<cnt;i++)
		{
			if(order[i] == index)
			break;
		}
		for(;i+1<cnt;i++)
		{
			order[i]=order[i+1];
		}
	}
	
	order[cnt-1] = index;
	index=(1+index)%len;
}

最后把计算方差的函数Varanice()代码列出来:
double Variance(uint16_t data[], uint8_t n)
{
	double mean = 0, divisor;
	uint16_t sum = 0,Varian = 0;
	uint8_t i;

	for(i=0;i<n;i++)
	{
		sum = sum + data[i];
	}
	mean = sum/n;
	for(i=0;i<n;i++)
	{
		Varian = Varian + pow(data[i]-mean,2);
	}
	
	/*程序中divisor是自由度,20是小样本判断的一个标准。如果是小样本的话,约束较大,
		自由度就要减一;如果是大样本的话,自由度为样本个数。*/
	if(n<20)
	{
		divisor = n-1;
	}	
	else
	{
		divisor = n;
	}
	return (Varian/divisor);
	
}

以上代码如有错误还望指正,共同进步



评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值