一.定点DSP做小数运算思路梳理:
1.由于定点DSP适用于做整数的加减乘除运算,在做小数的加减乘除等运算时效率极低,因此在做含小数数据运算时需要将小数转换为Q格式的整数,从而将问题转变为整数的加减乘除运算。
2.将小数转换为Q格式的本质就是将小数通过左移运算乘2的Q次幂把小数转换为整数(乘2的幂是因为乘2的移位运算效率最高)
3.总结:将小数通过左移n位变为整数进行运算,运算完毕,右移相同n位,变回为对应小数。(浮沉)
二.实现
1.浮点数与Q格式的相互转换(C语言实现)
a.一般方法
(1)浮点数转换为Q格式
int FtoQ (float a , unsigned char q)
{
int temp;
temp = a * (1 << q);//借位数上去
return temp;
}
(2)Q格式转换为浮点数
float QtoF(int a , unsigned char q)
{
float temp;
temp = a >> q;//欠多少位还回去多少位
return temp;
}
b.防止溢出的方法,Q15/Q31类型可以有效防止乘除法运算时溢出(但是加减法不能防止溢出),但还有一个常用且简洁的方法∶把数据全部转化成小数,再用Q15格式表示。具体实现方法参见:
2.Q格式四则运算(C语言实现)
核心思路:
Q的本质:升高的2次幂阶数(迟早要还回来)
-
加减法:必须相同的Q格式的数据才能相加减,不同Q格式的数据必先通过移位至相同的Q格式后才能相加减。
-
乘法:不同Q格式的数据向乘,相当于Q值相加。
-
除法:不同Q格式的数据向乘,相当于Q值相减。
-
定点左移:相当于Q值相加。
-
定点右移:相当于Q值相减。
a.输入均为Q格式数据,输出为Q格式结果
(1)加法
int q_add32(int a,int b)
{
return (a + b);
}
(2)减法
int q_sub32(int a,int b)
{
return (a - b);
}
(3)乘法
int q_mul32(int a , int b , unsigned char q)
{
int result;
result= ((long long int)a * b) >> q;
return result;
}
(4)除法
int q_div(int a , int b , unsigned char q)
{
int result;
result = ((long long int)a << q) / b;
return result;
}
b.推广型乘除运算,输入输出Q值不同(应用不多,一般情况都是统一q值,但这样写有利于加深理解)
(1)乘法
int q_mul32(int a , int b , unsigned char a_q , unsigned char b_q , unsigned char r_q)
{
int result;
result = ((long long int)a * b) >> (a_q + b_q - r_q);
return result;
}
(2)除法
int q_div(int a , int b , unsigned char a_q , unsigned char b_q , unsigned char r_q)
{
int result;
result = ((long long int)a << (r_q - a_q + b_q)) / b;
return result;
}