real time performance test

本文探讨了在Linux环境下评估实时性能的关键因素,并提出了利用软中断模拟硬中断以测量中断延迟时间的方法。通过设计负载程序,充分模拟系统运行状态,以期更准确地评估Linux实时性能。此外,还分享了在不同硬件平台下测试结果,揭示了在有负载情况下Linux实时性能的变化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

总结一下这两天做的一些事情,前几天Boss交给我一个小任务,大概意思就是为公司的一个新的项目选定操作系统,这个项目对系统的实时性要求特别高,然后看看用什么办法能测量出操作系统的实时性能

 

先介绍下背景知识,操作系统分为实时操作系统和分时操作系统,这是由他们的应用范围来决定的,我们通常所用的Windows,Linux都是基于分时的通用操作系统,实时操作系统比较有名的是wind river公司的vxworks,加拿大的QNX还有基于linux的xenomai, RTLinux等等,实时操作系统和分时操作系统最大的区别就是实时操作系统的任务都能保证在固定的时间内完成,必须在规定的时间内完成,哪怕一次任务有9999次在规定的时间内完成,只有一次没有在规定的时间内完成,那么这个系统也不能称之为实时的操作系统。

 

网上查了些资料,对这些操作系统都做了比较,然而意见不一,有人说vxworks好,有人说QNX好…….,想了一下还不如自己想个办法来对这些系统的实时性进行测试,到时候一目了然,黑猫白猫抓住老鼠才是猫。

 

硬件平台x86_64, 软件平台Linux+xenomai,既然要测实时性能,就要说说有哪些因素影响Linux实时性能,大概有以下几点

1.       内核进入临界区会屏蔽所有中断,即Linux内核有大量的不可抢占去,这里说的是2.6以后的内核,因为2.4之前的内核都是不可抢占的,实时性更差

2.       虚拟内存存取时间的不确定性

3.       内核粗糙的时钟粒度

 

最初我的想法是测出中断延迟时间,也就是硬件产生一个中断,到cpu开始执行该中断服务程序的时间。为什么会存在这段时间,就是上面所说的第一点,当硬件产生一个中断时,内核可能在某个临界区内,如果响应了该中断,可能会对临界区内的资源造成不同步,所以屏蔽了中断,也就延迟了中断,明白了这段时间的存在,我们就有了目标。

 

中断延迟时间一般在us级别,因为Linux的系统时钟一般为10ms到1ms之间,所以我们不可能用Linux的内核定时器来产生中断然后记录产生中断的时间

X86下有三种定时器

         RTC定时器      频率在2-8192HZ之间,精度太低,不可能达到us级

         PIC可编程中断定时器    一般将其变成为1000HZ或者100HZ,精度也不能满足要求

         TSC时间戳计数器    这个是cpu主频相对应的,即cpu时钟信号来一次,该计数器加一次,不过这个是个计数器,不能像定时器一样产生中断,到现在也没有想到用什么硬件定时器的方法来产生中断,如果哪位读者或者网友知道望不吝赐教,感激不尽。

 

我想到用软中断的方法来模拟硬中断,即向进程发送一个信号,然后该进程调用信号处理程序,发送信号之后,马上计时,这个要通过读取TSC寄存器,获得cpu经历了多少个时钟,然后在信号处理程序的入口处再一次读取TSC寄存区,得到此时cpu经历的时钟数,两次相减就得到从发送信号到进入信号处理程序cpu所经历的时钟数,然后除以cpu的主频,就得到了具体的时间。

 

下面是测试程序的部分源码

 

#include <stdlib.h>

#include <stdio.h>

#include <signal.h>

#include <unistd.h>

#include <fcntl.h>

#if defined(__i386__)

 

static __inline__ unsigned long long rdtsc(void)          //32位系统下读取TSC计数器的值

{

  unsigned long long int x;

     __asm__ volatile (".byte 0x0f, 0x31" : "=A" (x));

     return x;                                                               //

                                                                             

#elif defined(__x86_64__)

static __inline__ unsigned long long rdtsc(void)    //64位系统下读取TSC计数器的值

{

  unsigned hi, lo;

  __asm__ __volatile__ ("rdtsc" : "=a"(lo), "=d"(hi));

  return ( (unsigned long long)lo)|( ((unsigned long long)hi)<<32 );

}

 

#endif

 

volatile int end;

int sum;

void signal_handler(int signal)

{

  end = rdtsc();

  /*int i=0;

  for(; i< 0 ; ++i)

        {

           sum+=1;

        }

  */ 

}

int main(void)

{

        signal(SIGUSR1, signal_handler);

        volatile int start = 0;

        register int end_new = 0;

        int loop;

        char result[50] = {'\0'};

        int fd = open("result_load.txt", O_CREAT|O_RDWR);

        const int MAX_COUNT = 10000000;

        const float CPU_MHZ = 3093.059;    //use cat /proc/cpuinfo get the value

        const float CPU_tick_count_per_second = CPU_MHZ*1000*1000;

       

       for(loop =0; loop<1000;loop++)      //测试10000次

       {

        printf("start to send signal.\n");

        start = rdtsc();                     //开始计数

        kill(getpid(),SIGUSR1);              //立即发送信号

        printf("runtickcount:%d,runtime:%f/s\n",end-start,(end -start)/CPU_tick_count_per_second);

        sleep(1);

        sprintf(result, "run time:%f\n", ((end-start)/CPU_tick_count_per_second));

        write(fd, result, 50);

       }

        return 0;

}

运行此程序就可以得到系统对软终端的响应时间,上面的情况是在系统没有负载的情况下,现实应用中系统往往是有负载的,甚至有很重的负载,所以我们为了模拟真实情况,对系统加了一些负载,写了如下几个负载,充分利用到系统各方面的资源

1) 创建4个进程反复进行内存的分配和释放操作; (利用内存)

2) 创建4个进程反复进行大文件的写操作         (利用磁盘IO)

3) 创建四个进程反复的进行开平方操作           (利用CPU)

加了这样的负载以后,系统的负载已经很重了,差一点的机器会出现交互响应很慢,甚至不能交互,下面是负载程序的源代码

#include <stdio.h>

#include <stdlib.h>

#include <math.h>

#include <unistd.h>

#include <fcntl.h>

 

#define MALLOC_COUNT 2000000000

#define BUFFER_SIZE  1000

char std_buf[3] = "\xff\xff\xff";

 

void xad_fill_buf(char pattern[3], unsigned long bufsize, char *buf)

{

    int loop;

    for (loop = 0; loop < (bufsize / 3); loop++)

   {

    *buf++ = pattern[0];

    *buf++ = pattern[1];

    *buf++ = pattern[2];

    }

}

 

 

int main()

{

 double a = 2.0, b = 3.0, c = 4.0, d = 5.0;

 int i,j;

 int count = 0;

 int total_bytes = 0;

 pid_t pid1, pid2, pid3, pid4, pid5;

 FILE* f;

 double array[4]={a, b, c, d};

 

for(i=0;i<4;i++)                 //四个开平方的进程

{

 if(fork() == 0)

   {

    for(j=0;j<1000000;j++)

         printf("The sqrt(a) is:%f\n",sqrt(array[i]));

    exit(0);

   }

}

 

 

 for(i=0;i<4;i++)           //四个分配释放内存的进程

  {

   if(fork() == 0)

    {

     for(i=0;i<400;i++)

          {

       char *p = (char*)malloc(MALLOC_COUNT);

           printf("200M memeory allocated.\n");

       sleep(1);

           //free(p);

       }

     return 0;

    }

  }

 

 

for(i=0;i<4;i++)             //四个写大文件的进程

  {

   if(fork() == 0)

   {

 

   char filename[10];

   char buf[BUFFER_SIZE];

   sprintf(filename, "file_%d", i); 

   int fd = open(filename, O_RDWR|O_CREAT);

   if(fd<0)

    {

     printf("Create file failed.\n");

     exit(-1);

    }

  

   if((f = fdopen(fd, "r+")) == NULL)

    {

     strerror("error\n");

     exit(-1);

    }

  

 

   while( (fwrite(&buf, 1, BUFFER_SIZE,f)) == BUFFER_SIZE)

    {

     count++;

     xad_fill_buf(std_buf, BUFFER_SIZE, buf);

     if(count == 100000)

    {

         total_bytes+=100;                                         //每次写100M

         printf("%dM has written to the disk.\n", total_bytes);

         count = 0;

    }

    }

   exit(0);

   }

  }

 

 return 0;

}

最后给出测试结果,我的平台上没有负载测试的时间如下图

 

下面是有负载时测试的输出,左边为负载程序运行,右边为延迟时间


 

 

 

阅读(1929) | 评论(12) | 转发(3) |
给主人留下些什么吧!~~

fuliangcheng2013-01-21 10:55:50

kondykuang:博主你好,如果一个嵌入式linux系统主机 通过一个外部中断接到一个FPGA(或者单片机)板子上,使用FPGA模拟一个电平跳变。linuxkernel捕获倒这个中断,isr中操作linux主机的一个gpio输出一个电平跳变。然后使用高采样率的示波器同时捕获中断引脚 和GPIO的信号,理论上可以得到输入与响应间延时吧。

你好,这种方法应该是可以的,可能对示波器的要求会比较高,而且我想测通用Linux的实时性,不过确实是一种思路,谢谢你

回复 | 举报

kondykuang2013-01-19 22:01:34

博主你好,如果一个嵌入式linux系统主机 通过一个外部中断接到一个FPGA(或者单片机)板子上,使用FPGA模拟一个电平跳变。linuxkernel捕获倒这个中断,isr中操作linux主机的一个gpio输出一个电平跳变。然后使用高采样率的示波器同时捕获中断引脚 和GPIO的信号,理论上可以得到输入与响应间延时吧。

fuliangcheng2013-01-17 12:41:03

gfree_wind:对实时操作系统没什么研究,不过有个问题。
依赖于应用层的信号处理来测量实时性,靠谱吗?

我确实没有想到什么好的办法,内核系统时钟精度太低,内核定时器肯定不行,所以就不能再程序里在特定时间产生中断

回复 | 举报

gfree_wind2013-01-17 12:26:30

对实时操作系统没什么研究,不过有个问题。
依赖于应用层的信号处理来测量实时性,靠谱吗?

2007robot2013-01-16 15:35:28

Bean_lee:看起来你理解的比较深,实时操作系统确实没啥研究。

gettimeofday和xtime的定时精度,在这篇博文中测试过,可以看一下。

http://blog.youkuaiyun.com/yuanlulu/article/details/6023253

回复 | 举报
评论热议
03-27
### Continuous Wave Test in IT Context In the information technology context, a **Continuous Wave (CW)** test typically refers to an evaluation or testing process involving continuous signals or data streams that remain constant over time without modulation. This type of signal is often utilized in communication systems, radar technologies, and wireless networking environments where stable transmission characteristics are required. The term "continuous wave" originates from its use in radio frequency applications but has been adapted into broader contexts within IT infrastructure management and network diagnostics[^1]. For instance: - In telecommunications engineering, CW tests may involve sending unmodulated carrier waves through channels to measure attenuation, interference levels, phase shifts, etc., ensuring proper functionality under ideal conditions. - Within machine learning frameworks like TensorFlow Lite GPU acceleration mechanisms mentioned earlier [^2], similar principles apply when validating model performance metrics against consistent input patterns during inference phases. Additionally, it should be noted that while fine-grained predictions might seem appealing at first glance as per another reference provided previously [^3], overly detailed simulations could lead to diminishing returns unless carefully aligned with real-world operational scenarios. For achieving better results using tools such as ChatGPT on specialized topics including those related directly hereabout continuous-wave evaluations inside technological settings - appropriate role assignment becomes critical according given advice elsewhere too [^4]. ```python def cw_test_signal(frequency=1e6, duration=1, amplitude=1): """ Generate a simple sine wave representing a continuous wave signal Args: frequency (float): Frequency of the generated wave in Hz duration (int) : Duration of the output waveform in seconds amplitude(float): Amplitude value for scaling purposes Returns: numpy array containing values corresponding to each point along specified period length based upon defined params above """ import numpy as np t = np.linspace(0,duration,int((duration)*frequency)) y = amplitude * np.sin(2*np.pi*frequency*t) return y ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值