Watchdog Timer的缩写字母,也就是看门狗,是一个定时器电路。这个电路的功能是维护系统的正常运行,如果遇到系统卡死的情况可以自动的从硬件上复位系统。简单来说是用软件发现问题,用硬件操作解决问题。
可以看到整个模块是内部一个timer计数器,外部输入一个timer 的复位信号,输出一个中断信号和一个复位信号。
流程是:
1.设置复位超时时间
2.内部计数器进行减数计时,减到0 输出中断,数据又更新到复位超时时间,然后再减数运行,再次减到0 输出硬件的复位信号,系统复位。也有不产生中断直接第一次减数到0就输出复位信号,直接系统复位的。
3.软件在复位时间内复位timer ,保证timer 内部的数不到0.
通过调整输入时钟可以改变reset 的时间,达到自动控制系统死机重启的功能。
可以看到这个寄存器的设置档位只有7:4,也就只能设置16个不同的时间周期,并且这个周期是以2的n次方的方式,并不是通常理解的线性时间设置,16个档位肯定不能满足需求,目标必须是任意时间都可以设置,硬件如此就只能通过软件解决了。
解决办法:
1.将硬件wdt 重启时间设置成为0.5秒,这样一般也就满足了日常应用的最小时间设置。
在open 函数就启动wdt,
···
static int fh_wdt_open(struct inode *inode, struct file *filp)
{
if (test_and_set_bit(0, &fh_wdt.in_use))
return -EBUSY;
/* Make sure we don't get unloaded. */
__module_get(THIS_MODULE);
spin_lock(&fh_wdt.lock);
if(fh_wdt.plat_data && fh_wdt.plat_data->resume)
fh_wdt.plat_data->resume();
fh_wdt_set_top(WDT_HW_TIMEOUT);///3000);
if (!fh_wdt_is_enabled())
{
/*
* The watchdog is not currently enabled. Set the timeout to
* the maximum and then start it.
*/
u32 value;
value = WDOG_CONTROL_REG_WDT_EN_MASK;
writel(value, fh_wdt.regs + WDOG_CONTROL_REG_OFFSET);//设置硬件最小的超时时间
fh_wdt_keepalive();
}
fh_wdt_set_next_heartbeat();
spin_unlock(&fh_wdt.lock);
return nonseekable_open(inode, filp);
}
···
2.驱动中起一个timer 定时器,定时时间小于硬件wdt重启时间,进行软件喂狗。放置硬件定时器重启。
setup_timer(&fh_wdt.timer, fh_wdt_ping, 0);
mod_timer(&fh_wdt.timer, jiffies + WDT_TIMEOUT);
static void fh_wdt_ping(unsigned long data)
{
if (time_before(jiffies, fh_wdt.next_heartbeat) ||
(!nowayout && !fh_wdt.in_use)) {
fh_wdt_keepalive();
mod_timer(&fh_wdt.timer, jiffies + WDT_TIMEOUT);
} else
pr_crit("keepalive missed, machine will reset\n");
}
3.驱动解析应用设置的重启时间,接收应用喂狗的信息。
应用调用ioctl 配置一个全局变量用来记录软件任意时间的超时时间heartbeat。
case WDIOC_SETTIMEOUT:
if (get_user(val, (int __user *)arg))
return -EFAULT;
pr_debug("[wdt] settime value %lu", val);
heartbeat = val;
fh_wdt_keepalive();
fh_wdt_set_next_heartbeat();
return put_user(val , (int __user *)arg);
驱动把超时时间记录在fh_wdt.next_heartbeat中
static inline void fh_wdt_set_next_heartbeat(void)
{
fh_wdt.next_heartbeat = jiffies + heartbeat * HZ;
}
也可以通过write 来写
ssize_t fh_wdt_write(struct file *filp, const char __user *buf, size_t len,
loff_t *offset)
{
if (!len)
return 0;
if (!nowayout) {
size_t i;
fh_wdt.expect_close = 0;
for (i = 0; i < len; ++i) {
char c;
if (get_user(c, buf + i))
return -EFAULT;
if (c == 'V') {
fh_wdt.expect_close = 1;
break;
}
}
}
fh_wdt_set_next_heartbeat();
mod_timer(&fh_wdt.timer, jiffies + WDT_TIMEOUT);//启动下一次的超时时间
return len;
}
4.如若应用在自己设置的超时时间之内喂狗,则一直维护这个timer。如果应用在自己设置的超时时间内没有喂狗,这个timer 调用的硬件喂狗停止,放任硬件wdt 重启系统。
每0.5s timer循环进行调用fh_wdt_ping 进行时间比对,当前时间jffies 是否超过了应用预设时间fh_wdt_next_hearbeat,没超过硬件喂狗,超过不喂狗。
static void fh_wdt_ping(unsigned long data)
{
if (time_before(jiffies, fh_wdt.next_heartbeat) ||
(!nowayout && !fh_wdt.in_use)) {
fh_wdt_keepalive();
mod_timer(&fh_wdt.timer, jiffies + WDT_TIMEOUT);继续喂狗,设置0.5s重启
} else
pr_crit("keepalive missed, machine will reset\n");停止喂狗
}
总结
用软件方法解决硬件的局限