linux c 正则表达式

本文介绍了一个使用C语言和正则表达式从特定格式的日志字符串中提取时间戳、消息类型等信息的例子。通过定义复杂的正则表达式模式并运用`regex.h`库中的函数,能够准确地匹配并获取所需的各个字段。
#include <stdio.h>
#include <sys/types.h>
#include <string.h>
#include <regex.h>
/**
* 要提取出字符串中的时间,消息类型,发送者 接收者 消息内容
*/
int main(int argc, char** argv) {
char *str = "20120302T12:12:12: [message] (test): [SAVE] chat 12234124@test to 234325@test: content";
char * pattern = "([0-9]{4}[0-9]{2}[0-9]{2}T[0-9]{2}:[0-9]{2}:[0-9]{2}): \\[message\\].+\\[\.+\] ([a-zA-Z]+) ([0-9a-z]+)@.+ to ([0-9a-z]+)@.+: (.+)";
regex_t reg;
regmatch_t pm[10];
int z,cflags = 0;;
z = regcomp(&reg, pattern, cflags);
//先编译正则表达式,正确返回0
if (z != 0) {
regerror(z, &reg, ebuf, sizeof(ebuf));
fprintf(stderr, "%s: pattern '%s' \n", ebuf, pattern);
return 1;
}
z = regexec(&reg, lbuf, nmatch, pm, 0);
if (z == REG_NOMATCH)
continue;
else if (z != 0) {
regerror(z, &reg, ebuf, sizeof(ebuf));
fprintf(stderr, "%s: regcom('%s')\n", ebuf, lbuf);
return 2;
}
/* 输出处理结果 */
for (x = 0; x < nmatch && pm[x].rm_so != -1; ++x) {
if (!x)
printf("%04d: %s\n", lno, lbuf);
printf(" $%d='%s'\n", x, substr(lbuf, pm[x].rm_so, pm[x].rm_eo));
}
/* 释放正则表达式 */
regfree(&reg);
return 0;
}
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值