正则表达式应用:分析查询字符串

正则表达式作为一种分析技术,在很多地方都可以使用,最基础的可能人人都会。再此通过一系列简单的例子讲解正则表达式。

给定一个地址如何分析需要的数据,例如如下的网址,分析各个查询字符串

http://www.baidu.com/s?word=test&tn=sitehao123&ie=utf-8

基本思路是,

1先得到?后边的部分,

2再根据&和=分割


1先得到?后边的部分,

匹配查询字符串的正则表达式:\?(?<querystring>([^&]+&?)+),去掉命名部分的正则表达式为:\?([^&]+&?)+匹配到'?word=test&tn=sitehao123&ie=utf-8

\?([^&]+&?)+具体含义:

\?表示已?开头,由于?在正则表达式的中有特殊含义,所以需要一个斜杠\转义。

[^&]+表示匹配不是&的任意一个或者多个字符

&? 表示&出现一次或者不出现

\?([^&]+&?)+的整体含义就是

1匹配以?开头

2

2.1匹配不是&的多个字符

2.2匹配&一个或者没有

2.3重复2.1,2.2一次或者多次

3 把(([^&]+&?)+)部分匹配到的字符命名为querystring则正则表达式变为:\?(?<querystring>([^&]+&?)+)


2再根据&和=分割

分析查询字符串的正则表达式为:((?<key>[^&=]+)=(?<value>[^&=]+))+,去掉命名部分的正则表达式为:(([^&=]+)=([^&=]+))+

[^&=]+表示匹配不是&=的任意一个或者多个字符

(([^&=]+)=([^&=]+))+的整体含义就是

1匹配不是&=的任意一个或者多个字符

2匹配等号=

3匹配不是&=的任意一个或者多个字符

4重复以上1,2,3

把1匹配到的字符命名为key,把3匹配到的字符命名为value,则正则表达式变为((?<key>[^&=]+)=(?<value>[^&=]+))+


测试的代码如下:

  private static void Test() 
        {
            string url = "http://www.baidu.com/s?word=test&tn=sitehao123&ie=utf-8";
              Regex reg = new Regex(@"\?(?<querystring>([^&]+&?)+)");          
              Match m =  reg.Match(url);
              string querystring = m.Groups["querystring"].Value;
              Regex reg2 = new Regex(@"((?<key>[^&=]+)=(?<value>[^&=]+))+");
              Dictionary<string, string> querystringKeyValue = new Dictionary<string, string>();
              foreach (Match item in reg2.Matches(querystring))
            {             
              querystringKeyValue.Add(item.Groups["key"].Value, item.Groups["value"].Value);             
            }
        
        }



评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值