C++11 正则表达式——实例1

本文提供两个实用案例:一是利用正则表达式验证电子邮件地址的有效性,并解释了正则表达式的构成;二是演示如何通过正则表达式识别并打印IP地址的各组成部分。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 该实例通过一个函数is_email_valid 来检查一个email地址是否是一个正确的格式。如果格式正确则返回true。

#include <regex>

#include <iostream>

#include <string>

 

bool is_email_valid(const std::string& email)

{

  

   const std::regex pattern("(\\w+)(\\.|_)?(\\w*)@(\\w+)(\\.(\\w+))+");

 

   return std::regex_match(email, pattern);

}

 

int main()

{

   std::string email1 = "marius.bancila@domain.com";

   std::string email2 = "mariusbancila@domain.com";

   std::string email3 = "marius_b@domain.co.uk";

   std::string email4 = "marius@domain";

 

   std::cout << email1 << " : " << (is_email_valid(email1) ?

      "valid" : "invalid") << std::endl;

   std::cout << email2 << " : " << (is_email_valid(email2) ?

      "valid" : "invalid") << std::endl;

   std::cout << email3 << " : " << (is_email_valid(email3) ?

     "valid" : "invalid") << std::endl;

   std::cout << email4 << " : " << (is_email_valid(email4) ?

     "valid" : "invalid") << std::endl;

 

   return 0;

}

运行结果

     这里对is_email_valid()函数中的正则表达式做一个简短的说明,如果对于正则表示不是很清楚的同学就能很容易理解了。
     const std::regex pattern("(\\w+)(\\.|_)?(\\w*)@(\\w+)(\\.(\\w+))+"); 首先注意‘()’表示将正则表达式分成子表达式,每个‘()’之间的内容表示一个子表达式;‘\’是一个转义字符,‘\\’表示扔掉第二个‘\’的转义特性,‘\w+’表示匹配一个或多个单词,‘+’表示重复一次或者多次,因此第一个子表达式的意思就是匹配一个或者多个单词;接着看第二个子表达式,‘|’表示选择,出现‘.’或者‘_’,后面的‘?’表示该子表示出现一次或者零次,因此第二个子表示表示‘.’或‘_’出现不出现都匹配。第三个子表达式表示出现一个单词,‘*’表示任意个字符。后面的子表示根据已经介绍的内容,已经可以容易理解,就不再赘述。通过对正则表达式匹配模式串的分析,可以容易理解运行结果。

 

下面一个例子通过正则表达式识别和打印IP地址的各个部分:

#include <regex>

#include <iostream>

#include <string>

 

void show_ip_parts(const std::string& ip)

{

   // regular expression with 4 capture groups defined with

   // parenthesis (...)

   const std::regex pattern("(\\d{1,3}):(\\d{1,3}):(\\d{1,3}):(\\d{1,3})");

   // object that will contain the sequence of sub-matches

   std:: match_results<std::string::const_iterator> result;

   // match the IP address with the regular expression

   bool valid = std:: regex_match(ip, result, pattern);

   std::cout << ip << " \t: " << (valid ? "valid" : "invalid")

             << std::endl;

   // if the IP address matched the regex, then print the parts

   if(valid)

   {

      std::cout << "b1: " << result[1] << std::endl;

      std::cout << "b2: " << result[2] << std::endl;

      std::cout << "b3: " << result[3] << std::endl;

      std::cout << "b4: " << result[4] << std::endl;

   }

}

 

int main()

{

   show_ip_parts("1:22:33:444");

   show_ip_parts("1:22:33:4444");

   show_ip_parts("100:200");

 

   return 0;

}

运行结果:

是对正则表达式的模式串做一个说明:首先还是通过‘()’将这个串分成几个子表达式,其中\d表示匹配一个数字,{,}表示数字的个数,例如{1,3}可以理解为匹配一个小于1000的数字(1-3位数都符合匹配要求)。

程序中还使用了match_results类,用来保存匹配的每一个子序列。调用regex_match(ip,result,pattern),表示将ip中与模式串pattern匹配的结果放在result中。

result最后可以通过下标来访问各个匹配的子表达式。

 

http://www.cnblogs.com/zhuyp1015/archive/2012/04/08/2438215.html

### 如何在 C++ 中使用正则表达式 C++C++11 起提供了对正则表达式的原生支持,这使得开发者可以方便地处理字符串匹配、查找和替换等问题。要使用正则表达式功能,需包含 `<regex>` 头文件并利用 `std::regex` 及其相关类和函数。 #### 基本概念 正则表达式是一种用于描述字符模式的强大工具,在 C++ 中可以通过 `std::regex` 来定义这些模式。常见的基本符号包括: - `^`: 表示字符串的开头[^1]。 - `$`: 表示字符串的结尾。 - `[]`: 定义一个字符集合。 - `{}`: 指定重复次数。 - `()`:分组操作符。 以下是几个常用的正则表达式函数及其作用: - **`std::regex_match`**: 判断整个目标字符串是否完全匹配给定的正则表达式[^2]。 - **`std::regex_search`**: 查找是否存在部分子串能够匹配指定的正则表达式。 - **`std::regex_replace`**: 替换符合特定正则表达式的子串。 #### 示例代码展示 以下是一些具体的实例来说明如何应用上述理论: ##### 示例 1: 简单匹配 此程序检测输入文本中是否有单词以字母 'W' 开始,并由若干个小写字母组成。 ```cpp #include <iostream> #include <regex> int main() { std::string text = "Hello, World!"; // 定义正则表达式模式 std::regex pattern("W[a-z]+"); // 使用 std::regex_search 进行匹配 if (std::regex_search(text, pattern)) { std::cout << "Pattern found in the text." << std::endl; } else { std::cout << "Pattern not found in the text." << std::endl; } return 0; } ``` 这段代码展示了如何创建一个简单的正则对象并通过它执行搜索操作。 ##### 示例 2: 整体匹配验证 如果希望确认某段文字严格遵循某种格式,则可采用如下方式实现全字串匹配测试。 ```cpp #include <iostream> #include <regex> bool validateEmail(const std::string& email) { const std::regex pattern(R"(^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$)"); return std::regex_match(email, pattern); } int main(){ std::vector<std::string> emails{"example@example.com", "bademail@com"}; for(auto&& e : emails){ if(validateEmail(e)){ std::cout<<e<<" is valid.\n"; } else{ std::cout<<e<<" is invalid.\n"; } } return 0; } ``` 这里我们构建了一个更复杂的电子邮件地址校验器,其中运用到了原始字符串语法(即前缀 R),以便更容易编写复杂而清晰的正则表达式[^3]。 ##### 示例 3: 字符串替换 假设我们需要把所有数字替换成星号(*),那么可以用到 `std::regex_replace`. ```cpp #include <iostream> #include <regex> using namespace std; int main(){ string s="abc123def456ghi789jkl"; cout<<regex_replace(s,std::regex("[0-9]"),"*")<<"\n"; return 0; } // 输出结果应为 abc***def***ghi***jkl ``` 以上三个例子分别演示了不同场景下正则表达式的实际用途——从简单存在性判断至高级数据清洗任务皆有所涉猎。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值