正则表达式的写法(转)

正则表达式的写法(转)
2010年12月22日
  正则表达式是一种通用的标准,大部分计算机语言都支持正则表达式,包括as3,这里转摘出了一些常用的正则表达式语句,大家用到的时候就不用自己写了
  ^\d+$  //匹配非负整数(正整数 + 0)
  ^[0-9]*[1-9][0-9]*$  //匹配正整数
  ^((-\d+)|(0+))$  //匹配非正整数(负整数 + 0)
  ^-[0-9]*[1-9][0-9]*$  //匹配负整数
  ^-?\d+$    //匹配整数
  ^\d+(\.\d+)?$  //匹配非负浮点数(正浮点数 + 0)
  ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$  //匹配正浮点数
  ^((-\d+(\.\d+)?)|(0+(\.0+)?))$  //匹配非正浮点数(负浮点数 + 0)
  ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$  //匹配负浮点数
  ^(-?\d+)(\.\d+)?$  //匹配浮点数
  ^[A-Za-z]+$  //匹配由26个英文字母组成的字符串
  ^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串
  ^[a-z]+$  //匹配由26个英文字母的小写组成的字符串
  ^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串
  ^\w+$  //匹配由数字、26个英文字母或者下划线组成的字符串
  ^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$    //匹配email地址
  ^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$  //匹配url
  匹配中文字符的正则表达式: [\u4e00-\u9fa5]
  匹配双字节字符(包括汉字在内):[^\x00-\xff]
  匹配空行的正则表达式:\n[\s| ]*\r
  匹配HTML标记的正则表达式:/.*|/
  匹配首尾空格的正则表达式:(^\s*)|(\s*$)
  匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
  匹配网址URL的正则表达式:^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$
  匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
  匹配国内电话号码:(\d{3}-|\d{4}-)?(\d{8}|\d{7})?
  匹配腾讯QQ号:^[1-9]*[1-9][0-9]*$
  下表是元字符及其在正则表达式上下文中的行为的一个完整列表:
  \ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个后向引用、或一个八进制转义符。
  ^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的Multiline 属性,^ 也匹配 ’\n’ 或 ’\r’ 之后的位置。
  $ 匹配输入字符串的结束位置。如果设置了 RegExp 对象的Multiline 属性,$ 也匹配 ’\n’ 或 ’\r’ 之前的位置。
  * 匹配前面的子表达式零次或多次。
  + 匹配前面的子表达式一次或多次。+ 等价于 {1,}。
  ? 匹配前面的子表达式零次或一次。? 等价于 {0,1}。
  {n} n 是一个非负整数,匹配确定的n 次。
  {n,} n 是一个非负整数,至少匹配n 次。
  {n,m} m 和 n 均为非负整数,其中n 表达式,则 n 为后向引用。否则,如果 n 为八进制数字 (0-7),则 n 为一个八进制转义值。
  \nm 标识一个八进制转义值或一个后向引用。如果 \nm 之前至少有is preceded by at least nm 个获取得子表达式,则 nm 为后向引用。如果 \nm 之前至少有 n 个获取,则 n 为一个后跟文字 m 的后向引用。如果前面的条件都不满足,若 n 和 m 均为八进制数字 (0-7),则 \nm 将匹配八进制转义值 nm。
  \nml 如果 n 为八进制数字 (0-3),且 m 和 l 均为八进制数字 (0-7),则匹配八
  一、简单的日期判断(YYYY/MM/DD):
  ^\d{4}(\-|\/|\.)\d{1,2}\1\d{1,2}$
  二、演化的日期判断(YYYY/MM/DD| YY/MM/DD):
  ^(^(\d{4}|\d{2})(\-|\/|\.)\d{1,2}\3\d{1,2}$)|(^\d{4}年\d{1,2}月\d{1,2}日$)$
  三、加入闰年的判断的:
  实例:
  ^((((1[6-9]|[2-9]\d)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9]\d)\d{2})-(0?[13456789]|1[012])-(0?[1-9]|[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))-0?2-29-))$
  分析:
  1、什么是合法的日期范围?对于不同的应用场景,这个问题有不同的解释。这里采纳MSDN中的约定:
  [b]DateTime[/b]值类型表示值范围在公元(基督纪元)0001 年 1 月 1 日午夜 12:00:00 到公元 (C.E.) 9999 年 12 月 31 日晚上 11:59:59 之间的日期和时间。
  2、关于闰年的阐释。
  关于公历闰年是这样规定的:地球绕太阳公转一周叫做一回归年,一回归年长365日5时48分 46秒。因此,公历规定有平年和闰年,平年一年有365日,比回归年短0.2422日,四年共短0.9688日,故每四年增加一日,这一年有366日,就是闰年。但四年增加一日比四个回归年又多0.0312日,400年后将多3.12日,故在400年中少设3个闰年,也就是在400年中只设97个闰年,这样公历年的平均长度与回归年就相近似了。由此规定:年份是整百数的必须是400的倍数才是闰年,例如1900年、2100年就不是闰年。
  首先需要验证年份,显然,年份范围为 0001 - 9999,匹配YYYY的正则表达式为:
  [0-9]{3}[1-9]|[0-9]{2}[1-9][0-9]{1}|[0-9]{1}[1-9][0-9]{2}|[1-9][0-9]{3}
  其中 [0-9] 也可以表示为 \d,但 \d 不如 [0-9] 直观,因此下面我将一直采用 [0-9]
  用正则表达式验证日期的难点有二:一是大小月份的天数不同,二是闰年的考虑。
  对于第一个难点,我们首先不考虑闰年,假设2月份都是28天,这样,月份和日期可以分成三种情况:
  1、月份为 1, 3, 5, 7, 8, 10, 12,天数范围为 01 - 31,匹配MM-DD的正则表达式为:
  (0[13578]|1[02])-(0[1-9]|[12][0-9]|3[01])
  2、月份为 4, 6, 9, 11,天数范围为 01-30,匹配MM-DD的正则表达式为:
  (0[469]|11)-(0[1-9]|[12][0-9]|30)
  3、月份为 2,考虑平年情况,匹配MM-DD的正则表达式为:
  02-(0[1-9]|[1][0-9]|2[0-8])
  根据上面的成果,我们可以得到匹配平年日期格式为YYYY-MM-DD的正则表达式:
  ([0-9]{3}[1-9]|[0-9]{2}[1-9][0-9]{1}|[0-9]{1}[1-9][0-9]{2}|[1-9][0-9]{3})-(((0[13578]|1[02])-(0[1-9]|[12][0-9]|3[01]))|((0[469]|11)-(0[1-9]|[12][0-9]|30))|(02-(0[1-9]|[1][0-9]|2[0-8])))
  接着我们来解决第二个难点:闰年的考虑。根据闰年的定义,我们可以将闰年分为两类:
  1、能被4整除但不能被100整除的年份。寻找后两位的变化规律,可以很快得到下面的正则匹配:
  ([0-9]{2})(0[48]|[2468][048]|[13579][26])
  2、能被400整除的年份。能被400整除的数肯定能被100整除,因此后两位肯定是00,我们只要保证前两位能被4整除即可,相应的正则表达式为:
  (0[48]|[2468][048]|[3579][26])00
  [b]2.[/b][b]最[/b][b]强验证[/b][b]日期的正[/b][b]则[/b][b]表达式,[/b][b]添加了[/b][b]闰[/b][b]年的[/b][b]验证[/b]
  这个日期正则表达式支持
  YYYY-MM-DD
  YYYY/MM/DD
  YYYY_MM_DD
  YYYY.MM.DD的形式
  match : 2008-2-29 2008/02/29
  not match : 2008-2-30 2007-2-29
  [b]完整的正[/b][b]则[/b][b]表达式如下:[/b]
  ((^((1[8-9]\d{2})|([2-9]\d{3}))([-\/\._])(10|12|0?[13578])([-\/\._])(3[01]|[12][0-9]|0?[1-9])$)|(^((1[8-9]\d{2})|([2-9]\d{3}))([-\/\._])(11|0?[469])([-\/\._])(30|[12][0-9]|0?[1-9])$)|(^((1[8-9]\d{2})|([2-9]\d{3}))([-\/\._])(0?2)([-\/\._])(2[0-8]|1[0-9]|0?[1-9])$)|(^([2468][048]00)([-\/\._])(0?2)([-\/\._])(29)$)|(^([3579][26]00)([-\/\._])(0?2)([-\/\._])(29)$)|(^([1][89][0][48])([-\/\._])(0?2)([-\/\._])(29)$)|(^([2-9][0-9][0][48])([-\/\._])(0?2)([-\/\._])(29)$)|(^([1][89][2468][048])([-\/\._])(0?2)([-\/\._])(29)$)|(^([2-9][0-9][2468][048])([-\/\._])(0?2)([-\/\._])(29)$)|(^([1][89][13579][26])([-\/\._])(0?2)([-\/\._])(29)$)|(^([2-9][0-9][13579][26])([-\/\._])(0?2)([-\/\._])(29)$))
  闰年的2月份有29天,因此匹配闰年日期格式为YYYY-MM-DD的正则表达式为:
  (([0-9]{2})(0[48]|[2468][048]|[13579][26])|((0[48]|[2468][048]|[3579][26])00))-02-29最后,将平年和闰年的日期验证表达式合并,我们得到最终的验证日期格式为YYYY-MM-DD的正则表达式为:
  (([0-9]{3}[1-9]|[0-9]{2}[1-9][0-9]{1}|[0-9]{1}[1-9][0-9]{2}|[1-9][0-9]{3})-(((0[13578]|1[02])-(0[1-9]|[12][0-9]|3[01]))|((0[469]|11)-(0[1-9]|[12][0-9]|30))|(02-(0[1-9]|[1][0-9]|2[0-8]))))|((([0-9]{2})(0[48]|[2468][048]|[13579][26])|((0[48]|[2468][048]|[3579][26])00))-02-29)
  DD/MM/YYYY格式的正则验证表达式为:
  (((0[1-9]|[12][0-9]|3[01])/((0[13578]|1[02]))|((0[1-9]|[12][0-9]|30)/(0[469]|11))|(0[1-9]|[1][0-9]|2[0-8])/(02))/([0-9]{3}[1-9]|[0-9]{2}[1-9][0-9]{1}|[0-9]{1}[1-9][0-9]{2}|[1-9][0-9]{3}))|(29/02/(([0-9]{2})(0[48]|[2468][048]|[13579][26])|((0[48]|[2468][048]|[3579][26])00)))
<think>好的,用户想了解如何编写只允许输入数字和符号的正则表达式,专注于验证这部分内容。首先,我需要回顾之前的对话,看看用户之前的需求是什么。用户之前询问的是在Qt中使用正则表达式限制QComboBox输入为数字和特定符号,现在向更一般的正则表达式写法,可能希望了解不同编程语言中的实现或更详细的规则。 根据用户提供的引用,特别是引用[2]、[3]、[5],这些提到了字符类、义以及不同语言中的处理方式。例如,JS中使用方括号定义字符类,Java中需要双重义,而用户之前的问题涉及C++中的Qt框架。用户可能希望得到一个通用的正则表达式写法,但也要注意不同语言中的差异。 用户的需求是允许数字和符号,但具体符号需要明确。比如,可能需要基本的数学运算符(如+-*/)或其他符号(如括号、点号等)。需要确定符号的范围,避免遗漏或包含不需要的字符。例如,在正则表达式中,特殊字符如*、+、.等需要义,尤其是在某些语言中。 接下来,我应该构建基础的正则表达式。使用字符类[0-9]匹配数字,然后加入需要的符号。注意符号中的特殊字符是否需要义,比如在方括号内,大多数符号不需要义,但像-这样的符号需要放在末尾或义,避免被解释为范围定义符。例如,[0-9+*/-.]中的-放在末尾,避免被当作范围符号。 然后考虑不同编程语言中的实现,如JavaScript、Java、Python、C++(Qt),每个语言中的义方式不同。例如,Java中需要双反斜杠,而JavaScript中使用/.../包裹正则表达式。 另外,用户可能还需要处理一些边界情况,比如空字符串是否允许,是否允许开头或结尾的符号。例如,使用^和$确保整个字符串从头到尾都符合要求,避免部分匹配。 还要考虑是否需要更复杂的验证,比如不允许连续的符号或确保正确的表达式格式,但用户当前的问题可能只需要字符级别的验证,而不是语法正确性。因此,基础的正则表达式可能足够,但可以提到进阶需求可能需要更复杂的模式。 最后,整理示例代码,展示不同语言中的具体写法,并提醒用户注意义和语言特定要求。同时,根据之前的引用,特别是引用[5]中的字符类定义,确保使用的元字符正确,比如使用\d代替0-9可能更简洁,但用户可能更倾向于显式写法。</think>根据需求验证**数字和符号**的正则表达式写法,需明确允许的具体符号范围。以下是不同场景下的实现方案及技术细节: --- ### 一、基础规则写法 #### 1. 核心语法结构 ```regex ^[0-9符号列表]+$ ``` - `^` 表示字符串开始 - `[ ]` 定义允许的字符集合 - `0-9` 匹配所有数字 - `符号列表` 定义允许的特殊符号(需注意义) - `+` 表示至少出现一次(若允许空字符串可改为`*`) #### 2. 符号处理原则 - **非特殊符号**:如`+`、`=`、`%`等可直接放入集合 - **需义符号**:正则中有特殊含义的符号需义,例如: - `.` → `\.` - `-` → `\-`(当不在字符类首尾时) - `^` → `\^`(若不在字符类开头) --- ### 二、具体场景实现 #### 场景1:允许数字及基础数学符号(`+-*/=.`) ```regex ^[0-9+\-*/=.]+$ ``` - 符号列表:`+`, `-`(需义为`\-`), `*`, `/`, `=`, `.`(需义为`\.`) - 示例匹配值:`123+45.6`, `7*8-9`, `100/50=2` #### 场景2:允许数字及括号等符号(`()[]{}`) ```regex ^[0-9()\[\]{}]+$ ``` - 符号列表:`()`, `[]`(需义为`\[\]`), `{}` - 示例匹配值:`(1+2)`, `3[4]`, `5{6}` --- ### 三、编程语言适配 #### 1. JavaScript 实现 ```javascript const regex = /^[0-9+\-*/=.()]+$/; // 注意斜杠包裹 console.log(regex.test("12+(3*4)")); // true ``` #### 2. Java 实现(需双重义) ```java String pattern = "^[0-9+\\-*/=.()]+$"; // 义字符需双反斜杠 boolean isValid = input.matches(pattern); ``` #### 3. Python 实现 ```python import re pattern = r'^[0-9+\-*/=.()]+$' is_valid = re.fullmatch(pattern, input_str) ``` #### 4. Qt/C++ 实现 ```cpp QRegExp regExp("^[0-9+\\-*/=.()]+$"); // 注意C++字符串义 QValidator *validator = new QRegExpValidator(regExp, this); lineEdit->setValidator(validator); ``` --- ### 四、进阶验证需求 #### 1. 符号位置控制 若需限制符号不在首尾: ```regex ^(?=[^+*/=.-])([0-9+*/=.-])+(?<=[^+*/=.-])$ ``` - 使用正向预查`(?=...)`和反向预查`(?<=...)` #### 2. 避免连续符号 禁止连续出现运算符(如`1++2`): ```regex ^(?!.*[+*/=-]{2})[0-9+*/=.-]+$ ``` - `(?!.*[+*/=-]{2})` 排除连续符号 --- ### 五、常见问题解决 #### 问题1:符号`-`导致匹配异常 - **错误写法**:`[0-9+-]`(`-`在中间会识别为范围符) - **正确写法**: ```regex [0-9+\\-] // 写法(通用) [0-9+-] // 将`-`放在字符类末尾(推荐) ``` #### 问题2:小数点单独出现 若要求小数点前后必须有数字: ```regex ^[0-9]+(\.[0-9]+)?$ // 纯数字+可选小数部分 ^([0-9]+(\.[0-9]+)?|[+*/()-])+$ // 混合场景 ``` --- ### 六、符号验证速查表 | 符号类型 | 正则片段 | 备注 | |----------------|-----------------|--------------------------| | 基础数学运算符 | `+\-*/=` | `-`需义或放在末尾 | | 括号类 | `()\[\]{}` | `[]`需义为`\[\]` | | 标点符号 | `.,:;!?` | `.`需义为`\.` | | 货币符号 | `$€¥£` | 直接放入字符类 | --- ### 七、完整示例(Python版) ```python import re def validate_input(input_str): pattern = r'^[0-9+\-*/=\.()]+$' # 允许数字、+-*/=(). if re.fullmatch(pattern, input_str): print(f"'{input_str}' 是合法输入") else: print(f"'{input_str}' 包含非法字符") validate_input("(12+3.4)*5") # 合法 validate_input("abc@123") # 非法(包含字母和@) ``` --- ### 八、注意事项 1. **语言差异**:Java、C++等需额外处理义符[^3] 2. **性能优化**:避免过度复杂的正则表达式(如嵌套量词) 3. **用户提示**:验证失败时需明确提示非法字符类型[^4] ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值