常用正则
正则表达式学习文档
车牌号正则
正则表达式(支持传统车牌和新能源车牌)
/^(([京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领][A-Z](([0-9]{5}[DF])|([DF]([A-HJ-NP-Z0-9])[0-9]{4})))|([京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领][A-Z][A-HJ-NP-Z0-9]{4}[A-HJ-NP-Z0-9挂学警港澳使领]))$/
车牌规则
传统车牌
第1位为省份简称(汉字),第二位为发牌机关代号(A-Z的字母)第3到第7位为序号(由字母或数字组成,但不存在字母I和O,防止和数字1、0混淆,另外最后一位可能是“挂学警港澳使领”中的一个汉字)。
新能源车牌
第1位和第2位与传统车牌一致,第3到第8位为序号(比传统车牌多一位)。新能源车牌的序号规则如下:
(1)小型车:第1位只能是字母D或F,第2为可以是数字或字母,第3到6位必须是数字。
(2)大型车:第1位到第5位必须是数字,第6位只能是字母D或F。
URL正则
正则表达式
/^(https?:\/\/)([0-9a-z.]+)(:[0-9]+)?([/0-9-_a-z.#]+)?(\?[0-9-_a-z&=]+)?(\/?#[0-9-_a-z]+)?/i
URL规则
URL格式
protocol://hostname[:port]/path/[?query]#fragment
协议匹配规则(protocol://)
常见URL协议有http、https等等,所以这里就做针对http和https的匹配。
匹配规则 :^(https?:\/\/)
主机名匹配规则(hostname)
主机名格式为:xxx.xxx.xxx 或 xxx.xxx 2种形式 由字母或数字组成。
如:www.baidu.com baidu.com 127.0.0.1
匹配规则为:([0-9a-z.]+)
端口匹配(:port)
端口部分是由冒号开头后接数值两部分组成而且web默认端口80是不显示在后面的,所以就有2种情况存在或不存在。
如:127.0.0.1:8080 127.0.0.0
匹配规则为:(:[0-9]+)?
路径匹配(/path/)
路径是由字母、数字、斜杠、点组成。在访问网站首页时后面没有路径地址,所以这块如果存在就匹配。
如:/xxx/xxxx/xxx.html 、 /xxx/xxx
匹配规则为:([/0-9-_a-z.#]+)?
查询字符串匹配(?query)
查询字符串的格式为:?xxx=1&ddd=2 或 ?xx=2。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。
匹配规则为:(\?[0-9-_a-z&=]+)?
信息片断匹配(#fragment)
信息片断是由#、字母、数值组成。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。
匹配规则为:(\/?#[0-9-_a-z]+)?
图片链接正则
表达式
/<img\s*[^>]*\bsrc=['"]([^'"]*)[^>]*>/gi
获取img src属性值
str.replace(/<img\s*[^>]*\bsrc=['"]([^'"]*)[^>]*>/gi, (match, capture) => {
console.log(capture)
});
从富文本中提取纯文本
富文本基本上是使用html标签给文本加上丰富多彩的样式,所以只需要使用正则表达式将富文本字符串中的“<…>”标签剔除,即可得到纯文本。
function getSimpleText (richText) {
// 标签替换成空字符
return richText.replace(/<.+?>/g, '')
}
获取base64 数据类型(mime)
''.match(/:(.*?);/)[1]
// 输出 'image/png'
.*
具有贪婪的性质,首先匹配到不能匹配为止,如a.*bc 可以匹配 abcbcbc。
.*?
则相反,匹配到一个以后,则停止匹配,具有最小匹配的性质。