Python爬虫学习第一天--正则表达式

本文详细介绍了Python中正则表达式的使用方法,包括各种匹配模式、常用函数如match、search、findall等的用法说明及其区别。同时列举了多种标志位的作用,适合初学者快速上手。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  


正则表达式
  字符串规则过滤匹配(re模块)
  tool.oschina.net#在线测试正则表达式

  re.match(pattern,string,flags)
  pattern#正则表达式
  string#匹配的字符串

  flags#标志位
    re.I 使匹配对大小写不敏感
    re.L 做本地化识别(locale-aware)匹配
    re.M 多行匹配,影响 ^ 和 $
    re.S 使 . 匹配包括换行在内的所有字符
    re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
    re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解
    re.match(pattern,string,flags).span()#匹配范围
    re.match(pattern,string,flags).group(num)#匹配所需的目标内容

    re.search(pattern,string,flags)# 扫描整个字符串并返回第一个成功的匹配。
    re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。

  re.findall(string[, pos[, endpos]])#在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。
    pos匹配开始位置
    endpos匹配结束位置

  注意: match 和 search 是匹配一次 findall 匹配所有。


  re.sub(pattern, repl, string, count=0, flags=0)#替换

  repl#替换的字符串
  count#替换的次数,0所有替换

  re.compile(pattern[, flags])#compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。

正则表达式模式
  ^ 匹配字符串的开头
  $ 匹配字符串的末尾
  . 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。
  [...] 用来表示一组字符,单独列出:[amk] 匹配 'a','m'或'k'
  [^...] 不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
  re* 匹配0个或多个的表达式。
  re+ 匹配1个或多个的表达式。
  re? 匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
  re{ n} 精确匹配 n 个前面表达式。例如, o{2} 不能匹配 "Bob" 中的 "o",但是能匹配 "food" 中的两个 o。
  re{ n,} 匹配 n 个前面表达式。例如, o{2,} 不能匹配"Bob"中的"o",但能匹配 "foooood"中的所有 o。"o{1,}" 等价于 "o+"。"o{0,}" 则等价于 "o*"。
  re{ n, m} 匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
  a| b 匹配a或b
  (re) 匹配括号内的表达式,也表示一个组
  (?imx) 正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中的区域。
  (?-imx) 正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。
  (?: re) 类似 (...), 但是不表示一个组
  (?imx: re) 在括号中使用i, m, 或 x 可选标志
  (?-imx: re) 在括号中不使用i, m, 或 x 可选标志
  (?#...) 注释.
  (?= re) 前向肯定界定符。如果所含正则表达式,以 ... 表示,在当前位置成功匹配时成功,否则失败。但一旦所含表达式已经尝试,匹配引擎根本没有提高;模式的剩余部分还要尝试界定符的右边。
  (?! re) 前向否定界定符。与肯定界定符相反;当所含表达式不能在字符串当前位置匹配时成功
  (?> re) 匹配的独立模式,省去回溯。
  \w 匹配字母数字及下划线
  \W 匹配非字母数字及下划线
  \s 匹配任意空白字符,等价于 [\t\n\r\f].
  \S 匹配任意非空字符
  \d 匹配任意数字,等价于 [0-9].
  \D 匹配任意非数字
  \A 匹配字符串开始
  \Z 匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串。
  \z 匹配字符串结束
  \G 匹配最后匹配完成的位置。
  \b 匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
  \B 匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
  \n, \t, 等. 匹配一个换行符。匹配一个制表符。等
  \1...\9 匹配第n个分组的内容。
  \10 匹配第n个分组的内容,如果它经匹配。否则指的是八进制字符码的表达式。

转载于:https://www.cnblogs.com/chenxiaoweiworkinghard/p/9281771.html

内容概要:本文深入探讨了Kotlin语言在函数式编程和跨平台开发方面的特性和优势,结合详细的代码案例,展示了Kotlin的核心技巧和应用场景。文章首先介绍了高阶函数和Lambda表达式的使用,解释了它们如何简化集合操作和回调函数处理。接着,详细讲解了Kotlin Multiplatform(KMP)的实现方式,包括共享模块的创建和平台特定模块的配置,展示了如何通过共享业务逻辑代码提高开发效率。最后,文章总结了Kotlin在Android开发、跨平台移动开发、后端开发和Web开发中的应用场景,并展望了其未来发展趋势,指出Kotlin将继续在函数式编程和跨平台开发领域不断完善和发展。; 适合人群:对函数式编程和跨平台开发感兴趣的开发者,尤其是有一定编程基础的Kotlin初学者和中级开发者。; 使用场景及目标:①理解Kotlin中高阶函数和Lambda表达式的使用方法及其在实际开发中的应用场景;②掌握Kotlin Multiplatform的实现方式,能够在多个平台上共享业务逻辑代码,提高开发效率;③了解Kotlin在不同开发领域的应用场景,为选择合适的技术栈提供参考。; 其他说明:本文不仅提供了理论知识,还结合了大量代码案例,帮助读者更好地理解和实践Kotlin的函数式编程特性和跨平台开发能力。建议读者在学习过程中动手实践代码案例,以加深理解和掌握。
内容概要:本文深入探讨了利用历史速度命令(HVC)增强仿射编队机动控制性能的方法。论文提出了HVC在仿射编队控制中的潜在价值,通过全面评估HVC对系统的影响,提出了易于测试的稳定性条件,并给出了延迟参数与跟踪误差关系的显式不等式。研究为两轮差动机器人(TWDRs)群提供了系统的协调编队机动控制方案,并通过9台TWDRs的仿真和实验验证了稳定性和综合性能改进。此外,文中还提供了详细的Python代码实现,涵盖仿射编队控制类、HVC增强、稳定性条件检查以及仿真实验。代码不仅实现了论文的核心思想,还扩展了邻居历史信息利用、动态拓扑优化和自适应控制等性能提升策略,更全面地反映了群体智能协作和性能优化思想。 适用人群:具备一定编程基础,对群体智能、机器人编队控制、时滞系统稳定性分析感兴趣的科研人员和工程师。 使用场景及目标:①理解HVC在仿射编队控制中的应用及其对系统性能的提升;②掌握仿射编队控制的具体实现方法,包括控制器设计、稳定性分析和仿真实验;③学习如何通过引入历史信息(如HVC)来优化群体智能系统的性能;④探索中性型时滞系统的稳定性条件及其在实际系统中的应用。 其他说明:此资源不仅提供了理论分析,还包括完整的Python代码实现,帮助读者从理论到实践全面掌握仿射编队控制技术。代码结构清晰,涵盖了从初始化配置、控制律设计到性能评估的各个环节,并提供了丰富的可视化工具,便于理解和分析系统性能。通过阅读和实践,读者可以深入了解HVC增强仿射编队控制的工作原理及其实际应用效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值