
Regular Expression
Wang's Blog
Keep learning for the innovation era.
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python笔记:网络爬虫概述与工作原理
概述 网络爬虫(web spider) 又称为网络蜘蛛、网络机器人,是一种按一定规则,自动抓取万维网信息的程序或脚本 按系统结构和实现技术进行分类 通用网络爬虫:尽可能大的网络覆盖率,如百度,谷歌搜索 聚焦网络爬虫:有目标性,选择性访问万维网爬取信息 增量式网络爬虫:只爬取新产生或已经更新的网页信息。特点:耗费少,难度大 深层网络爬虫:通过提交一些关键字才能获取的Web页面, 如登...原创 2019-11-03 11:37:46 · 780 阅读 · 1 评论 -
Python笔记:Python中的正则表达式常用使用案例
正则的应用 python中解析dom中的数据 关键代码: index.html文件 <html> <body> <ul> <li><a href="www.baidu.com">百度</a></li> <li><a href=...原创 2019-11-03 10:34:26 · 254 阅读 · 0 评论 -
Python笔记:Python中的正则表达式常用函数整理
匹配函数 re.match: 从字符串的起始位置匹配一个模式,如果不是则返回 None re.search: 扫描整个字符串并返回第一个成功的匹配 re.findall: 在字符串中找到正则表达式所匹配的所有子串, 并返回一个列表, 如果没有找到匹配,返回空列表 [] re.finditer: 与 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。 其...原创 2019-11-02 22:56:08 · 331 阅读 · 2 评论 -
Python笔记:Python中的正则表达式基础入门
python 中简单的字符串查找 在python中我们可以使用字符串提供的find方法来匹配字符 str = 'ssdfsds2wwws' str.find('www') # 存在 返回 8 str.find('xx') # 不存在 返回 -1 python中的正则re模块介绍 关于re模块 re模块是使Python语言拥有全部正则表达式功能,使用前需要使用import re导入此功能 co...原创 2019-11-02 21:47:56 · 455 阅读 · 0 评论