
Regular Expression
Wang's Blog
Keep learning for the innovation era.
展开
-
Python笔记:网络爬虫概述与工作原理
概述网络爬虫(web spider) 又称为网络蜘蛛、网络机器人,是一种按一定规则,自动抓取万维网信息的程序或脚本按系统结构和实现技术进行分类通用网络爬虫:尽可能大的网络覆盖率,如百度,谷歌搜索聚焦网络爬虫:有目标性,选择性访问万维网爬取信息增量式网络爬虫:只爬取新产生或已经更新的网页信息。特点:耗费少,难度大深层网络爬虫:通过提交一些关键字才能获取的Web页面, 如登...原创 2019-11-03 11:37:46 · 764 阅读 · 1 评论 -
Python笔记:Python中的正则表达式常用使用案例
正则的应用python中解析dom中的数据关键代码:index.html文件<html> <body> <ul> <li><a href="www.baidu.com">百度</a></li> <li><a href=...原创 2019-11-03 10:34:26 · 242 阅读 · 0 评论 -
Python笔记:Python中的正则表达式常用函数整理
匹配函数re.match: 从字符串的起始位置匹配一个模式,如果不是则返回 Nonere.search: 扫描整个字符串并返回第一个成功的匹配re.findall: 在字符串中找到正则表达式所匹配的所有子串, 并返回一个列表, 如果没有找到匹配,返回空列表 []re.finditer: 与 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。其...原创 2019-11-02 22:56:08 · 317 阅读 · 2 评论 -
Python笔记:Python中的正则表达式基础入门
python 中简单的字符串查找在python中我们可以使用字符串提供的find方法来匹配字符str = 'ssdfsds2wwws'str.find('www') # 存在 返回 8str.find('xx') # 不存在 返回 -1python中的正则re模块介绍关于re模块re模块是使Python语言拥有全部正则表达式功能,使用前需要使用import re导入此功能co...原创 2019-11-02 21:47:56 · 446 阅读 · 0 评论