
解析库
正则、xpath、bs4、pyquery
埋首沉迷.
有意义就是好好活,好好活就是做有意义的事
展开
-
BS4解析库
Beautiful Soup4解析库一、简介1.简介BeautifulSoup 是一个从HTML或XML文件中提取数据的Python解析库,使用方式简单方便,借助网页的结构和属性等特性来解析网页2.安装pip install beautifulsoup43.官方中文文档https://www.crummy.com/software/BeautifulSoup/bs4/doc/inde...原创 2019-11-29 15:07:27 · 1203 阅读 · 0 评论 -
XPath解析库
XPath解析库一、简介1.简介XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言,最初用于搜索XML文档,但同样适用于HTML文档的搜索,选择功能强大2.安装在python中很多库都提供XPath的功能,但是最流行的还是lxml这个库,效率最高pip install lxml3.官方文档https://www.w3.org/...原创 2019-11-29 15:06:32 · 465 阅读 · 0 评论 -
正则表达式
正则表达式一、正则表达式语法1.普通字符英文半角字符,匹配时只匹配与自身相同的一个字符2.元字符元字符:表示一些特殊的含义,一般不是指具体字符表达式匹配.匹配除换行符\n以外的任意一个字符|逻辑或操作符[]匹配字符集中的一个字符[^]对字符集求反,尖号必须在方括号里的最前面-定义[]里的一个字符区间,例如[a-z]\对紧跟其...原创 2019-11-29 15:05:43 · 142 阅读 · 0 评论