xpath

1、什么xpath?
xpath就是用来筛选html或者xml中元素语法。
2、xml和html中一些名字。
元素
标签
属性
内容
3、xpath的语法
(1)选取节点
. --当前节点
… —代表父节点
/—从根节点开始选
// —从文档中的任意位置
nodename—选取标签或元素
@属性名—选取属性名所对应的属性值
text()----选取内容
(2)谓语:语言中就是用来限定主语的成分。
a、可以通过位置限定
[数字]选取第几个----//body/div[3]
[last()]:选取最后一个//body/div[last()]
[last()-1]:选取倒数第二个//body/div[last()]
[position()>1]:选取位置大于1----//dl/dd[position()>1]
b、通过属性限定
[@class=‘属性值’]:选取class属性等于属性值的。----//div[@class=“container”]
[contains(@href,‘baidu’)]:选取属性名为href的属性值包含baidu的标签–//a[contains(@href,“1203”)]
c、通过子标签的内容来限定
//book[price>35]–选取book标签的price字标签的内容大于35的book标签。
(3)通配符:*
@*—任意属性
* —任意节点

lxml模块:python用来解析xml和html模块,用这个模块就可以使用xpath语法。
第三方模块:pip install lxml

C:\Anaconda3\Lib\site-packages

xpath方法返回的都是列表,查元素和标签的时候装的是对象,查属性和元素的时候,装的是字符串?

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值