xpath

定义:1. xml路径语言,拥有在数据结构树中查找节点的能力

          2.  被开发者当做小型查询语言使用

           3. xpath通过元素和属性进行导航

            支持html

            比正则表达式简单

            比正则表达式强大

            scrapy


xpath使用路径表达式在xml文档中选取节点

路径表达式:/  从根节点选取

                    //  从匹配选择的当前节点选择文档中的节点,而不考虑他们的位置

                    @ 选取属性

使用通配符:* 匹配任何元素节点

                    @*匹配任何属性节点

选取多个路径 | :/bookstore/book/title | /bookstore/book/author

xpath的使用:安装 lxml: pip install lxml

                        

from lxml import etree
html = etree.parse('hello.html')
print(type(html))
# result=html.xpath('//div/ul|//div/ul/li')
# result=html.xpath('//li//a[@href="pla.html"]')
#result=html.xpath('//li//@href') #获取li下的所有href
#result=html.xpath('//li//@class') #获取li下的所有class
result=html.xpath('//*')
print(result)
print(len(result))
print(type(result))
# print(result[0].text)









评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值