爬虫 之 xpath 库

from lxml import etree

html = etree.parse('~~某html文本~~.txt',etree.HTMLParser())
result = html.xpath('//*')  
print(result)

 

我们这次的目标,就是看看 xpath() 的参数能找到哪些节点或者属性或者文本内容

 

第一步,定位节点(定位了节点,才能取其属性值、文本内容把)

 

xpath('//li')

能找到所有的li节点

 

xpath('//li/a')

能找到所有li节点直接的a子节点

 

xpath('//li//a')

能找到li节点 的 子孙中的a节点

 

xpath(’//li/a[@class=”color“]‘)

能找到li节点的  满足class属性值为 color的 a子节点

 

xpath('//li/a[contains(@class,“li“)]')

当<a class='li li_color'>时,要匹配这样的节点,就要用contains()函数了

匹配所有li 节点中 满足 class属性包含 li 的a节点、

 

xpath('//li[@name=“item” and contains(@class,“666”)]')

找所有满足两个条件的li节点,  条件1:name属性值为item ,条件二 class属性值包含666

 

xpath('//li[@name="666"]/..')

找所有li节点 属性名name的属性值为666的父节点

 

xpath('//li[1]')

找所有li节点中的第一个li节点     (这里的顺序就是从1 开始的,并非0)

 

关于节点轴的这边省略了。

 

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~·

想了想还是补一下:

xpath('//li/ancestor::*')#所有li节点的所有祖先节点
xpath('//li/ancestor::div')#所有li节点的所有是div的 祖先节点
xpath('//li/attribute::*')#所有li节点的所欲属性值
xpath('//li/child::a[@name="666"]')#所有li节点的直接孩子节点中  满足条件 name=666的 a节点
xpath('//li[1]/descendant::span')#第一个li节点的 子孙节点中的 span节点
xpath('//li[1]/following::*[2]')#第一个li节点之后的(内部节点不算)所有节点中的第二个节点
xpath('//li[1]/following-sibling::*')#第一个li节点之后的所有同辈节点

 

二。取节点的文本内容

xpath('//li/a/text()')

取所有li节点的直接子节点a 的内部文本内容

 

三。取节点的属性值

xpath('//li/a/@herf')

取所有li节点的直接子节点a 的herf属性值

 

ok

 

 

 

88

内容概要:本文系统介绍了标准化和软件知识产权的基础知识,涵盖标准化的基本概念、分类、标准代号、国际标准的采用原则及程度,重点讲解了信息技术标准化、ISO与IEC等国际标准化组织以及ISO9000和ISO/IEC15504等重要标准体系;在知识产权部分,详细阐述了知识产权的定义、分类及特点,重点分析了计算机软件著作权的主体、客体、权利内容、行使方式、保护期限及侵权认定,同时涉及商业秘密的构成与侵权形式、专利权的类型与申请条件,以及企业如何综合运用著作权、专利、商标和商业秘密等方式保护软件知识产权。; 适合人群:从事软件开发、项目管理、IT标准化或知识产权相关工作的技术人员与管理人员,以及备考相关资格考试的学习者;具备一定信息技术背景,希望系统掌握标准化与软件知识产权基础知识的专业人员。; 使用场景及目标:①帮助理解各类标准的分类体系及国际标准采用方式,提升标准化实践能力;②指导企业在软件研发过程中有效保护知识产权,规避法律风险;③为软件著作权登记、专利申请、技术保密等提供理论依据和操作指引。; 阅读建议:建议结合国家相关政策法规和实际案例进行深入学习,重点关注软件著作权与专利权的适用边界、标准制定流程及企业知识产权管理策略,强化理论与实践的结合。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值