用下面的HTML代码讲解:
html = '''
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>demo</title>
</head>
<body>
<div id = container>
<ul class="list1">
<li class="item-0">frist line</li>
<li class="item-1">second line</li>
<li class="item-0 active"><a href="http://httpbin.org">third line</a></li>
<li class="item-1 active"><a href="https://www.baidu.com/"><span class="des">fourth line</span></a></li>
</ul>
</div>
<div id = container2>
<ul class="list2">
<li class="item2-0">frist line</li>
<li class="item2-1">second line</li>
<li class="item2-0 active"><a href="http://httpbin.org">third line</a></li>
<li class="item2-1 active"><a href="https://www.baidu.com/"><span class="des">fourth line</span></a></li>
</ul>
</div>
</body>
</html>
创建PyQuery对象
doc = PyQuery(html) #把字符串加载成PyQuery对象
# print(doc)
# print(type(doc))
# print(doc("div"))
attr是用来获取或者添加属性值的
text是用来获取或者改变文本内容的:覆盖式改变
html是用来新增或者改写HTML文本,还可以获取单条文本
# 拿到`<li class="item-0 active"><a href="http://httpbin.org">third line</a></li>`这条标签:
li = doc(".item-0.active")
# 添加属性名和值
li.attr("name","bin~ibn")
print(li)
# 改变文本的内容
li.text("改变文本内容")
print(li)
# 将文本彻底的修改,可以加代码块
li.html('<span class="change">change</span>')
注意:
1、li.html('<span class="change">change</span>')
的class的值必须用双引号引起来。
2、html方法如果要获取文本的话,必须使用for循环遍历,因为是逐条获取文本信息。