什么是pyquery
pyquery是类似于jquery的网页解析工具,让你使用jquery的风格来遍历xml文档,它使用lxml操作html的xml文档,它的语法与jquery很像,和我们之前所讲的解析库xpath与Beautiful Soup比起来更加灵活与简便,并且增加了添加类和移除节点的操作,这些操作有时会为提取信息时带来极大的便利。
使用pyquery
如果你对web有所了解,并且比较喜欢使用CSS选择器,那么这里有一款更适合你的解析库——jquery。
准备工作
在使用之前,请确保已经安装好qyquery库。安装教程如下所示:
pip install pyquery
初始化
和Beautiul Soup一样,在初始化pyquery的时候,也需要传入html文本来初始化一个pyquery对象。
初始化的时候一般有三种传入方式:传入字符串、传入URL、传入html文件。
-
字符串初始化
html = '''
<div>
<ul>
<li class="item-0">first-item</li>
<li class&#