1.pyquery简介
python中的pyquery模块语法与jquery相近,可用来解析HTML文件。官方文档地址:pyquery: a jquery-like library for python — pyquery 1.2.4 documentation 。通过HTML中的标签、id、给定的索引等来获取元素,使得解析HTML文件极为方便。
2.实例
2.1 爬取豆瓣电影页面中主演
右键chrome中的审查元素,观察到主演的标签为<a href="/celebrity/1005773/" rel="v:starring">

为找出主演,需要把带有rel="v:starring"的所有a标签找出来
# -*- coding: utf-8 -*-
from pyquery import PyQuery as pq
#
本文介绍了Python的PyQuery库,它提供类似于jQuery的语法来解析HTML文档,便于网络爬虫开发。通过实例展示了如何爬取豆瓣电影页面的主演信息以及实现百度贴吧帖子内容的抓取。
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



