Python爬虫-利用xpath解析爬取58二手房详细信息

最新推荐文章于 2023-12-26 15:39:04 发布

原创

最新推荐文章于 2023-12-26 15:39:04 发布 · 4.9k 阅读

42 ·

CC 4.0 BY-SA版权

文章标签：

#python

本文是一篇关于使用Python爬虫通过XPath解析技术抓取58同城二手房详情页面内容的实践教程，旨在提升Python爬虫技能。文章包含爬虫代码展示及运行结果截图。

文章目录

前言
介绍
代码
运行结果截图

前言

简单的Python练习，对页面中的某些部分的文字进行爬取

介绍

在这里插入图片描述

xpath解析： 最常用且最便捷高效的一种解析方式。通用型。
    -xpath解析原理：
        - 1. 实例化一个etree的对象，且需要将被解析的页面源码数据加载到该对象中。
        - 1. 调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获。
    环境的安装：
        - pip install lxml
    -如何实例化一个entree对象：from lxml import etree
        - 1. 将本地的html文档中的源码数据加载到etree对象中：
            etree.parse（filePath）
        - 2. 可以将从互联网上获取的源码数据加载到该对象中
            etree.HTML（'page_text'）
        -xpath（'xpath表达式'）
    -xpath表达式：
        - /:表示的是从一个根节点开始定位，表示一个层级。
        - //:表示的是多个层级，可以从任意位置开始定位。
        - 属性定位：//div[@class