1、爬取首页信息源码
2、以爬取二手房标题为例
通过F12抓包工具,快捷键【Ctrl+Shift+C】点击二手房标题,查看源码。
进行数据解析
通过两个二手房标题分析源码
h2 class="title"标题是在标签div class="content-side-left"下的标签ul class="house-list-wrap"下的li标签里面
如图:
进一步分析:
h2 class=“title"标题是在上述li标签下的第二个div标签中,需要解析h2标签下的a标签,得到文本数据。
结果如下:
知识点:
属性定位