【python】带你采集房源数据并作房价分析

最新推荐文章于 2024-06-29 18:03:05 发布

原创

最新推荐文章于 2024-06-29 18:03:05 发布 · 829 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言 #pycharm #数据分析

本文介绍了如何使用Python进行链家二手房数据的采集和房价分析。通过发送请求获取网页源代码，解析并保存数据，最终实现数据分析。文章鼓励读者实践操作，并提供了学习要坚持的观点。

前言

嗨喽~大家好呀，这里是魔王呐 !

思路

一.分析数据来源

链家二手房数据：多页《—一页

二.案例代码实现

发送请求，向目标网址发送数据请求
获取网页源代码<响应文本信息>
解析数据
保存数据

采集代码

from lxml import etree
import csv
import requests

因优快云不能出现网站链接，所以我把下图代码删了，大家可以按照下图片把它添加一下

headers = {
   
   
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36'
}

html = requests.get(url=url, headers=headers)
# print(html.text)
# 解析   转换数据类型
soup = etree.HTML(html.text)