python爬取人人车网站数据

本文介绍使用Python的requests和re库从人人车网站抓取二手车信息,并将数据保存到Excel文件中的方法。通过解析网页源代码,提取车型品牌、路程数、首付价格和成交价格等关键信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

使用python对人人车网站进行爬取

# 导入库requests、re、xlwt
import requests
import re
import xlwt
header={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.110 Safari/537.36"}
car_url="https://www.renrenche.com/ganzhou/ershouche/le-suv_chaozhi/?le=suv&tag=gr&plog_id=a78e0769211c88d019cac53778147f92"
CarData=requests.get(car_url,headers=header)
CarData.encoding='utf-8'                      #防止出现乱码utf-8或者gbk
# print(CarData.text)

workBook=xlwt.Workbook(encoding='utf-8')       #创建Excel
workSheet=workBook.add_sheet('res')            #创建字表
colName=['车型品牌','路程数','首付价格','成交价格']
for col in range(len(colName)):
    workSheet.write(0,col,colName[col])



RenRenCar=re.findall('<li class="span6 list-item car-item " data-is-near="0" style="">(.*?)</li>',CarData.text,re.S)    #获取所有的数据
line=1
for m in RenRenCar:
    # print(m)
    # 获取人人车车名
    CarName=re.findall('<h3 class="rrcttff6fc32688c0c8524aa2cf4b5c01d508b">(.*?)</h3>',m,re.S)
    for name in CarName:
        print(name)
        workSheet.write(line,0,name)
    #获取路程数
    CarTime=re.findall('<em class="separator">/</em>(.*?)</span>',m,re.S)[0].strip()
    print(CarTime)
    workSheet.write(line,1,CarTime)
    #获取首付信息
    CarPyment=re.findall('<div class="down-payment">首付<div class="m-l">(.*?)</div>万</div>',m,re.S)[0].strip()
    print('首付',CarPyment,'万')
    workSheet.write(line,2,CarPyment)
    #获取价格
    CarTairff=re.findall('"price">(.*?)<span>万</span>',m,re.S)[0].strip()
    print(CarTairff,'万')
    workSheet.write(line,3,CarTairff)
    line+=1

workBook.save(r'C:\Users\Administrator\Desktop\人人车.xls')

效果图:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值