爬虫-BeautifulSoup-蛋壳公寓租房

本篇博客详细介绍了使用Python的requests库和BeautifulSoup库爬取蛋壳公寓网站上房源信息的方法,包括如何发送HTTP请求、解析HTML页面并提取房源名称、链接、价格、位置及优惠等关键信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import re,requests
from bs4 import BeautifulSoup


def get_page_info(page=1):
    url="https://www.danke.com/room/sh?page="+str(page)
    headers={
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36",
        "Referer":"https://www.danke.com/sh"
    }
    r=requests.get(url,headers=headers)
    soup=BeautifulSoup(r.text,'html.parser')
    house_list=soup.find_all("div",attrs={"class":"r_lbx"})
    for once in house_list:
        house_name=once.find("div",attrs={"class":"r_lbx_cena"}).a.attrs['title']
        house_url=once.find("div",attrs={"class":"r_lbx_cena"}).a.attrs['href']
        house_price=once.find("span",attrs={"class":"ty_b"}).text.strip()
        house_station_info=once.find("div",attrs={"class","sub_img"}).next_element.strip()
        house_info4=once.find(text=re.compile("㎡"))
        house_info4=re.sub("\s",'',house_info4)
        try:
            house_discount=once.find("div",attrs={"class":"new-price-link"}).text
            house_discount=re.sub("\s",'',house_discount)[:-2]
        except AttributeError :
            house_discount="暂无优惠"
        print(house_discount)

for page in range(1,5):
    get_page_info(page)


# import re
#
# str1="距5号环中线,10号线五和站400米"
# str2="距3号龙岗线六约站250米"
# str3="距1号罗宝线,3号龙岗线购物公园站850米"
# str4="距2号蛇口线,9号线景田站500米"
# str5="距9号线香梅站200米"
# regex="距(?:(\d+)号([\u4e00-\u9fa5]*)线,)?(\d+)号([\u4e00-\u9fa5]*)线([\u4e00-\u9fa5]*)站(\d+)米"
# print(re.search(regex,str1).groups())
# print(re.search(regex,str2).groups())
# print(re.search(regex,str3).groups())
# print(re.search(regex,str4).groups())
# print(re.search(regex,str5).groups())

C:\Anaconda3\python.exe D:/AI/01-AI基础/AI-3-Python高级/01爬虫PPT/day3_lxml和动态请求/demo1-蛋壳公寓BeautifulSoup.py
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠

Process finished with exit code 0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值