携程:
url='https://hotels.ctrip.com/Domestic/Tool/AjaxHotelList.aspx'
1,经过多次postman,传入参数:page 为翻页的页数
for page in range(1,2):
data={
"StartTime":"2019-09-12",
"DepTime":"2019-09-13",
"RoomGuestCount":"1,1,0",
"cityId":"2",
"cityPY":"shanghai",
"cityCode":"021",
"cityLat":"31.2363508011",
"cityLng":"121.4802384079",
"page":page,
}
2,页面寻找到可以接口数据(就能爬取所有)
data = json.loads(rep.text)
dta=data['html']
dtaa=etree.HTML(dta)


本文介绍了一种使用Python爬取携程网站酒店数据的方法,通过构造请求参数并利用postman进行测试,成功获取了上海地区酒店的详细信息。解析返回的JSON数据,并利用etree进行HTML解析,实现了酒店数据的有效抓取。
1369





