python爬虫之kfc

细精本精

已于 2024-12-06 02:51:59 修改

阅读量866

点赞数 10

分类专栏： python爬虫文章标签：爬虫

于 2024-12-06 01:00:09 首次发布

本文链接：https://blog.youkuaiyun.com/qq_48224700/article/details/144279252

版权

python爬虫专栏收录该内容

21 篇文章

订阅专栏

一起进步吧！感谢大家的支持和关注

需求

将餐厅的位置信息进行数据爬取

分析

目标地址：https://www.kfc.com.cn/kfccda/storelist/index.aspx
在这里插入图片描述

问题

发起的是post请求
载荷只有cname变化
持续化存储怎么换行
文件以为什么用追加方式
post中参数用data传递

源代码

import requests

# 分析
# https://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=cname
# 载荷只有cname 变化
# post请求

head = {  # 存放需要伪装的头信息
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'
}
# post请求的请求参数
data = {
    "cname": "北京",
    "pid": "",
    "pageIndex": "1",
    "pageSize": "10",
}
url = 'http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=cname'
# 在post请求中，处理请求参数的是data这个参数不是params
res = requests.post(url=url, headers=head, data=data).json()

for dic in res['Table1']:
    name = dic['storeName']
    addr = dic['addressDetail']
    with open("kfc.txt","a",encoding="utf-8") as f:
        text =f"店名:{name}   地址：{addr} \n"
        f.write(text)

print("爬取成功")