request爬虫文件方式

本文介绍了一种使用Python的requests库从中国裁判文书网下载特定案例文档的方法。通过设置请求头和POST数据,可以指定要下载的案例类型和关键字,实现自动化文档下载。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import requests


headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
}

data = {
    'docIds': '532bd8ed-4ba8-48b7-ad70-0063f64ede05|丹东通宇建筑工程公司与丹东客来多购物广场有限公司、丹东市金源房地产开发有限公司债权人撤销权纠纷审判监督民事判决书|2014-12-04',
    'conditions': '%E6%A1%88%E4%BB%B6%E7%B1%BB%E5%9E%8B%E4%B8%BA%E6%B0%91%E4%BA%8B%E6%A1%88%E4%BB%B6%E4%B8%94%E5%85%B3%E9%94%AE%E8%AF%8D%E4%B8%BA%E5%90%88%E5%90%8C',
    'keyCode': ''
}

url = 'http://wenshu.court.gov.cn/CreateContentJS/CreateListDocZip.aspx?action=1'
resp = requests.post(url, data=data, headers=headers, verify=False, stream=True)

with open('test.doc', 'wb') as fd:
    # chunk_size=512迭代每次获取数据的大小为512
    for chunk in resp.iter_content(chunk_size=512):
        fd.write(chunk)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值