book118抓取器(玩具,上大学为了看盗版书写的)

本文介绍了一款使用Python编写的book118网站图书信息抓取器,详细阐述了其开发背景及基本功能,适合初学者了解网页抓取的基本原理和实践。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

from urllib import request
from urllib import parse
import urllib
import ssl
import time
import json

def getImgUrlAll(furl,sn,img,f,page_count):
    furl=furl
    sn=sn
    img=img
    f=f
    page_count=page_count
    img_urls_id=[] #文档中每页的地址
     

    img_urls_id.append(img)
    for indexs in range(sn,page_count):
        json_url='https://view45.book118.com/PW/GetPage?f='+f+'&img='+img+'&isMobile=false&readLimit=z1SQwiTQU00uxfwJSFd6tA==&sn='+str(sn)+'&furl='+furl #请求获得文档地址的链接地址 
        context=ssl._create_unverified_context()
        try:
            url_response=urllib.request.urlopen(json_url,context=context)
            json_data=url_response.read()
            json_data=json.loads(json_data)
            img=json_data['NextPage']
            sn=json_data['PageIndex']
            img_ur
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值