scrapy ValueError: Missing scheme in request url://www.xxxx.com.html

本文介绍了一种在爬虫中处理不完全URL的方法,通过使用response.urljoin()函数将相对路径转换为完整URL,确保链接可以正确访问。
该文章已生成可运行项目,

其实就是缺少了 http那些东西,补全就行,完整的连接

 urll = nodeList[i].extract()   #拿到得连接没有http
            urlll = response.urljoin(urll)  #添加http成为一个完整得连接
            print("object_url_xpath :" + urlll)  # 拿到其中一个链接
            yield scrapy.Request(urlll, meta={'item': item}, callback=self.parse, headers=self.headers)
本文章已经生成可运行项目
评论 5
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值