scrapy框架爬取虎牙直播有关信息

主程序hy.py:

# -*- coding: utf-8 -*-
import scrapy
from ..items import sortItem,gameInfo,gameSonSort,houseInfo
from scrapy import Request
import re
from time import sleep


class HySpider(scrapy.Spider):
    name = 'hy'
    allowed_domains = ['huya.com']
    start_urls = ['http://huya.com/g']

    def parse(self, response):
        Sort=sortItem()
        urls = response.xpath("//div[@class='filter']/dl[1]/dd[position()=5]/a/@href").extract()
        names=response.xpath("//div[@class='filter']/dl[1]/dd[position()=5]/a/span/text()").extract()
        for  i in range(len(urls)):
            Sort['Surl']=urls[i]
            Sort['Sname']=names[i]
            yield Sort
            url=urls[i]
            yield response.follow(url,self.parseSort)

    def parseSort(self,response):
        game=gameInfo()
        gameName=response.xpath('//ul[@id="js-game-list"]/li/@title').extract()
        gameUrl=response.xpath('//ul[@id="js-game-list"]/li/a/@href').extract()
        gameImg=response.xpath('//ul[@id="js-game-list"]/li/a/img/@src').extract()
        gameGid=response.xpath('//ul[@id="js-game-list"]/li/a/@report').extract()
        str=re.compile('"game_id":"(.*)"}')
        for i in range(len(gameImg)-1):
            game['gam
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值