爬取网易云音乐所有歌手名字和链接

本文介绍如何利用Python进行网络爬虫,面向对象地实现爬取网易云音乐平台上的所有歌手名称及其对应的链接。通过这个过程,你可以学习到网络请求、解析HTML以及数据存储等相关知识。

采用面向对象的方式代码如下:

import requests
from lxml import etree
from urllib import request
import time

class WangYiYun:
    def __init__(self,base_url):
        # 初始化tree
        self.html = self.request_url(base_url)
        self.parse_html()

    def request_url(self,base_url):
        # 请求访问 生成树结构
        headers = {
            'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
        }
        self.html = requests.get(url = base_url, headers = headers).content.decode('utf-8')
        self.tree = etree.HTML(self.html)
        return self.tree

    def parse_html(self):
        # 解析各类歌手url
        group_list = self.html.xpath('//div[@class = "blk"]')

        for group in group_list:
            # 连接分类
            href_list = group.xpath('.//a/@href')
            # 歌手分类
            group_name_list = group.xpath('.//a/text()')
            # print(group_name_list)
            for href, gr
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值