爬虫入门——爬取QQ音乐某一歌手前五首歌曲信息及相关评论

本文介绍了使用Python的Selenium库爬取QQ音乐中某歌手的前五首热门歌曲的详细信息,包括歌词、流派、发行时间等,并抓取每首歌的前500条评论,包括评论内容、时间、点赞数。通过分析网页结构,动态加载评论,最终实现了完整的爬虫代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


前言

python课作业
请使用爬虫Selenium模拟浏览器获取爬取QQ音乐中你喜欢的某位歌手(可以是任意歌手)最受欢迎的前5首歌曲的歌词、流派、歌曲发行时间、评论条数、评论时间、评论点赞次数、评论内容具体(每一首歌的评论>=500条)。

一、查看信息

  1. 查看QQ音乐你喜欢的歌手的网页结构
    在这里插入图片描述

  2. 获取每首歌的url
    经观察可发现所有的歌曲都在 ul class=’songlist__list’ 下,所以我们就可以通过遍历其及其子标签得到前五首歌每首歌的url

  3. 获取歌曲基本信息
    在这里插入图片描述
    在这里插入图片描述

  4. 获取前500条评论
    在这里插入图片描述
    因观察发现热门评论为15条,每点一次“点击加载更多”就会再多加载15条,所以循环(500/15)约等于33次
    热评具体信息:包括热评内容、时间、点赞数

二、代码实现

完整代码如下:

from selenium import webdriver
import csv
from time import sleep
import time

#创建Chrome浏览器对象
driver=webdriver.Chrome()
#打开QQ音乐
driver.get("https://y.qq.com/n/yqq/singer/0022eAG537I1bg.html")
#csv文件配置
csv_file = open(r'C:\Users\玐玐子公主\Desktop\python\实验\Lab2\QQmusic.csv','w',newline='',encoding='utf-8-sig')
writer = csv.writer(csv_file)
#开始时间
start = time.time()

# 取前5首歌曲
song_numer=5
#前五首歌曲url列表
song_url_list=[]
#前五首歌曲所需要的信息
song_resourses=[]

#使用selenium找到songlist__item
songlist__item=driver.find_elements_by_class_name(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值