用python 爬取音乐

本文介绍了一个使用Python编写的脚本,该脚本能够从指定网站批量下载音乐。通过解析网页源代码,提取音乐ID和名称,然后下载对应ID的音乐文件。此脚本利用了requests库进行网络请求,re库进行正则表达式的匹配。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#使用的是sublim text 软件

#要建好文件夹

import re
import requests
import time

#http://www.htqyy.com/genre/musicList/5?pageIndex=5&pageSize=20&order=hot
#http://www.htqyy.com/genre/5

#http://www.htqyy.com/genre/musicList/5?pageIndex=3&pageSize=20&order=hot
#找到链接对比,发现规律
#http://f2.htqyy.com/play7/490/mp3/2
#http://f2.htqyy.com/play7/1292/mp3/2

songID=[]
songName=[]


for i in range(0,2):
#    i=i+1
    url="http://www.htqyy.com/genre/musicList/5?pageIndex="+str(i)+"&pageSize=20&order=hot"
    html=requests.get(url)
    strr=html.text

    part1=r'title="(.*?)" sid='
    #part1=r' "(.*?)"sid'
    part2=r'sid="(.*?)"'


    idlist=re.findall(part2,strr)
    titlelist=re.findall(part1,strr)

    songID.extend(idlist)
    songName.extend(titlelist)

    print("...................................")


for i in range(0,len(songID)):
    songurl="http://f2.htqyy.com/play7/"+str(songID[i])+"/mp3/2"
    #songurl="http://f2.htqyy.com/play7/"+str(songName[i])+"/mp3/2"
    songname=songName[i]

    data=requests.get(songurl).content

    print("正在下载第",i+1,"首")

    with open("D:\\ssda\\{}.mp3".format(songname),"wb") as f:

        f.write(data)
        time.sleep(0.5)

#测试可否使用
'''
print(strr)
print(len(songID))
print(len(songName))

print(idlist)
print(titlelist)
'''

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值