用python 爬取音乐

最新推荐文章于 2024-07-15 10:36:04 发布

原创最新推荐文章于 2024-07-15 10:36:04 发布 · 874 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python

py 专栏收录该内容

1 篇文章

订阅专栏

本文介绍了一个使用Python编写的脚本，该脚本能够从指定网站批量下载音乐。通过解析网页源代码，提取音乐ID和名称，然后下载对应ID的音乐文件。此脚本利用了requests库进行网络请求，re库进行正则表达式的匹配。

#使用的是sublim text 软件

#要建好文件夹

import re
import requests
import time

#http://www.htqyy.com/genre/musicList/5?pageIndex=5&pageSize=20&order=hot
#http://www.htqyy.com/genre/5

#http://www.htqyy.com/genre/musicList/5?pageIndex=3&pageSize=20&order=hot
#找到链接对比，发现规律
#http://f2.htqyy.com/play7/490/mp3/2
#http://f2.htqyy.com/play7/1292/mp3/2

songID=[]
songName=[]

for i in range(0,2):
#   i=i+1
   url="http://www.htqyy.com/genre/musicList/5?pageIndex="+str(i)+"&pageSize=20&order=hot"
   html=requests.get(url)
   strr=html.text

   part1=r'title="(.*?)" sid='
   #part1=r' "(.*?)"sid'
   part2=r'sid="(.*?)"'

idlist=re.findall(part2,strr)
titlelist=re.findall(part1,strr)

songID.extend(idlist)
songName.extend(titlelist)

print("...................................")

for i in range(0,len(songID)):
   songurl="http://f2.htqyy.com/play7/"+str(songID[i])+"/mp3/2"
   #songurl="http://f2.htqyy.com/play7/"+str(songName[i])+"/mp3/2"
   songname=songName[i]

data=requests.get(songurl).content

print("正在下载第",i+1,"首")

with open("D:\\ssda\\{}.mp3".format(songname),"wb") as f:

f.write(data)
time.sleep(0.5)

#测试可否使用
'''
print(strr)
print(len(songID))
print(len(songName))

print(idlist)
print(titlelist)
'''