python 爬虫爬去虾米音乐 赵雷歌词

本文介绍了一个使用Python3从虾米音乐网站爬取赵雷歌曲歌词的方法。通过发送请求获取网页内容,利用BeautifulSoup解析页面并提取歌词部分,最终将歌词保存到本地文件中。
部署运行你感兴趣的模型镜像
#/usr/bin/env python
# *-*coding:utf-8 *-*


#python 3 爬取赵雷歌词

"""

"""


from collections import Counter
from urllib import request
from bs4 import BeautifulSoup as BS
import jieba
import os 


songlists = ['http://www.xiami.com/album/465009', 'http://www.xiami.com/album/2100205356', 'http://www.xiami.com/album/2013969781', 'http://www.xiami.com/album/2102413795']
songlist  = 'http://www.xiami.com/album/465009'
writefile = '~/Downlaod/赵雷歌词.txt'




class xiamimusic():

def __init__(self):
self.zhaolei = open(writefile, 'w')
self.weburl ='http://www.xiami.com'


def get_html(self,urll):
webheaders = {  'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'} 
req = request.Request(url= urll, headers= webheaders)
html = request.urlopen(req).read().decode('utf-8')
return html




def get_lyrics_html(self,urll):


soup = BS(self.get_html(urll), 'html.parser')
for tdtag in soup.find_all('td', class_="song_name"):
for line in tdtag.find_all('a'):
if len(line.get('href')) > 10:
songurl = os.path.join(self.weburl + line.get('href'))


soup = BS(self.get_html(songurl), 'html.parser')
for divtag in soup.find_all('div', class_= 'lrc_main'):
#song_wordset = set(jieba.cut(divtag.get_text(), cut_all= False))
self.zhaolei.write(divtag.get_text())
self.zhaolei.close()





s = xiamimusic()
s.get_lyrics_html(songlist)


还请各位大婶多多指教

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值