Python爬取网易云

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

目录

一、爬取图片

I.步骤

2.代码实现

3.值得注意的点

二、爬取音乐

1.步骤

2.代码实现

3.值得注意的点

三、爬取mv

1.步骤

2.代码实现

3.值得注意的点


一、爬取图片

I.步骤

打开网易云,找到一张图片,右键,在新标签页中打开图片,复制图片网址url。

2.代码实现

import  requests
from fake_useragent import UserAgent
#1.获取单张图片
url='https://p1.music.126.net/2eLSyPQEJb2bUptOswyjNQ==/109951169274181989.jpg?imageView&quality=89'
head={
    'User-Agent':UserAgent().random
}
res=requests.get(url,headers=head)

with open('网易云.jpg','wb') as f:
    f.write(res.content)

3.值得注意的点

因为图片是以二进制方式保存,所以保存的时候方式是wb——以二进制的方式写入,保存时后缀名为.jpg

二、爬取音乐

1.步骤

打开网易云的一首歌,右键->检查->网络,打开音乐。这时如果没有就刷新一下。在网络中搜索m4a,找到其中?前是.m4a的文件,复制其url地址。

2.代码实现

import  requests
from fake_useragent import UserAgent
#2.获取单首歌曲
url='https://m704.music.126.net/20240121111736/083b8a93c4058545923b886c4dc2ccd5/jdyyaac/obj/w5rDlsOJwrLDjj7CmsOj/25358073406/d389/390d/d0c6/418dce0782fce7e48ca5c3e99ca50d06.m4a?authSecret=0000018d29ef2a5012070aaba0598b01'

head={
    'User-Agent':UserAgent().random
}

res2=requests.get(url,headers=head)
with open('网易云.mp3','wb') as f:
    f.write(res2.content)

3.值得注意的点

因为音乐是以二进制方式保存,所以保存的时候方式是wb——以二进制的方式写入,保存时后缀名为.mp3

三、爬取mv

1.步骤

打开网易云的一个视频,右键->检查->网络,打开音乐。这时如果没有就刷新一下。在网络中搜索mp4,找到其中?前是.mp4的文件,复制其url地址。

2.代码实现

import  requests
from fake_useragent import UserAgent
#3.获取mv
url='https://2028424800.qnqcdn.net:32651/qn-uWxsrxQSNKCFWIBAkVCUkI1EnGmQUMT4.vodkgeyttp8.vod.126.net/cloudmusic/7e3a/core/4987/228529019c530549327f14508a6669a9.mp4?wsSecret=2ba686285f877ef9899f8abe38d25287&wsTime=1705041238'


head={
    'User-Agent':UserAgent().random
}

res2=requests.get(url,headers=head)
with open('网易云.mp4','wb') as f:
    f.write(res3.content)

3.值得注意的点

因为视频是以二进制方式保存,所以保存的时候方式是wb——以二进制的方式写入,保存时后缀名为.mp4

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

Python爬取网易云音乐通常涉及网络抓取技术,可以使用诸如requests、BeautifulSoup、Scrapy等库。以下是一个简单的步骤概述: 1. **安装必要的库**:首先,确保已安装`requests`用于发送HTTP请求,以及如`lxml`或`BeautifulSoup4`用于解析HTML。 ```bash pip install requests beautifulsoup4 ``` 2. **获取网页内容**:使用`requests.get()`函数获取网易云音乐页面的HTML源码。 ```python import requests url = 'https://music.163.com/' # 爬取的页面URL response = requests.get(url) html_content = response.text ``` 3. **解析HTML**:使用BeautifulSoup分析HTML结构,找到需要的数据所在的元素。这通常是通过查找特定的CSS选择器或XPath表达式。 ```python from bs4 import BeautifulSoup soup = BeautifulSoup(html_content, 'lxml') songs_list = soup.select('.歌单 .s-name a') # 示例:提取歌单名称链接 ``` 4. **数据提取和存储**:遍历解析出的元素,提取歌曲名、歌手等信息,并将其保存到文件或数据库中。 ```python for song in songs_list: title = song.text href = song['href'] # 如果需要,继续提取更多信息并处理链接 # ... ``` 5. **处理反爬机制**:网易云可能会有反爬虫策略,比如限制IP访问频率或添加验证码。为了避免被封禁,你需要设置延迟、使用代理IP或者模拟浏览器头。 6. **遵循网站规则**:在爬取前务必了解并遵守《robots.txt》协议以及网易云音乐的使用条款,尊重版权。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值