个人博客地址——https://www.dogebug.cn/
GitHub地址——https://github.com/yanshigou/
title: “花了3天的下班时间写了个爬虫”
date: 2018-12-06 15:52
author: dzt
subtitle: 爬取喜马拉雅的音频信息
tags:
- python
- 爬虫
爬取喜马拉雅网站上所有音频专辑的基本信息
简单分析了网页源码之后 就开始下手去做了
还是遇到不少难题,还好有很多人都做过类似爬虫,查阅相关资料,最终如愿完成


基本信息
- 音频名字
- 专辑名字
- 图片地址
- mp3地址
- m4a地址
- aac地址
爬取到信息后写入txt文件中和excel文件中


个人博客地址——https://www.dogebug.cn/
GitHub地址——https://github.com/yanshigou/
禁止不留原创地址、署名的转载
本人保留所有法定权利。违者必究
本文分享了一位开发者利用下班时间,花费三天时间编写爬虫程序,成功抓取喜马拉雅网站上的音频专辑基本信息的过程。面对挑战,通过查阅资料,最终实现了音频名字、专辑名字、图片地址及多种格式音频地址的抓取,并将数据保存为txt和excel文件。
1775

被折叠的 条评论
为什么被折叠?



