爬虫_库库林_沙琪马的博客-优快云博客

爬虫

关注

文章平均质量分 55

欢迎来到爬虫分类专栏！本专栏将深入浅出地讲解网络爬虫的各种分类及其应用场景，适合所有对网络爬虫感兴趣的开发者和技术爱好者。无论你是初学者还是有一定经验的爬虫开发者，都可以在这里找到有价值的内容来提升你的技能。

关注数：文章数：6 文章阅读量：6150 文章收藏量：57

作者: 库库林_沙琪马

向Java全栈奋发图强的小白

展开

专栏收录文章

Python抓取豆瓣电影Top250

在本篇文章中，我们将探讨如何利用Python编程语言中的requests库和库来抓取豆瓣网站上电影Top250的数据信息。通过本文的学习，读者将掌握基本的网络爬虫技巧，了解如何解析HTML文档，以及怎样高效地处理和存储抓取到的数据。简要介绍为什么选择豆瓣Top250作为抓取目标，以及这项任务可能带来的价值或学习点。

原创 2025-01-05 17:11:54 · 596 阅读 · 0 评论
Python爬取网易云音乐排行榜歌曲

通过上述代码，我们实现了一个简单的爬虫，它可以抓取网易云音乐排行榜上的歌曲并保存到本地。这种方法适用于快速抓取小规模的音频数据集。如果你需要更高级的功能或处理大量数据，可以考虑使用更复杂的技术如异步请求、多线程或多进程等。

原创 2024-08-10 19:50:45 · 1247 阅读 · 0 评论
Python爬取豆瓣电影评论

通过上述代码，我们实现了一个简单的爬虫，它可以抓取豆瓣电影《千与千寻》的用户评论。这种方法适用于快速抓取小规模的数据集。如果你需要更高级的功能或处理大量数据，可以考虑使用更复杂的技术如异步请求、多线程或多进程等。

原创 2024-08-10 19:42:39 · 1647 阅读 · 1 评论
Python爬取高清美女图片

通过上述代码，我们实现了一个简单的爬虫，它可以抓取高清美女图片并保存到本地。这种方法适用于快速抓取小规模的图片数据集。如果你需要更高级的功能或处理大量数据，可以考虑使用更复杂的技术如异步请求、多线程或多进程等。

原创 2024-08-10 19:38:49 · 659 阅读 · 0 评论
爬虫-打包整个小说网站

在本篇文章中，我们将展示如何使用Python爬取小说网站的章节内容并将其存储到MongoDB数据库中。我们会使用requests进行网页请求，lxml处理HTML，re进行正则表达式匹配，threading实现并发处理，以及pymongo连接MongoDB。真实情况是写课设没数据，获取取一点通过本文的示例，我们展示了如何使用Python爬取小说网站的章节内容并将其存储到Mongo。

原创 2024-06-06 21:03:38 · 1640 阅读 · 3 评论
Python 抓取好利来甜品信息并下载封面图片

本文将介绍如何使用 Python 抓取好利来甜品的商品信息，并将这些信息保存到 CSV 文件中，同时还会下载每款甜品的封面图片到指定文件夹。我们将使用requests库来进行 HTTP 请求，使用csv库来写入 CSV 文件，并使用os库来处理文件和目录。

原创 2024-08-10 19:16:52 · 361 阅读 · 0 评论

爬虫

作者: 库库林_沙琪马

Python抓取豆瓣电影Top250

Python爬取网易云音乐排行榜歌曲

Python爬取豆瓣电影评论

Python爬取高清美女图片

爬虫-打包整个小说网站

Python 抓取好利来甜品信息并下载封面图片