
爬虫
习惯~
你必须十分努力,才能看起来毫不费力!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python爬取豆瓣电影评论通用代码
注意:有python环境的朋友运行的时候,要把cookie换成自己的。最近在自学python爬虫,今天闲来无事,爬了一下豆瓣数据。通用性:可以自己换不同的电影id进行数据爬取。下载地址:待平台身份认证完成上传到资源下载页。Tip:sleep方法规避豆瓣反爬检测。这个网站对于初学者来说还是很友好的。freelybill原创 2025-08-02 10:07:54 · 218 阅读 · 0 评论 -
java爬取百度贴吧所有用户头像
第一次写爬虫,觉得蛮有意思的写了个爬取贴吧用户头像的工具类如有问题,多多指教~爬虫工具类package com.yq.spider;import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.BufferedReader;import java.io.Clos...原创 2018-12-21 20:25:11 · 585 阅读 · 0 评论 -
java爬取堆糖所有头像(高质量版头像)
百度贴吧的用户头像爬下来之后,图片经过裁剪,尺寸太小,都是110*110之类的,并且有很多用户被注销后,头像是缩略图重复,所以爬了堆糖里面的头像,堆糖里的头像质量还是蛮高的。堆糖官网:www.duitang.compackage com.yq.spider;import java.io.BufferedInputStream;import java.io.BufferedOutpu...原创 2018-12-22 02:24:48 · 3349 阅读 · 2 评论