用 Python 爬取 QQ 空间说说和相册

原创

于 2020-08-17 15:00:39 发布 · 893 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#python

本文介绍了如何使用Python的selenium模块爬取QQ空间的说说和相册。首先通过安装selenium并配置chrome驱动进行登录，接着解析说说页面，利用滚动加载获取所有说说。对于相册，模拟鼠标操作进入相册列表，逐个抓取照片。通过这个教程，读者可以重温过去的回忆。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

QQ 空间在 2005 年被腾讯开发，已经经历了 15 个年头，在还没有微信的年代，看网友发表的心情、心事、照片大多都在 QQ 空间的里。它承载了80、90 后的大量青春，下面我们一起用 selenium 模块导出说说和相册回忆青春吧

安装 selenium
selenium 是一个在浏览器中运行，以模拟用户操作浏览器的方式获取网页源码，使用 pip 安装 selenium 模块

pip install selenium
查看 chrome 浏览器版本并下载对应的 chrome 浏览器驱动

在这里插入图片描述

在 http://npm.taobao.org/mirrors/chromedriver 网址中找到相同版本的 chrome 驱动，并放在 python 程序运行的同一个文件夹中

登陆
按 F12 检擦网页源代码，找到登录和密码的文本框，如下图所示
在这里插入图片描述

def login(login_qq,password, business_qq):
‘’’
登陆
:param login_qq: 登陆用的QQ
:param password: 登陆的QQ密码
:param business_qq: 业务QQ
:return: driver
‘’’
driver = webdriver.Chrome()

driver.get('https://user.qzone.qq.com/{}/311'.format(business_qq))  # URL
driver.implicitly_wait(10)  # 隐示等待，

最低0.47元/天解锁文章

200万优质内容无限畅学