python实战演练一：抓取我自己csdm博客信息的标题和文章链接，并存入文件夹《抓取信息》

最新推荐文章于 2023-01-11 15:54:42 发布

原创最新推荐文章于 2023-01-11 15:54:42 发布 · 277 阅读

2 ·

CC 4.0 BY-SA版权

python 专栏收录该内容

175 篇文章

订阅专栏

本文介绍了一种使用Python的requests和lxml库抓取优快云博客标题和链接的方法，通过XPath定位元素，实现自动化信息抓取。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

抓取我自己csdm博客信息的标题和文章链接，并存入文件夹

一、抓取信息

分析：
1、我们要找到自己所要抓取的链接的xpath
右键：检查元素-》xpath
在这里插入图片描述
代码：

from lxml import  etree#调用的函数
import requests #调用的函数
r=requests.get('https://blog.youkuaiyun.com/weixin_41665637').content#被测地址
topic=etree.HTML(r)
html=topic.xpath("//main/div/div/h4/a/@href")#抓取链接
title=topic.xpath("//main/div/div/h4/a/text()")#抓取标题
#
print(html)
print(title)

结果
在这里插入图片描述