[3]个人学习python：爬取豆瓣单本图书，深入学习取数_想学习python的网页取数-优快云博客

本文链接：https://blog.youkuaiyun.com/deepmountain/article/details/80424144

本文介绍了一个简单的Python爬虫实例，用于抓取豆瓣Top250图书页面的部分信息，包括如何使用XPath解析网页元素并获取指定的数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

代码如下：

# -*- coding: utf-8 -*
import requests,time
from lxml import etree
url='https://book.douban.com/top250'
html=requests.get(url).text
s=etree.HTML(html)
title1=s.xpath('//*[@id="content"]/div/div[1]/div/table[1]/tr/td[2]/div[1]/a/text()')[0]
title2=s.xpath('normalize-space(//*[@id="content"]/div/div[1]/div/table[1]/tr/td[2]/div[1]/a/text())')
title3=s.xpath('//*[@id="content"]/div/div[1]/div/table[1]/tr/td[2]/div[1]/a/@title')
print ('用[0]来表示：',title1)
print ('用normalize-space()来表示：',title2)
print ('用 @+属性名 来表示：',title3)
for i in title3:
    print ('用遍历来表示：',i)

结果如下：