lxml使用xpath未知错误

最新推荐文章于 2024-11-03 22:48:02 发布

原创最新推荐文章于 2024-11-03 22:48:02 发布 · 890 阅读

2 ·

CC 4.0 BY-SA版权

py 专栏收录该内容

1 篇文章

订阅专栏

本文介绍了一个使用Python的lxml库进行网页抓取时遇到的XPath语法错误案例，并给出了正确的XPath表达式修正方法。

from lxml import etree 
import requests 
import os
import io

headers = {
    'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:62.0) Gecko/20100101 Firefox/62.0"
}
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')
resopnse = requests.get("http://www.shouce.ren",headers=headers)
text = resopnse.content
print(text)
html = etree.HTML(text)
detail_urls = html.xpath("//div[@class="thumbnail b-color-f"]//a/@href"<----

最后一行抛出异常
       detail_urls = html.xpath("//div[@class="thumbnail b-color-f"]//a/@href")
                                                    ^
SyntaxError: invalid syntax
[Finished in 0.2s with exit code 1]