xpath 抓取数据时遇上’\n\t’的解决方案

最新推荐文章于 2023-06-05 10:35:52 发布

T T salon

最新推荐文章于 2023-06-05 10:35:52 发布

阅读量1.3k

点赞数

文章标签：经验分享

本文链接：https://blog.youkuaiyun.com/weixin_46891078/article/details/125246657

版权

本文介绍了在处理XPath表达式获取HTML内容时遇到的多余换行符问题，通过使用.strip()方法成功地切片并移除了不需要的换行符，实现了干净的数据提取。案例中涉及网页元素的选择和字符串处理，对于前端开发和网页爬虫领域的开发者具有一定的参考价值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原码： names = div.xpath("./div/div/a[2]/div[2]/div[2]/p/text()''）

得到的是这样的： ['In\n"
^nln盛优品牌设计，〕
[Inin，
，nln恒屹科技-省心放心贴心”]
['In\n',
，nln云淞网络]
解决方案:后面使用[].strip()进行切片就可以了
names = div.xpath(". /div/div/a[1]/div [1]/p/text()")[1].strip("n")

运行后是这样的：

盛优品牌设计

完美解决问题，希望对大家有所帮助！