- 博客(2)
- 收藏
- 关注
原创 【Java爬虫框架-webmagic的使用心得】
在后续的高版本中,选择器仅提供了get()方法,当使用xpath时,会将连同标签本身一起输出,大概思路是,利用浏览器去打开渲染好的页面,再从页面里根据去爬取标签获得想要的内容。第一个方法就是 抓 ajax接口,直接拿到json数据。但是如果没有接口,数据是直接渲染的,就拿不到了,示例获取a内的 href值。
2025-03-07 11:18:42
220
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人