
Spider
文章平均质量分 86
大秦重工
这个作者很懒,什么都没留下…
展开
-
Python3 使用 XPath 和 Beautiful Soup4 进行HTML内容解析
XPath(XML Path)是一种查询语言,它能在XML(Extensible Markup Language,可扩展标记语言)和HTML的树状结构中寻找结点。形象一点来说,XPath就是一种根据“地址”来“找人”的语言。用正则表达式来提取信息,经常会出现不明原因的无法提取想要内容的情况。最后即便绞尽脑汁终于把想要的内容提取了出来,却发现浪费了太多的时间。需要寻找的内容越复杂,构造正则表达式所需要花费的时间也就越多。原创 2023-03-22 21:53:04 · 1227 阅读 · 0 评论 -
何为爬虫技术
所谓爬虫,其本质是一种计算机程序,它的行为看起来就像是蜘蛛在网上面爬行一样,顺着互联网这个“网”,一条线一条线地“爬行”。所以爬虫在英文中又叫作“Spider”,正是蜘蛛这个单词。...原创 2022-06-06 07:40:38 · 29388 阅读 · 1 评论