
python
来也空空去也空空
这个作者很懒,什么都没留下…
展开
-
爬虫(etree+xpath)
之前是对单个元素进行了爬取,这次我们抓取多个元素,再对元素处理,拼接成我们想要的格式。 爬取内容:电影类型以及对应的url 爬取结果: 我们想要的结果: import requests from lxml import etree #爬取目标 电影类型以及url #首先是获取目标网页的内容 sum_http = 'https://www.dy2018.com/' response = requests.get(sum_http) response.encodin.原创 2022-03-31 16:09:33 · 556 阅读 · 0 评论 -
爬虫(etree+xpath)
用简单的方法实现自己的目的我觉得这个方法就是比较好的方法。 这个案列是最简单的,需要自己补充的内容:xpath元素定位(参考:xpath元素定位常用的5种方法(相对路径)_adorable_的博客-优快云博客_xpath相对路径定位)浏览器开发工具(参考:浏览器开发者工具基本使用教程_bill_live的博客-优快云博客) 爬虫:1 首先确认先找到自己将爬取的网页链接(比如我们的目标网页是电影天堂电影天堂_电影下载_高清首发 ) 2 打开网址 3...原创 2022-03-28 22:22:47 · 7213 阅读 · 2 评论