
爬虫
Drgom
多做事,少说话
展开
-
selenuim的模拟登录cookie登陆失败的 invalid cookie domain问题
搞了一整晚的cookie问题,起先是因为不知道如何获取cookie,后来知道了有个好用的插件叫EditTHisCookie,可以将cookie导出在获取cookie后为一个list数据,倒可以直接遍历加入,但在模拟登录的时候,老是会报 selenium.common.exceptions.InvalidCookieDomainException: Message: invalid cookie domain的错误,后来发现selenuim登录前,需要先获取链接,在解决了这个问题,又报了: Message原创 2021-03-20 16:35:27 · 10658 阅读 · 0 评论 -
爬虫学习二 - 提取下载的html的图片的链接地址
from lxml import etreedef range_file(page): parser = etree.HTMLParser(encoding="utf-8") key = str(page)+'.html' text = '尤果'+key html = etree.parse(text, parser=parser) result = html.xpath('//img/@src') file = open('信息.txt', 'a', e原创 2021-01-24 16:00:46 · 300 阅读 · 0 评论