
Python爬虫
灬走走停停丶
这个作者很懒,什么都没留下…
展开
-
腾讯视频自动签到获得V力值(Python+selenium)
1、在以下代码中输入自己的账号密码:import timeimport requestsfrom selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsdef basic(): chrome_options = Options() chrome_options.add_argument('--headless') chrome_options.add_argument(原创 2020-05-26 09:48:05 · 7061 阅读 · 1 评论 -
FileNotFoundError: [Errno 2] No such file or directory: 'E:\\time.jpg'
报错信息:解决办法:查看本地文件后缀名是否是多加了:可以看出,本地后缀名默认是不显示。所以解决办法有两种:(1)把路径写成r"E:\time;(2)r"E:\time.jpg.jpg;...原创 2020-03-24 20:29:40 · 1096 阅读 · 0 评论 -
AttributeError: 'NoneType' object has no attribute 'xpath'
请求时加一个头部信息:headers={"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36"}原创 2020-03-13 09:39:28 · 14957 阅读 · 4 评论 -
使用Beaufulsoup或lxml库爬取中国大学2019的排名信息
"""爬取中国大学2019的排名信息,爬取‘排名’,‘学校名’,‘省份’,‘总分’,这四个字段信息爬取网址:http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html"""import requestsfrom bs4 import BeautifulSoupimport bs4from lxml import etreedef ...原创 2020-03-12 17:40:04 · 394 阅读 · 0 评论 -
Python爬虫练习(一):酷狗飙升榜前200_排行(使用select,find(),find_all()方法)
分析并构造请求网址爬取酷狗音乐TOP500 的‘音乐名’,‘歌手’,‘歌名’,‘播放时间’,‘网址’这几个数据网址如下:https://www.kugou.com/yy/rank/home/1-8888.html?from=rank,浏览器打开网址分析,第一页只显示了22首歌曲:我们可以看到,其中有一个 1-8888 这个参数,打开上述网址后我们只能看到前 22 首歌,想继续查看后面的歌曲就...原创 2020-03-12 16:03:22 · 1086 阅读 · 0 评论