- 博客(15)
- 收藏
- 关注
原创 Selenium等待时间——隐性等待(implicitly_wait())
web.implicitly_wait(),隐性等待设置了一个时间,在一段时间内网页是否加载完成,如果完成了,就进行下一步;在设置的时间内没有加载完成,则会报超时加载。缺点是不智能,因为随着ajax技术的广泛应用,页面的元素往往都可以时间局部加载,也就是在整个页面没有加载完的时候,可能我们需要的元素已经加载完成了,那就么有必要再等待整个页面的加载,执行进行下一步,而隐性等待满足不了这一点; 另外一点,隐性等待的设置时全局性的,在开头设置过之后,整个的程序运行过程中都...
2021-12-13 13:50:12
15482
2
原创 Python连接MySQL数据库方法介绍
本文介绍的是利用PyMySQL连接数据库,所以首先要安装PyMySQL。一、安装PyMySQLPyMySQL : 是封装了MySQL驱动的Python驱动,一个能使Python连接到MySQL的库环境要求:Python version >= 3.4我使用的是pycharm软件,在terminal中输入pip install PyMySQL,按回车执行(我这里是安装过的,第一次安装会显示successfully)查看PyMySQL版本,输入pip show PyMySQL,再回.
2021-11-23 10:51:35
2079
原创 selenium弃用警告DeprecationWarning: find_element_by_* commands are deprecated. Please use find_element()
意思:弃用警告:不推荐使用 find_element_by_* 命令。 请改用 find_element()原来的写法:el = web.find_element_by_xpath('//*[@id="changeCityBox"]/p[1]/a')现在的写法:记得先导入from selenium.webdriver.common.by import Byfrom selenium.webdriver import Chromefrom selenium.webdriver.common
2021-11-22 11:03:58
7411
6
原创 python协程:RuntimeError: Event loop is closed解决办法
在学习协程时,用asyncio.run()运行会出现一下RuntimeError: Event loop is closed,如下解决办法:将 asyncio.run(main())替换为下面两行loop = asyncio.get_event_loop()loop.run_until_complete(main())总而言之是asyncio.run()会自动关闭循环,并且调用_ProactorBasePipeTransport.__del__报错, 而asyncio.run_un.
2021-11-17 11:06:46
10144
3
原创 python中json库方法dumps、loads及和load,dump的作用及区别
1、json.dumps() #将 字典 转化为 字符串2、json.loads() #将 字符串 转化为 字典代码实例:import jsondict1 = { 'entity': 'human', 'relation': 'live'}print(type(dict1))print('-----------------------------------')str1 = json.dumps(dict1) # 字典-> 字符串print(type(st.
2021-11-02 14:29:42
299
原创 python 字典与json的区别
一. python的字典和json字符串的区别python中,json和dict非常类似,都是key-value的形式,而且json和dict也可以非常方便的通过dumps和loads互转,但是它们之间还是有区别的:json:是一种数据格式,是纯字符串。可以被解析成python的dict或其他形式。dict:是一个完整的数据结构,是对hash table这一数据结构的实现,是一套从存储到提取都封装好的方案。它使用内置的hash函数来规划key对应的value的存储位置,从而获得O(1)的数据读取
2021-11-02 10:14:00
3283
转载 ip地址后边加个/8(16,24,32)是什么意思?
是掩码的位数,A类IP地址的默认子网掩码为255.0.0.0(由于255相当于二进制的8位1,所以也缩写成“/8”,表示网络号占了8位); 即11111111.00000000.00000000.00000000B类的为255.255.0.0(/16); 即11111111.11111111.00000000.00000000C类的为255.255.255.0(/24);即11111111.11111111.11111111.00000000/30就是255.255.255.252;即111
2021-10-14 11:06:49
461
原创 一个字节是几位?
一个字节为8位。字节含义:字节是计算机信息技术用于计量存储容量的一种计量单位,也表示一些计算机编程语言中的数据类型和语言字符。数据存储是以“字节”(Byte)为单位,数据传输是以大多是以“位”(bit,又名“比特”)为单位,一个位就代表一个0或1(即二进制),每8个位(bit,简写为b)组成一个字节(Byte,简写为B),是最小一级的信息单位。位(即比特)含义:比特是计算机专业术语,是信息量单位,是由英文BIT音译而来。同时也是二进制数字中的位,信息量的度量单位,为信息量的最小单位。...
2021-10-14 09:34:16
5277
原创 单工,半双工和全双工有何区别和联系?
单工数据传输只支持数据在一个方向上传输;在同一时间只有一方能接受或发送信息,不能实现双向通信,举例:电视,广播。 半双工数据传输允许数据在两个方向上传输,但是,在某一时刻,只允许数据在一个方向上传输,它实际上是一种切换方向的单工通信;在同一时间只可以有一方接受或发送信息,可以实现双向通信。举例:对讲机。 全双工数据通信允许数据同时在两个方向上传输,因此,全双工通信是两个单工通信方式的结合,它要求发送设备和接收设备都有独立的接收和发送能力;在同一时间可以同时接受和发送信息,实现双..
2021-10-14 09:29:28
356
原创 pychram安装pycrypto失败的解决办法
很多爬虫教程是针对Python2.7编写的,部分第三方库也长时间未维护,可能在新版本中已经失效。比如PyCrypto,可以用于AES、RSA等多种加密。在windows系统下python3.6版本已经无法正常安装,这个加密的库几年前就已经停止维护。而pycryptodome包可以解决此问题,pip install pycryptodome就可以。如果之前已经安装pyCrypto包,则需要在PowerShell或CMD下先卸载pyCrypto,才能安装pycryptodome成功,两个包会相互冲突:1、p
2021-10-09 14:51:15
2501
原创 python爬取网页返回响应中出现百度安全验证的解决办法
出现下面这种情况时,采取的办法是,将Accept包含的信息也加入headers。
2021-09-18 16:11:18
10453
10
原创 python爬虫返回文本为乱码的解决方法
1、在网站爬取文章时,返回的结果为乱码,如下2、出现这种情况是因为访问page_text.text时,Requests会使用其推测的文本编码。查看网页返回的字符集类型:page_text.apparent_encoding查看自动判断的字符集类型:page_text.encoding可以看到Requests推测的文本编码(ISO-8859-1)与源网页编码(utf-8)不一致3、解决方法(1)方法一:在page_text.text之前,指定.encoding为源网页的编码..
2021-09-16 10:25:35
4634
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人