- 博客(9)
- 资源 (2)
- 收藏
- 关注
原创 pycharm 显示‘conda‘ 不是内部或外部命令,也不是可运行的程序或批处理文件。
原因:我新安装的pycharm环境变量没有添加anaconda,所以需要找到自己的anaconda安装位置,如何再去添加到环境变量中。今天给电脑新安装pycharm发现编译器里的终端窗口输入conda居然显示出错,一顿操作之后得出结果。果然,anaconda环境变量没有添加进去,那就好解决了,输入下列代码就搞定了。注意:要添加自己的anaconda安装的正确路径!
2023-04-23 15:13:07
1795
原创 python 编写进度条模块
def xxx(): total = number for i in range(total): if i+1 == total: percent = 100.0 print('当前核算进度 : %s [%d/%d]'%(str(percent)+'%',i+1,total),end='\n') else: percent = round(1.0 * i / total * 100,2) print('当前核算进度 : .
2021-11-11 14:14:44
890
原创 request方法下载url图片
# urllib.request.urlretrieve(url=img_url,filename=file_name)import requestsimport urllib.requestfilename = '0.jpg'url = 'url'# headers ={# 'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:84.0) Gecko/20100101 Firefox/84.0'# .
2021-11-11 14:08:59
329
转载 模拟页面下滑到底端
#调用函数scroll将左侧的滚动条滑动到底部def scroll(driver): driver.execute_script(""" (function () { var y = document.body.scrollTop; var step = 100; window.scroll(0, y); function f() { if (y <.
2021-11-10 14:41:33
198
原创 安装Twisted,pip install Twisted-20.3.0-cp38-cp38-win_amd64.whl错误
由于我的是64位的电脑所以就以64位的演示了,有其他的版本直接更改一下就好了。 从https://www.lfd.uci.edu/~gohlke/pythonlibs/下载与自己对应的版本之后,不要直接打开cmd安装,不然会和我一样出错,需要到下载到Twisted的位置打开cmd,再执行下载就可以了。pip install Twisted-20.3.0-cp38-cp38-win_amd64.whl...
2021-10-11 18:29:33
904
原创 selenium多表单切换
我们在有时候做爬虫时会遇到HTML中有多个表单,这样在进行元素定位时就会出问题,因为咱的Webdriver只能在一个表单中去获取元素,当需要获取其他表单中的元素是就会出现没有该元素的报错所以这是我们就要使用Webdriver来切换其他的表单。举个例子:在需要对网易邮箱进行操作时就会遇到这样的问题,我们打开浏览器开发者模式会发现他的结构是这是就要用上switch_to.frame()方法了。直接上代码a1 = driver.find_element_by_xpath('/html/bod
2021-09-24 17:41:47
251
原创 使用OpenCV清洗数据----------检测图片清晰度
在清洗数据时可以使用OpenCV帮助我们过滤掉一部分模糊的图片,话不多说,下面上代码#首先导入需要的包import cv2image_path = '图片.jpg'img = cv.imread(image_path)width, height = img.shape[:2][::-1]img_resize = cv2.resize(img, (int(width * 1.0), int(height * 1.0)), interpolation=cv2.INTER_CUBIC)img
2021-08-25 20:48:43
1505
原创 使用OpenCV清洗数据
最近需要清洗大量无人脸数据,于是想到了使用OpenCV来进行清理,原理是:首先扫描全部图片数据再使用OpenCV的人脸检测框,如果有大于0的话说明有人脸就对该图片进行操作。原理说完开始上代码首先导入包import cv2import numpy as npimport sys, os, glob, numpyfrom skimage import io再对照片进行处理path = '*/图片地址'# 指定图片的人脸识别然后存储img = cv...
2021-08-25 15:31:10
660
原创 使用selenium控制已打开浏览器方法
当需要对网址进行爬虫是咱发现会遇到各种困难,比如说登录验证码等等,这些除了使用cookie注入跳过登录还有一招就是这个啦。首先我们需要找到浏览器的安装位置,这里我以Chrome为例,点击文件所在的位置,在下图所在位置输入cmd,进入cmd窗口随后在输入框输入一下内容,设置Chrome的Debug模式并设置端口为9222chrome.exe --remote-debugging-port=9222随后我们将使用写的代码打开Debug模式的Chrome窗口f...
2021-08-17 15:56:38
6052
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人