- 博客(14)
- 资源 (2)
- 收藏
- 关注
原创 python字符串相似度对比
import difflibdef string_similar(s1, s2): return difflib.SequenceMatcher(None, s1, s2).quick_ratio()print(string_similar('爱尔眼科沪滨医院', '沪滨爱尔眼科医院'))print(string_similar('北戴河阿那亚隐庐酒店', '北戴河阿那亚隐庐酒店...
2020-04-28 14:14:57
799
原创 携程酒店房价爬虫分析,草稿
Request URL: https://hotels.ctrip.com/Domestic/tool/AjaxHote1RoomListForDetai1.aspx?psid=&MasterHotelID=346393&hotel=346393&EDM=F&roomId=&IncludeRoom=&city=2&supplier=&...
2019-12-26 13:20:21
1923
原创 python中json解析转换
import jsondata = {'中文测试': '汉字', 'name': 'ACME', 'shares': 100, 'price': 542.23}print('1', data, type(data))# ensure_ascii = False显示中文data = json.dumps(data, ensure_ascii=False)print('2', data...
2019-12-25 14:55:08
189
原创 chromedriver headless 模式屏蔽日志
headless无头浏览器模式下有很多日志信息,如下,将日志等级设定为 3 即可chrome_options.add_argument('log-level=3')#info(default) = 0#warning = 1#LOG_ERROR = 2#LOG_FATAL = 3DevTools listening on ws://127.0.0.1:55019/devt...
2019-12-17 17:24:10
1524
原创 Python 转义字符
Python 转义字符在需要在字符中使用特殊字符时,python用反斜杠(\)转义字符。如下表:有时我们并不想让转义字符生效,我们只想显示字符串原来的意思,这就要用r和R来定义原始字符串。如:print r'\t\r'实际输出为“\t\r”。 转义字符 描述 \(在行尾时) 续行符 \\ ...
2019-12-13 12:56:35
161
原创 python多进程卡死
为了提高效率,刚开始用了多线程 threading 和协程 gevent ,但因为其他原因,后来又取消了线程,改用了多进程,multiprocessing库,代码如下,结果运行时到最后一步卡死了,后来花了三四天才找到原因,原来是用协程时用了猴子补丁monkey patch,但是改用进程时忘记删掉了,导致程序卡死,删掉引用的线程和协程库以及猴子补丁monkey patch就可以正常运行了。...
2019-09-17 19:27:43
7142
原创 python离线下载安装包和第三方库
下载安装包命令pip download -d D:\pkg下载保存路径 -r requirement.txt离线安装命令pip install --no-index --find-links=D:\pkg下载保存路径 -r requirements.txt
2019-07-19 18:57:28
1508
原创 Windows快捷键
右键计算机,打开系统属性:win+pause_break(笔记本上的pause_break按键一般要配合fn功能键才能实现);反撤销:Ctrl+y;窗口最左上角弹出界面操作的快捷菜单:Alt+空格;...
2018-11-16 14:14:38
176
原创 Windows里bat文件手动点击可以执行,但在计划任务里却无法执行?
解决办法:在起始于后边填上这个bat文件所在的目录,编辑任务把批处理文件的起始位置加上,如:在d:\aa.bat,那么起始位置就是:d:\ 注:路径中不能有引号 。如果是账户权限的问题,在常规里勾选上最高权限。 ...
2018-11-16 13:58:47
17066
1
原创 路径后面反斜杠加与不加有什么区别
譬如C:\Program Files\Java\jdk1.8.0_05\bin与C:\Program Files\Java\jdk1.8.0_05\bin\的区别?加上的话表示,在bin的文件夹里的所有文件和文件夹,不加的话,可以访问到bin文件夹里的所有文件和与bin同节的文件。...
2018-11-16 13:49:24
3156
原创 爬虫基本原理
爬虫基本流程1、发起请求:通过HTTP库向目标站点发起请求,即发送一个Request,请求可以包含额外的headers等信息,等待服务器响应。2、获取响应内容:如果服务器能正常响应,会得到一个Response, Response的内容便是所要获取的页面内容,类型可能有HTML,Json字符串,二进制数据(如图片视频)等类型。3、解析内容:得到的内容可能是HTML,可以用正则表达式、网页...
2018-10-01 22:16:14
229
原创 Python3+pip环境配置
Windows下按照系统版本位数下载,这里以Windows10专业版64位为例,下图是我的电脑配置情况。Anaconda安装官网https://www.anaconda.com/download/#windows清华镜像https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/(注意下载的版本,平台,位数)安装时把所有选项都勾...
2018-10-01 12:29:42
19461
原创 python2和python3的共存问题
第一次写博客,可能有点乱,还望大家多多见谅,不对的话请各位大神帮忙指正~~~我的电脑系统环境情况如图所示,win10专业版64位,同时在C盘安装了python3.6和python2.7两个版本(还有一个Anaconda3的以后再解释,这里不影响)安装python的教程以后有时间我会写一下,不会的话可以看下别人的教程,这里暂时不再赘述,这里主要讲python3和python2的共存问题。...
2018-09-29 10:39:47
1831
UiPathStudioSetup.exe
2019-07-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人