- 博客(87)
- 收藏
- 关注

原创 [python爬虫]selenium模拟登录京东招聘网,爬取研发类,数据清洗,数据存储,终数据分析和可视化
selenium模拟登录京东招聘网,爬取研发类,xpath数据解析,数据清洗,存储csv,mongodb形式,终数据分析和可视化
2022-06-10 16:51:19
1221
原创 OpenCV图像识别技术-验证码识别之前置基础
1.安装opencv:终端:pip install opencv-python。1.安装numpy:pip install numpy。2.创建py文件,输入如下代码。
2023-11-02 21:36:47
538
原创 用户登录案例练习(flask+微信小程序)
在index.js书写函数配置,登录成功则跳转页面,登陆失败显示登陆失败字样。在index.wxml中添加用户登录的标签。(4) 粘贴官网的最小flask代码。(3)在虚拟环境里边安装Flask。(5)启动flask服务。3.运行flask测试。
2023-07-21 22:05:04
677
原创 git知识总结
2. git是用来管理版本的,比如我现在写了一个代码,500M,我想更改一个版本,同时保留现在的版本,把他复制一份,然后再复制的上边去改,这样文件大小一共可能就是1000M多了。但是,如果我是用git,不管改几个版本,他都是500多M,也就是说,不同版本之间相同的那部分代码,只会保留一份。12. 如何新建分支:git checkout -b xxxx,注意,如果没有-b选项,那么就是切换到xxxx分支,如果这个分支不存在,会报错。3. git的使用,首先去git官网下载安装,略。
2023-07-15 11:06:10
413
原创 爬虫进阶-反爬破解2(破解加密登陆的过程+账号信息加密的常用算法)
1. 加密算法分类:不需要密钥的散列算法(MD5、SHA-1)、需要密钥的加密算法(对称加密DES、3DES、AES,非对称加密RSA);5. RSA算法介绍:非对称加密算法,加解密需要公钥和私钥的配合,抵抗到目前为止已知的所有密码攻击,已被ISO推荐为公钥数据加密标准。(1)Alert弹出内容 (2)console.log("输出到终端的日志信息") (3)在JS代码中增加断点。(1)开发者工具是打开状态(2)BreakPoint处于激活状态(3)在JS代码中增加断点。(一)开发者工具的栏目说明。
2023-06-27 16:30:53
1385
原创 jenkins定时任务时间设置
参考链接:https://blog.youkuaiyun.com/weixin_39267265/article/details/121082254。具体的格式划分为5个字段:分别为 分钟、小时、日、月、星期、通过tab或者空格进行隔离区分。jenkins定时任务的时间格式设定遵循的是cron的语法规则。H 5 * * 1表示:每周一上午五点执行一次。
2023-06-26 15:08:17
716
原创 redis学习整理
是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。Redis作为一种内存数据库,具有快速的数据访问和高效的数据存储,适合用作缓存的存储层。哨兵的作用是监控 Redis 的主从节点是否正常工作,当发现节点出现故障时,自动将从节点晋升为主节点,继续提供服务。主从复制的作用是将主节点的数据复制到从节点上,当主节点出现故障时,从节点可以接替主节点,继续提供服务。当主节点出现故障时,从节点会自动升级为主节点,继续提供写操作。
2023-06-25 16:50:48
438
原创 爬虫进阶-反爬破解1(反爬技术简介、HTTP网络基础知识、搭建代理服务)
爬虫进阶-反爬破解1(反爬技术简介、HTTP网络基础知识、搭建代理服务)
2023-05-30 19:08:46
1753
原创 selenium保持用户登陆的方法(获取cookie和添加cookie)
selenium保持用户登陆的方法(获取cookie和添加cookie)
2023-04-07 14:40:48
2329
4
原创 用seleniumwire获取网站的network中的url链接情况(url、headers)
用seleniumwire获取网站的network中的url链接情况(url、headers)
2023-03-28 18:19:55
1030
原创 根据url链接下载word文档(doc、docx)、excel(xlsx、xls)、pdf、txt,并解析获取其中的内容(段落、表格)形式
根据url链接下载word文档(doc、docx)、excel(xlsx、xls)、pdf,并解析获取其中的内容
2023-03-23 17:32:06
1086
原创 特征工程-定义+意义+安装scikit-learn+数据的特征抽取(字典、文本)
特征工程-定义+意义+安装scikit-learn+数据的特征抽取(字典、文本)
2023-02-20 23:31:41
390
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人