
Python
文章平均质量分 54
Xahoo!
这个作者很懒,什么都没留下…
展开
-
下载feapder,使用清华源
pip install feapder -i https://pypi.doubanio.com/simple/原创 2023-02-27 18:19:31 · 578 阅读 · 0 评论 -
使用JsonPath解析json数据
使用JsonPath解析json数据JsonPath介绍JsonPath是从JSON文档中抽取指定的信息的工具。提供多种语言实现版本,包括JavaScript,Python,PHP,java。JsonPath对于JSON,就好比xpath对于XML。JsonPath下载地址:JsonPath下载地址JsonPath安装:pip install jsonpathJsonPath语法与XPath语法对比Json结构清晰,可读性高,复杂度低,非常容易匹配;JsonPath中的“根成员对象”始终称为原创 2021-04-19 17:47:34 · 824 阅读 · 0 评论 -
python将原生cookie转换为字典dict格式
方法一:b = 'bid=Qzw9cKnyESM; ll="108288"; __gads=ID=2bc94af25696a743:T=1618288095:S=ALNI_MaHTWlgywNGGe-g_7lRS3BdLUIWzA; __yadk_uid=4YChvgeANLBEh4iV00n1tc0HQ8zpmSl1; __utmc=30149280; __utmc=223695111; _vwo_uuid_v2=D8099FF3ECFE384A3F35BFA190C05A5EE|91f795432原创 2021-04-14 17:09:44 · 3371 阅读 · 2 评论 -
Python中的zip()与*zip()函数详解
本文中元素是指列表、元组、字典等集合类数据类型中的下一级项目(可能是单个元素或嵌套列表)zip(*iterables)函数详解zip()函数的定义从参数的多个迭代器取元素合成一个新的迭代器返回:返回一个zip对象,其内部元素为元组;可以转化为列表或元组。传入参数:元组、列表、字典等迭代器。zip()函数的用法当zip()函数中只有一个参数时,zip(iterable)从iterable中依次取一个元组,组成一个元组。示例:# zip(单个参数)list1 = [1, 2, 3, 4]t原创 2021-04-13 17:32:02 · 621 阅读 · 0 评论 -
multiprocessing.freeze_support()介绍
Python多进程multiprocessing在windows的Dos或者idle下运行不了会报错打包成exe包双击之后会一直打开exe,导致内存占满,在linux下没有问题。在Pycharm下运行也不会有问题,经过各种查阅资料,终于解决了这个bug。只要在main入口下添加 multiprocessing.freeze_support()就可以了if __name__ == "__main__": multiprocessing.freeze_support()同时,在这里说明一下,原创 2021-04-08 15:21:00 · 9511 阅读 · 5 评论 -
Python使用multiprocessing实现多进程
进程是操作系统进行资源分配和调度的一个基本单位。一、进程及多功能介绍程序:程序是一个静态的概念。在一台电脑上,我们安装了很多程序,这些程序是可以运行的。比如我们编写一个xxx.py程序,它是静态的,静静的保存在电脑的硬盘中,等待执行。进程:进程是操作系统分配资源的基本单位,一个程序运行起来后,代码加用到的系统资源称之为进程。比如我们在终端通过 python xxx.py将xxx.py程序运行起来,这时候就开启了一个进程。多任务:多任务是指操作系统可以同时运行多个任务。在使用一台电脑时,我们需要同时做原创 2021-04-07 17:10:03 · 2903 阅读 · 2 评论 -
第一次安装git连接码云
1 安装git到Git官网https://www.git-scm.com/ 下载Git客户端安装时选择默认即可。安装完成后在桌面的快捷菜单中选择Git Bash Here 或者在开始菜单中选择Git Bash:在Git Bash中执行命令git --version查看版本,证明Git安装成功2.安装目录不能有中文,就放c盘吧3.创建git的存储目录,E:\gitHome4.生产密钥的的命令行:ssh-keygen -t rsa -C “673685454545454@qq.com”(你的邮原创 2021-01-22 16:17:34 · 276 阅读 · 0 评论 -
码云(The authenticity of host ‘gitee.com (180.97.125.228)‘ can‘t be established)
拉取远程仓库到本地错误The authenticity of host ‘github.com (13.229.188.59)’ can’t be established.1、个人在码云(git一样)上面创建了仓库,通过本地的git拉取远程仓库到本地报错信息如下:这是因为Git使用SSH连接,而SSH第一次连接需要验证GitHub服务器的Key。确认GitHub的Key的指纹信息是否真的来自GitHub的服务器。解决办法。其实就是在本地生成key配置到github服务器。这样子接收过来就gitHub服原创 2021-01-22 15:39:03 · 18476 阅读 · 1 评论 -
screen在linux系统上运行后台程序(Python)
**重点:使用screen命令可以实现当前窗口与任务分离,我们即使离线了,服务器仍在后台运行任务。当我们重新登录服务器,可以读取窗口线程,重新连接任务窗口。****主要功能:会话恢复**只要screen本身没有终止,在其内部运行的会话都可以恢复,鸡屎网络连接中断,用户也不会失去对已经打开的命令行会话的控制。多窗口在screen环境下,所有的会话都独立的运行,并拥有各自的编号、输入、输出和窗口缓存。会话共享screen可以让一个或多个用户从不同终端多次登录一个会话,并共享会话的所有特性(比如可原创 2021-01-22 14:14:17 · 3391 阅读 · 4 评论 -
使用python pyautogui点击没有效果的解决方法
背景:在Pycharm里,使用python+pyautogui调用 .exe程序文件时候,当程序界面出来之后,鼠标失去反应,用pyautogui进行点击。后面尝试使用图片相似也无法实行点击。解决方法:运行Pycharm或者其他ide的时候选择以管理员权限启动即可。...原创 2021-01-06 13:57:52 · 16079 阅读 · 11 评论 -
Python中hashlib.sha1()和hashlib.MD5()哈希算法的区别
sha1生成一个160bit的结果,通常用40位的16进制字符串表示md5生成一个128bit的结果,通常用32位的16进制字符串表示注意:哈希算法又称为摘要算法,它生成的是固定长度的不可逆的混杂字符串。不要与加密算法混为一谈,因为加密对应着解密。而哈希算法很难很难解密。SHA256和SHA512,不过越安全的算法越慢,而且摘要长度更长通常为了保护用户的隐私,我们不会选择直接将明文的密码存入数据库,因为一但数据库泄露,用户的个人信息将全部丢失。通常会对密码进行MD5,SHA1等方式哈希后存入数.原创 2020-12-30 14:27:32 · 2235 阅读 · 0 评论 -
Python+win32gui+pyautogui调用cmd+.exe程序处理文件
代码import pyautoguiimport osimport timeimport pyperclipimport win32guipath = os.path.join(os.getcwd(), 'zip')if not os.path.exists(path): os.mkdir(path)app_dir = os.path.join(path, "Sketchfab_Download_Python_Script.exe")os.startfile(app_dir)原创 2020-12-30 10:50:00 · 992 阅读 · 0 评论 -
python基础之将中文标点符号转为英文标点符号
方法一:对于有明确需求的转换,使用translate要更简单一些,它不需要你说的正则表达式,代码如下:# In Python3, use str.maketrans instead(皆可)# table里对应写出你需要转换成的转台 比如:()==> ()table = {ord(f):ord(t) for f,t in zip( u',。!?【】()%#@&1234567890', u',.!?[]()%#@&1234567890')}# 需要转换的文本原创 2020-08-04 11:48:56 · 8230 阅读 · 0 评论 -
centos7重新创建虚拟环境(2020-10-09)
由于自己的服务器虚拟环境老是崩溃,特此在这里整理一下重新创建虚拟环境的命令。1 删除已经损坏的虚拟环境命令:rmvirtualenv py3envpy3env为指定的虚拟环境名称。如果你之前没有备份生成的requirements.txt 文件,建议删除虚拟环境之前,生成一下,以便于之后的安装各种依赖。命令:进入虚拟环境后pip freeze > requirements.txt2 创建新的虚拟环境为对接上之前已经写好的定时任务,新创建虚拟环境命令也为py3en.原创 2020-10-09 14:16:47 · 340 阅读 · 0 评论 -
喜马拉雅音频数据+Python+xm-sign突破
郑重声明:本项目的所有代码和相关文章,仅用于经验技术交流分享,禁止将相关技术应用到不正当途径,因为滥用技术产生的风险与本人无关。文章仅源自个人兴趣爱好,不涉及他用,侵权联系删1 目标爬取目标网站音频数据2 网站https://www.ximalaya.com/gerenchengzhang/19596428/3 流程分析3.1 目标页分析F12,点击播放按钮,我们发现一个音频文件https://aod.cos.tx.xmcdn.com/group53/M02/1C/D5.原创 2020-09-14 17:30:31 · 2835 阅读 · 2 评论 -
机器学习(一)
1 简单介绍机器学习1.2 什么是机器学习1.2.1 定义机器学习是从历史数据中自动分析(学习),获得模型(规律),并利用模型对未知数据进行**预测(结果)**的过程。学习–>规律–>预测1.2.2 数据集的构成数据集就是所谓的 历史数据数据集一般由特征值和目标值构成,数据集可以没有目标值。1.3 机器学习算法分类1.3.1 监督学习目标值:类别(离散型数据) ==》分类算法 ==》(天气阴雨晴等,人脸识别)目标值:连续型的数据(具体的数据) ==》回归算法 ==》(天气温原创 2020-08-28 17:10:37 · 245 阅读 · 0 评论 -
借助Python解决文字转语音
缘由:源于自己是上班族,父母或者长辈在上班时间发语音或者打电话的话,接听或者回复比较麻烦,所以就想着自己写一个小玩意可以将文字转换成语音,这样就可以方便很多~正题:环境:Python3第一种:借助python的第三方库pyttsx3安装:pip install pyttsx3代码:import pyttsx3 msg = '''你是不是没睡醒'''# 初始化teacher = pyttsx3.init()# 调节语速rate = teacher.getProp原创 2020-08-14 17:07:13 · 1694 阅读 · 1 评论 -
详解tensorflow的tf.train.string_input_producer生成器和tf.train.slice_input_producer
tf.train.slice_input_producer()tf.train.slice_input_producer是一个tensor生成器,作用是按照设定,每次从一个tensor列表中按顺序或者随机抽取一个tensor放入队列。函数:slice_input_producer(tensor_list, num_epochs=None, shuffle=True, seed=None, capacity=32, shared_name=None, name=None)参数:tens原创 2020-07-31 15:50:28 · 1390 阅读 · 0 评论 -
结构化元素cv2.getStructuringElement()
目标:了解结构化元素 cv2.getStructuringElement()原理:结构化元素:cv2.getStructuringElement()在前面的例子中,我们使用Numpy(kernel = np.ones((5,5),np.uint8)),构建了结构化元素,它是正方形的。但是有时我们构建一个椭圆形/圆形的核,为了实现这种要求,提供了OpenCV函数:cv2.getStructuringElement()你只需要告诉他你需要的核的形状和大小。代码:# 使用Nump原创 2020-07-23 16:33:35 · 4176 阅读 · 0 评论 -
Win10+Tensorflow2.0安装教程
指安装源,有两种方案:pip --default-timeout=100 install tensorflow==2.0.0 -i https://pypi.tuna.tsinghua.edu.cn/simple pip --default-timeout=100 install tensorflow==2.0.0 -i https://pypi.douban.com/simple原创 2020-07-22 16:34:02 · 345 阅读 · 0 评论 -
python文件读写模式 --- r,w,a,r+,w+,a+,rb,wb
要了解文件读写模式,需要了解几种模式的区别,以及对应指针r : 读取文件,若文件不存在则会报错w: 写入文件,若文件不存在则会先创建再写入,会覆盖原文件a : 写入文件,若文件不存在则会先创建再写入,但不会覆盖原文件,而是追加在文件末尾rb,wb:分别于r,w类似,但是用于读写二进制文件r+ : 可读、可写,文件不存在也会报错,写操作时会覆盖w+ : 可读,可写,文件不存在先创建,会覆盖a+ :可读、可写,文件不存在先创建,不会覆盖,追加在末尾...原创 2020-07-15 17:19:50 · 798 阅读 · 0 评论 -
python+requests爬取当当网-商品详情/评论
郑重声明:本项目的所有代码和相关文章,仅用于经验技术交流分享,禁止将相关技术应用到不正当途径,因为滥用技术产生的风险与本人无关。文章仅源自个人兴趣爱好,不涉及他用,侵权联系删目标:爬取当当网指定关键字书籍商品详情信息最近全民炒股全民基金,调研一下有关基金的数哈哈第一页:http://search.dangdang.com/?key=%BB%F9%BD%F0&act=input&page_index=1第二页:http://search.dangdang.com/?key.原创 2020-07-15 12:00:56 · 2445 阅读 · 4 评论 -
Python中常见的添加IP代理简单介绍
文章摘要:常用代理有:1、购买的动态IP隧道:比如阿布云动态隧道,请求不返回IP,代理访问请求,返回请求值;2、私密代理IP:即为能够拿到返回的具体IP值(有时间限制),然后我们再用拿到的代理IP构造代理池,然后发起请求;3、自己通过抓取免费代理IP,构造自己的IP代理池,有兴趣请移步:https://blog.youkuaiyun.com/Owen_goodman/article/details/100074822常见代理使用场景:1、requests脚本:get/post请求2、scra原创 2020-07-15 11:18:30 · 2701 阅读 · 2 评论 -
CentOS7从GitHub上下载文件
先安装gityum install -y git例如下载tesseract-ocrgit clone -b master https://github.com/tesseract-ocr/tesseract.git tesseract-ocr原创 2020-06-28 17:10:36 · 3094 阅读 · 0 评论 -
某B某站selenium破解登录页面的滑动验证码
郑重声明:本项目的所有代码和相关文章,仅用于经验技术交流分享,禁止将相关技术应用到不正当途径,因为滥用技术产生的风险与本人无关。文章仅源自个人兴趣爱好,不涉及他用,侵权联系删前面文章介绍了一些关于破解验证码的文章,包括借助百度智能云Api识别简单文字数字https://blog.youkuaiyun.com/Owen_goodman/article/details/106071249还有借助打码平台破解验证码https://blog.youkuaiyun.com/Owen_goodman/article/detail.原创 2020-05-14 17:34:30 · 1449 阅读 · 0 评论 -
识别验证码之百度智能云Api识别
郑重声明:本项目的所有代码和相关文章,仅用于经验技术交流分享,禁止将相关技术应用到不正当途径,因为滥用技术产生的风险与本人无关。文章仅源自个人兴趣爱好,不涉及他用,侵权联系删之前写过关于使用自动化工具解决验证码问题,借助打码平台(需要收费),https://blog.youkuaiyun.com/Owen_goodman/article/details/105053448https://blog.youkuaiyun.com/Owen_goodman/article/details/105654993也可以使用P.原创 2020-05-12 11:25:06 · 1975 阅读 · 0 评论 -
列举 前端JS进行AES加密,Python解密 实例
郑重声明:本项目的所有代码和相关文章,仅用于经验技术交流分享,禁止将相关技术应用到不正当途径,因为滥用技术产生的风险与本人无关。文章仅源自个人兴趣爱好,不涉及他用,侵权联系删基本详情采集数据时,遇到对Url进行加密的网站,大致加密情形如下前端JS进行AES加密,将6位或者7位数字加密成22位数字字母大小写的加密方法。全国公共资源-山东http://ggzyjy.shand...原创 2020-04-23 11:55:38 · 1006 阅读 · 0 评论 -
将Python程序打包成 .exe文件
前面一片文章详细介绍了用Python制作自己二维码的过程,这篇我们简单介绍一下怎样将上述python程序打包成 .exe文件1、基本环境:windows10+python3.62、第三方库安装:pip3 install pyinstaller3、具体命令:cd 进入到你要打包的脚本程序坐在位置,比如我的使用命令打包:pyinstaller -F test.p...原创 2020-04-22 11:34:07 · 402 阅读 · 0 评论 -
Python制作二维码详细介绍
1、基本环境:windows10+python3.62、第三方库安装:(暂时不支持中文)pip install myqr3、二维码种类介绍:3.1静态二维码---扫描二维码获取内容from MyQR import myqrver,level,qr_name = myqr.run(words="python is father")print(ver,level,qr...原创 2020-04-22 10:32:12 · 1019 阅读 · 0 评论 -
简单介绍 Python+selenium+webdriver 安装(windows10+centos7)
Python+selenium+webdriver之前写作一篇关于借助自动化工具和打码平台实现验证码登录的文章https://blog.youkuaiyun.com/Owen_goodman/article/details/105053448这里就简单介绍一下工具的安装。windows(python3)1、安装selenumpip install selenium2、安装webd...原创 2020-04-21 16:25:54 · 3840 阅读 · 0 评论 -
某眼字体反爬分析(K近邻算法解决动态字体加密)
郑重声明:本项目的所有代码和相关文章,仅用于经验技术交流分享,禁止将相关技术应用到不正当途径,因为滥用技术产生的风险与本人无关。文章仅源自个人兴趣爱好,不涉及他用,侵权联系删上一次简单罗列了字体反爬的前世今生(https://mp.youkuaiyun.com/console/editor/html/105490137)本文就进行实战分析url:https://maoyan.com/boar...原创 2020-04-13 17:26:44 · 1174 阅读 · 0 评论 -
猫眼字体反爬的前世今时
郑重声明:本项目的所有代码和相关文章,仅用于经验技术交流分享,禁止将相关技术应用到不正当途径,因为滥用技术产生的风险与本人无关。文章仅源自个人兴趣爱好,不涉及他用,侵权联系删最近两天整理了某眼字体反爬的前世今生,这里简单概括一下,下一篇详细介绍目前为止某眼最新的动态字体加密以及解决方法和代码。首先简单介绍一下字体反爬的定义以及原理:"字体反爬"字体反爬就是自定义字体加密映射,通...原创 2020-04-13 16:31:36 · 433 阅读 · 0 评论 -
Request Payload参数(字典,json,列表,字符串,以及DWR框架的参数)---持续更新
1.正常的Json数据当然了,这样写和下面的提交的原理是一样的:2.Request Payload是正常json数据什么是Request Payload ?也是Json数据的 一种。但是也稍有不同,因为Request Payload 也可以是列表。具体的不涉及前后端的话知道这点就够了。那么发请求的话如果发送失败的话,记得添加method=“POST”这...转载 2020-04-09 17:20:26 · 5667 阅读 · 3 评论 -
简单记录最近遇到的验证码问题(2020-03-23)
简单记录最近遇到的验证码问题(2020-03-23)工具selenium+webdriver+Python3+斐斐打码背景访问数据需要输入验证码,点击确认,才能返回数据。爬虫进行思路模拟登陆==》自动截图验证码==》识别验证码(借助打码平台)》模拟输入,点击提交确认》提取数据直接上代码‘’’ def parse(self, response): ...原创 2020-03-23 17:38:35 · 862 阅读 · 0 评论 -
基于某点评字体库的字体反爬
前面基础不再叙述,因为某点评的反爬一直比较有意思,可以一直拿来练手。。日常反爬虫措施有css文字映射和字体库反爬虫作妖。直接找到他的动态加载的字体文件:找到这个字体下载下来:该页面结果简单,爬取提取数据基本上一行代码就可以解决。但是爬取下来的为字体加密后的字符。所以我现在要做的就是,怎么去将&#x…;字符转为对应的汉字。先手动下载页面中的字体文件。然...原创 2020-05-08 09:24:30 · 548 阅读 · 0 评论