- 博客(58)
- 收藏
- 关注

原创 python图片验证码识别-基于机器学习的muggle_ocr图片验证码识别
开源项目muggle-orc 感谢原作者的辛苦创作 感谢阿J大佬的分享(白嫖)这是一个为麻瓜设计的本地OCR模块 只需要简单几步操作即可拥有两大通用识别模块,让你在工作中畅通无阻。这个将0识别为o了,这边将源码中的字符列表等全换为数字列表,识别单数字验证码准确率会高很多。SDK类参数参数名必选类型说明model_typeNoModelType指定预置模型类型conf_pathNostr指定自定义模型yaml配置文件(绝对路径)以上参数两者.
2021-05-28 09:28:41
1081
2

原创 Python喜马拉雅有声小说音频文件爬虫
今天爬取的是喜马拉雅有声小说。目标网址:https://www.ximalaya.com/youshengshu/分析操作开始:首先在喜马拉雅有声小说页面,播放任意音频。当播放音频时,打开抓包工具(加载网页后打开抓包工具,发现没有抓到数据包,刷新网页就行),这边选择媒体Media,一般的视频,音频文件都会在这里被抓取到。下图就是抓到的音频文件。我们尝试访问一下该接口的url,将url复制到浏览器打开。发起访问后,跳转出了一个保存文件到本地的界面。我们选择保存,发现多了一个类型
2021-03-18 09:23:42
14048
21

原创 Python爬虫案例,腾讯动漫爬虫,步骤超详细解释。
实施步骤(1) 数据爬取:使用requests请求为基础获取数据源。(2) UA伪装:模拟浏览器访问网址。(3) 数据解析:使用xpath语法处理数据。(4) 数据存储:获取需求数据后使用Excrl进行存储目标网址https://ac.qq.com/Comic/all/search/hot/page/1库的使用Openpyxl:openpyxl 模块是一个读写 Excel 2010 文档的 Python 库,如果要处理更早格式的 Excel 文档,需要用到其它库(如:xlrd、xlwt 等)
2020-12-28 10:41:51
4874
6

原创 爬虫模板 !request基础模块------>>模板
01request.测试import requestsclass RequestSpider(object): def __init__(self): url = "https://www.baidu.com/" headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrom
2020-11-27 11:38:58
1856
1
原创 有道翻译js逆向
有道翻译两个加密,一个是sign用了MD5加密,另一个是返回值AES加密,AES的密匙还用md5加密了一下。先看看第一个含有sign的,打个断点发现返回值29a…明显不对,第二个点击发现跟第一个是一样的。k函数的作用 就是组成一个 除了时间戳 不一样,其他都一样的字符串。首先还是sign那里打断点,然后运行,追踪。再点击第三个搜索结果,看看第三个含有sign的,打个断点测试一下。digest(‘hex’)的意思就是返回16进制的值。很明显这个K函数返回的就是我们需要的sign。最后返回的就是sign的值。
2024-04-15 16:49:06
316
原创 Python装饰器教学
在Python中,装饰器是一种高级语法特性,允许你修改或增强函数、方法或类的行为,而无需修改其源代码。装饰器本质上是一个接受函数作为参数的函数,并返回一个新的函数对象。日志记录是装饰器的一个非常实用的应用场景。装饰器用于保留原始函数的元信息,这样在日志中就可以正确地显示函数名。这样,我们就可以通过传递不同的参数来创建具有不同行为的装饰器。的装饰器,它接受一个函数作为参数,并返回一个新的函数。语法,我们可以将装饰器应用到任何函数上,如。是一个返回装饰器的函数。是一个装饰器函数,它接受一个函数。
2024-03-26 17:22:41
575
1
原创 * 和 **
在实际开发中,类似的技巧可以用于创建中间件、插件系统、事件处理器等需要高度灵活性和可扩展性的场景。用户可以传递他们需要的任何参数,而你的代码只需要关心处理这些参数的核心逻辑。:在复杂的函数调用链中,一个函数可能需要将接收到的参数原封不动地传递给另一个函数。编写的函数更容易适应这些变化,因为它们可以接受新类型的参数而无需修改函数签名。,它包含了要传递给函数的前三个位置参数的值。来构建一个灵活的函数装饰器,该装饰器可以用于记录函数调用的信息。的灵活性,使得它可以无需修改就能用于具有不同参数签名的多个函数。
2024-03-26 17:21:51
531
原创 Python项目管理利器poetry我愿称之为神!
在当前的工作目录中初始化一个新的poetry项目非常简单,只需要在命令行中运行poetry new project_name,这将创建一个新的项目目录并生成初始的项目文件。在管理完依赖项后,通过运行 poetry install 命令,poetry 将会按照 pyproject.toml 文件中定义的依赖关系,安装所有项目所需的依赖项。在上述示例中,poetry 会在项目的虚拟环境中执行 main.py 文件,并自动使用项目定义的依赖项。这样,使用 poetry,我们能够轻松地管理项目的打包和发布流程。
2023-12-02 12:44:30
238
3
原创 jupyter notebook报错500 : Internal Server Error
jupyter notebook报错500 : Internal Server Errorpip install --upgrade --user nbconvert
2021-06-17 21:44:13
1121
4
原创 Python抽帧生成手绘风视频
主要分为三部分,抽帧,每帧转手绘风,再将所有照片拼接成视频。主要是第二部,大家可以尽情发挥转字符串画之类的都可以。冲!第一部分视频抽帧import osimport cv2def extract_frames(video_path, dst_folder, index, frame_num): video = cv2.VideoCapture() if not video.open(video_path): print("can not open the vid
2021-04-24 09:27:42
367
1
原创 毛豆汽车数据爬虫--附源码
毛豆汽车数据爬虫–附源码没啥教程就是简单的爬虫 加个正则 有疑问公众号后台留言给你处理。公众号–>python网络小蜘蛛# -*- endoding: utf-8 -*-# @ModuleName:毛豆# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2021/4/7 14:22import requestsfrom fake_useragent import UserAgentimport reimport csvheaders =
2021-04-07 21:33:18
203
原创 链家爬虫获取链家网页数据-附带源码
链家爬虫没啥教程就是简单的爬虫 加个正则 有疑问公众号后台留言给你处理。公众号–>python网络小蜘蛛# -*- endoding: utf-8 -*-# @ModuleName:链家# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2021/4/7 10:19import requests, refrom fake_useragent import UserAgentimport timeimport csvheaders =
2021-04-07 18:13:40
804
1
原创 python安装telegram.ext No matching distribution found for ‘telegram.ext’
python安装telegram.extpip install python-telegram-bot
2021-03-24 19:50:16
1010
原创 No module named ‘alipay‘
No module named ‘alipay’解决办法pip install python_alipay_sdk
2021-03-08 09:42:56
2120
原创 No module named ‘pywin32_bootstrap‘
No module named ‘pywin32_bootstrap’解决方法!!pip install --ignore-installed pywin32==225
2021-03-08 09:40:35
622
原创 JD京东爬虫-商品评论爬虫-----附源码
JD京东爬虫-商品评论爬虫附源码本教程适合初学者。分析开始---------------打开京东商品链接,打开抓包工具(加载网页后打开抓包工具,发现没有抓到数据包,刷新网页就行),这边直接筛选js了,就不用看那么多内容。然后在响应数据中看看有没有想要的评论数据。然后双击抓到的数据包,或者复制url进入浏览器。打开后发现是json数据,看到这里是不是头皮发麻,哈哈哈,不要慌!管它呢么多,咱们要的是文字的评论数据,直接使用正则就好了。有时不得不说,正则真的是很好用的。但是细心地同志会
2021-03-08 08:51:15
11216
32
原创 python实现投票问题。
新学年开始﹐小羊所在的班级要重新选举新一届的班长。为保证公平公正,选举采用无记名投票的方式,每名同学依次在选票上写上自己支持的候选人姓名。通过唱票﹐得票最高的候选人当选为新一届的班长。(题目数据保证仅有一人获得最高票)。count = int(input())all_name_tic = {}for i in range(count): name = input() if name not in all_name_tic: all_name_tic[name] =
2021-01-08 11:04:18
5282
原创 python实现周末舞会问题
假设在周末舞会上,男士们和女士们进入舞厅时,各自排成一队。跳舞开始时,依次从男队和女队的队头上各出一人配成舞伴。规定每个舞曲能有一对跳舞者。若两队初始人数不相同,则较长的那一队中未配对者等待下一轮舞曲。现要求写一个程序,模拟上述舞伴配对问题。n,m =map(int,input().split())k = int(input())man = list(range(1,n + 1))woman = list(range(1, m + 1))while True: if len(man) =
2021-01-08 11:02:18
1609
原创 群友专享
爬虫技术交流链接:https://pan.baidu.com/s/1OQWrQiLgFouulz0Uv1o9ww提取码:2sn2复制这段内容后打开百度网盘手机App,操作更方便哦–来自百度网盘超级会员V2的分享
2021-01-07 17:13:32
310
原创 京东抢茅台脚本python
原作者链接https://github.com/huanghyw/jd_seckill/tree/master部署好了,哈哈哈谢谢作者开源!
2021-01-05 14:56:07
2000
1
原创 IP接口每10分钟自动获取
# -*- endoding: utf-8 -*-# @ModuleName:淘宝客户py# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2021/1/3 2:20import requestsimport timeurls = ['http://www.*********************', 'http://gev.qydai********', 'http://api.66daili.cn/API/GetSe
2021-01-04 08:17:33
723
原创 豆瓣爬虫 详情页保存成Excel
需求爬取豆瓣电影详情页详细数据。排名链接电影名主演评分评价人数年份类型制片国家/地区导演语言上映日期片长简介源码如下:import requests, json, openpyxlfrom lxml import etreewb = openpyxl.Workbook()sheet = wb.activesheet_name = ['排名', '链接', '电影名', '主演',
2021-01-04 08:03:43
837
2
原创 异或加密 并暴力破解测试破解密码可行性
key = key * (len(plaintext) // len(key)) + key[:len(plaintext) % len(key)]#取整数/余数 ciphertext=[] for i in range(len(plaintext)): ciphertext.append(str(ord(plaintext[i])^ord(key[i]))) key = ','.join(ciphertext)密码枚举测试...
2021-01-04 07:59:04
1744
1
原创 WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after conne
“ WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after conne”报错pip install xxx -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
2020-12-29 20:58:00
277
原创 RuntimeError: ‘cryptography‘ package is required for sha256_password or caching_sha2_password auth m
RuntimeError: ‘cryptography’ package is required for sha256_password or caching_sha2_password auth methods报错启动Django时报错解决方法:pip install cryptography
2020-12-24 10:58:53
582
原创 Django框架创建入门流程
DjangoSQLite轻量级的嵌入式级的数据库特点是小常用场景Android IOS WP数据库常规操作相似度和MySQL达百分之九十五快捷键万能键-alt + 回车实现一个请求注册一个路由urls中url参数① 匹配规则 正则视图函数对应的是views中的一个函数没有括号去views实现对应的视图函数第一个参数是request永远记得返回Responsehtml快捷键ul>liul*5
2020-12-09 20:44:11
123
1
原创 tkinter模块 实现贪吃蛇小游戏 项目实战
# -*- endoding: utf-8 -*-# @ModuleName:贪吃蛇# @Function(功能):# @Author : 苏穆冰白月晨# @Time : 2020/11/30 21:57import timefrom tkinter import *import randomaaaa = []# basic game configurationdef clicked(event): passdef growSnake(): global sc
2020-12-07 11:42:17
668
原创 UnicodeEncodeError: ‘gbk‘ codec can‘t encode character解决办法
UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\ue615’ in position 488084: illegal multibyte sequence 解决办法with open('baidu.html', 'w', encoding='utf-8') as f: f.write(data)
2020-11-25 20:00:55
2097
1
原创 Scrapy爬虫框架 模板 及 笔记。
import scrapy # 导入scrapy# 创建爬虫类 并且继承自scrapy.Spider --> 最基础的类 另外几个各类都是继承自这个类class ProxySpider(scrapy.Spider): name = 'proxy' # 爬虫名字--> 必须唯一 allowed_domains = ['cn-proxy.com'] # 允许采集的域名 start_urls = [f'http://cn-proxy.com/{page}' f
2020-11-17 09:11:17
2923
原创 使用Base64包加密和解密 ----Python
a 为 一个加密的字符串c 为需要加密的字符串import base64a = "MjAyMDExMTMtMTAx"b = base64.b64decode(a)print(b)c = "20201113-100"d = c.encode("utf-8")e = base64.b64encode(d)print(e)运行结果b’20201113-101’b’MjAyMDExMTMtMTAw’Process finished with exit code 0...
2020-11-13 18:00:17
204
原创 python代码打包,变成exe可执行文件
实现打包,需要使用Python第三方模块进行模块安装pip install pyinstaller使用上诉代码进行第三方模块的安装安装后 再输入一下代码进行测试pyinstaller --version如报错,从头再进行。打包过程通过 CMD 打开"命令提示窗口" , 输入:pyinstaller + -F + 要打包的py文件路径例如:pyintaller -F D:\用户\python\项目.py运行该代码后,可在结果倒数第2行 为EXE:的提示后找到打包成功的文件...
2020-11-06 15:38:42
763
1
原创 爬虫urllib.error.URLError: <urlopen error [Errno 11001] getaddrinfo failed>报错
爬虫报错---->>>>urllib.error.URLError: <urlopen error [Errno 11001] getaddrinfo failed>如下网络问题!!!!!!!!!!!!!
2020-10-27 16:58:58
4876
2
原创 python实现斐波那契数列 简单易懂
a = int(input("需要多少项"))def fbna1(n): a,b=0,1 i = 0 while i < n: a,b=b,a+b yield a i += 1fb = fbna1(a)print("fb",fb)for i in fb: print(i)一下为运行测试:需要多少项10fb <generator object fbna1 at 0x000002680214D93
2020-10-26 10:33:00
239
原创 递归函数展示斐波那契
def fbnq(n): if n == 1 or n == 0: return 1 else: fbnq(n-1) + fbnq(n-2)
2020-10-26 09:50:45
106
原创 you_get的使用 下载视频一步到位
可下载所有主流视频网页的视频import sysimport you_getdef a(url,path): sys.argv=["you-get","--playlist","-o",path,url] you_get.main()ab = " " #这个里面是视频网址if __name__ == '__main__': url = ab path= "D:\AIshaoNv\桌面\爬虫视频测试" #这里面是视频打算下载的路径 a(url,
2020-10-24 20:13:18
335
1
原创 获取 优快云 1024 程序员节勋章教程
2020.10.24,是众所周知的程序员节。在这一天可以获得1024程序员徽章,那么这个勋章具体怎么才能获得呢?在10.24日当天在csdn上发表一篇原创博文就可以了。是不是很简单呢。一般点亮会在一个小时左右完成。最后祝:各位程序猿们,头发常驻~节日快乐~...
2020-10-24 14:14:45
1304
5
原创 python 的LEGB法则--变量的查找顺序
#LEGB法则--变量的查找顺序a = 1def outer(): b = 2 def inner(): c = 3 print(c) # local局部作用域 print(b) # enclosing嵌套函数的外部函数作用域 print(a) # global全部作用域 print(max) # 内置作用域 inner()outer()运行结果321...
2020-10-24 14:04:29
584
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人