
Python
文章平均质量分 89
声明:文中给出的代码可无偿使用,为了说明问题我虚拟出的需求、场景请谨慎使用。程序运行如给你造成不便,请联系我必及时更正。强烈要求大家在学习和运行例子程序前,根据自己的实验环境进行修改。
半点闲
性格内向,爱好极其广泛,性情急躁,工作尚可,略受教育,谢谢大家。
展开
-
攻克验证码干扰线,意外收获 RGB 欧几里得新知识
知识固然是宝贵的财富,它为我们的探索提供了坚实的基础与指引,但想象力却能赋予我们超越常规、开拓新领域的力量。从人类视觉角度审视,经处理后的图片近乎臻美,清晰的视觉效果,字符完整且辨识度极高,无论是线条的流畅度还是颜色的一致性,都无可挑剔,完全符合人类对清晰验证码图像的直观认知,除了字符中偶尔出现的几处断裂。总之,这次与 RGB 欧几里得距离的邂逅,虽然没有帮助我解决当下的实际问题,但却如同一盏明灯,照亮了我在图像处理领域继续探索的道路,带来了知识的增长和眼界的开拓,让我对未来的技术探索充满了期待。原创 2025-04-11 15:29:42 · 429 阅读 · 0 评论 -
Python 轻松去除验证码干扰点,让识别不再犯难
或许在你看来,这篇文章的内容并不复杂,甚至觉得不过如此。但无论你信不信,上述提供的代码背后,是我耗费了大量精力、历经诸多曲折、不断尝试与修正的成果。在无数次的测试与修改中,我删除了大量代码,经历了无数次的失败。最终,在灵光一闪的瞬间,我才得出了这几行简洁而有效的代码。这个过程虽然充满挑战,但也让我深刻体会到了编程的魅力与乐趣。希望我的分享能对你有所启发,也期待你在编程的道路上不断探索与成长。原创 2024-08-29 22:00:42 · 1606 阅读 · 0 评论 -
Python 网络数据采集(四):Selenium 自动化
在 WEB 功能测试领域,Selenium 是一个免费、开源、跨平台的重要工具,它可以对 Chrome、Firefox、Safari 等浏览器进行测试,支持多种语言(如 Python、Java、C#、Ruby、JavaScript 等),它足以胜任一切 WEB 功能测试任务。优点:它可以模拟浏览器,打开你需要爬取的网站,可以大概率避免被封。因为我们用 Python 的 requets 库时,有些反爬严格的网站,可以识别出你当前访问是机器,导致爬取数据失败。缺点:速度慢。原创 2024-01-12 15:21:14 · 2956 阅读 · 0 评论 -
Python 上下文管理器编程模式写出优雅代码——@contextmanager 装饰器
with 语句和上下文管理器即是其中之一(在各种语言中 with 语句的作用不同,不要觉得名字一样,就意味着作用也一样),with 语句会设置一个临时的上下文。这些记录状态的语句,通常格式固定且遍布在代码的各个角落,也就是所谓的样板代码。 但是,如果你的应用场景不需要进行这么细致的管理,也可以使用 @contextlib.contextmanager 来创建简单的上下文管理器,用它把一个生成器函数转换为上下文管理器。得暇,回望先前写的代码,方才发现其中充斥着大量的样板代码。霎时脑海里浮现了开篇的那段话。原创 2023-11-03 22:37:45 · 414 阅读 · 0 评论 -
Scapy 解析 pcap 文件从HTTP流量中提取图片
通常我在网络嗅探与数据包分析中,使用 Wireshark 就可以很方便地浏览 pcap 文件的内容。但当捕获得流量很大或数据包特征不太明显,再或者数据包特征已确定,要从中进一步分析(提取)流量。以往采用人工方式可以说是种恶梦。幸运的是 Philippe Biondi 为 Python 开发的数据包处理库Scapy以精巧和令人惊叹,一两行代码就能解决上述问题(功能远远不止如此)。这里我会演示如何借助 Scapy 的 pcap 数据处理能力,从嗅探到的 HTTP 流量中提取图片。原创 2023-09-17 18:25:01 · 3322 阅读 · 1 评论 -
PYTHON 解码 IP 层
通过上述举例。我的初衷只是为了让原本乏味枯燥的,网络相关理论知识变的有趣,为我们接下来深入学习起到“抛转引玉”的作用。原创 2023-07-12 17:28:53 · 1652 阅读 · 2 评论 -
geo-tool 解析百度经纬出错 {‘status‘: 240, ‘message‘: ‘APP 服务被禁用‘}
近日,在做一个项目需要使用百度地图提供的地理编码 API 来完成从物理地址到经纬度的转化。实践过程中纯手工调用百度 API 较为繁琐,就想查找一下是否有人已经实现了这个服务的通信协议。原创 2023-06-25 11:12:22 · 2102 阅读 · 0 评论 -
PYTHON 实现 UNIX/LINUX 性能监视可视化
UNIX/LINUX 系统运行时,将维护一组计数器以跟踪一些关键的系统资源的使用情况,包括:CPU 使用情况缓冲区使用情况磁盘 I/O 活动磁带 I/O 活动终端活动系统调用活动上下文切换活动文件访问情况队列活动进程间通讯换页活动空闲内存和交换区内核空间分配内核表远程文件共享通过对上述资源使用情况的分析,可获得系统中三个子系统的工作情况,这三个子系统为:CPU CPU 处理指令和程序。用户向系统提交作业主要由 CPU 完成。原创 2022-10-03 23:36:07 · 2668 阅读 · 12 评论 -
优快云21天学习挑战赛——day1 正则表达式大总结
优快云21天学习挑战:100天精通Python原创 2022-08-01 17:48:54 · 472 阅读 · 0 评论 -
Python 命令行参数:Argparse 与 Click
和以往一样,我在实践过程中,执行编写的程序时,通过命令行传值给 Python 程序,达到从外部控制程序(而不是在代码内对这些值进行硬编码)。Python 内置了 Argparse 的标准库用于创建命令行,Argparse 是面向过程的,需要先设置解析器,再定义参数,再解析命令行,最后实现业务逻辑。在一些人看来,这此方式都不够优雅。...原创 2022-07-29 12:18:19 · 2987 阅读 · 1 评论 -
Python 玩数据分析:统计 Excel 并用 Matplotlib 绘图
Python 玩数据分析:统计 Excel 并用 Matplotlib 绘图原创 2022-06-19 15:51:41 · 3365 阅读 · 2 评论 -
Python 网络数据采集(三):采集整个网站
Python 网络数据采集(三):采集整个网站原创 2022-06-02 11:23:52 · 1861 阅读 · 1 评论 -
Pycurl HTTPS错误:无法获取本地颁发者证书
Pycurl HTTPS错误:无法获取本地颁发者证书原创 2015-04-06 19:59:00 · 6103 阅读 · 0 评论 -
用Python监控、重启指定系统服务并发送通知邮件
用Python监控、重启指定系统服务并发送通知邮件作者:高玉涵时间:2021.5.26 11:11博客:blog.youkuaiyun.com/cg_i背景某一应用程序被部署在多台服务器上,近段时间程序会无规律的宕掉,有时一台、有时多台失效,机器其它应用均正常,重启失效应用后服务恢复正常。应用提供的服务需实时响应,加上部署机器较多,一时又无法定位故障成因,在没有找到解决办法之前,每当出现上述故障,首要任务是要及时发现、及时重启,以保证各项业务正常。应急用Python开发了一个监测记录应用状态的程序,当发原创 2021-05-26 11:56:22 · 1071 阅读 · 2 评论 -
Python 网络数据采集(一):BeautifulSoup
Python 采集网络 数据(一):BeautifulSoup 起个头网络数据采集大有所为第一个任务1. Beautifulsoup 简介1.1 安装 BeautifulSoup1.1.2 运行 BeautifulSoup1.1.3 复杂 HTML 解析1.1.4 BeautifulSoup 的 find() 和 findAll()1.1.5 其它 BeautifulSoup 对象1.1.6 导航树2. 一个完整的例子3. 未完待续······ 作者:高玉涵 时间:2022.5.20 16:47 博原创 2022-05-20 19:59:21 · 2022 阅读 · 0 评论 -
Python 网络数据采集(二):抓取所有网页
Python 网络数据采集(二):抓取所有网页如有必要,移劝到另一个网页重复这个过程2. 正则表达式2.1 正则表达式和 BeautifulSoup2.2 获取属性2.3 遍历单域名下所有页面2.4 让标签的选择更具体2.5 完整代码3. 下一节,通过互联网采集参见 作者:高玉涵 时间:2022.5.22 08:35 博客:blog.youkuaiyun.com/cg_i不知前方水深浅。如有必要,移劝到另一个网页重复这个过程 在互联网上进行自动数据采集这件事情和互联网存在的时间差不多一样长。虽然网络数据采集原创 2022-05-27 13:56:59 · 4678 阅读 · 0 评论