- 博客(10)
- 收藏
- 关注
原创 pandas agg函数
agg 的核心优势是灵活性和高效性,尤其适合复杂的分组统计需求。通过组合不同的函数和列,你可以快速生成多维度的统计结果。
2025-03-29 17:53:46
757
原创 掌握Pandas核心操作:query、assign与pivot_table深度解析
本文将通过实际代码示例,深入解析Pandas中三个高效数据处理方法:query条件筛选、assign列操作和pivot_table透视表,助你提升数据处理效率。
2025-03-27 21:03:54
1669
原创 数据清洗三部曲:缺失值填充、重复值剔除与类型转换实战指南
数据清洗是数据分析过程中最关键的环节之一,直接影响后续建模和决策的可靠性。本文将深入解析数据清洗的三个核心操作:**缺失值填充**、**重复值剔除**和**类型转换**,并提供完整的Python代码实战示例。
2025-03-26 21:49:55
810
原创 Pandas核心入门:彻底理解Series与DataFrame
Series是Pandas中最基础的带标签的一维数组,可以看作Excel中的单列数据,但功能更加强大。包含一组数据(任何NumPy数据类型)包含一组索引(默认从0开始的自增索引)数据与索引自动对齐#从列表中创建#从字典创建#从Numpy数组中创建。
2025-03-25 16:29:58
456
原创 Python协程入门必读:从生成器基础到async/await实战
协程(Coroutine)是Python异步编程的核心,但许多开发者对其底层原理和演进过程一知半解。本文将通过的视角,带您从基础到实战完整掌握协程开发,最后还会揭秘async/await背后的魔法。
2025-03-24 22:26:05
377
原创 深入理解Python上下文管理器
上下文管理器(Context Manager)是Python中用于精确分配和释放资源的机制。它通过和__exit__()两个魔术方法实现了上下文管理协议,确保即使在代码执行出错的情况下,资源也能被正确清理。# 经典文件操作对比# 传统方式try:finally:f.close()# 上下文管理器方式文件操作(自动关闭)数据库连接(自动归还连接池)线程锁(自动释放)临时修改配置(自动恢复)
2025-03-23 17:02:18
1382
原创 小说字体反爬破解指南——Python实现woff2字体逆向解析与OCR识别
某茄小说等平台采用动态woff2字体实现文字反爬,传统CSS映射方法已无法满足需求。
2025-03-23 00:00:01
1302
原创 用Babel操作AST实现JavaScript代码的自动化生成与转换
提取case顺序:通过_0x5678数组的初始值确定执行顺序(本例顺序为2→0→1)· 重建代码顺序:按顺序合并case块中的语句,删除switch和while结构。· 识别switch-case结构:找到SwitchStatement节点。· 计算常量表达式:在AST遍历阶段预计算!· 删除无效分支:根据计算结果删除false分支。
2025-03-20 23:52:12
762
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅