- 博客(143)
- 资源 (4)
- 收藏
- 关注
原创 Python 函数参数类型与使用规则详解
Python以其灵活性著称,这种特性在函数参数设计中尤为明显。本文将依据语言规范,系统阐述Python函数所支持的全部参数类型及其应用。
2025-12-03 17:18:00
343
原创 Python 3.14 无GIL解释器性能测试:释放多核CPU的并行潜力
Python 3.14 自2025年10月7日发布以来,已在技术社区中积累了丰富的实践与评测资料。目前国内的相关文章大多译自国外大神的博客文章,内容都很“高大上”,但在普遍适用性方面尚缺乏贴近实际的基础案例。为此,本文旨在提供一个通用的实践示例,作为后续深入研究和学习的baseline。
2025-10-28 14:27:10
430
原创 Python 标准库之pathlib(二),路径操作
小编之前写过一篇介绍pathlib标准库的文章,最近在做项目时,又发现其有一个更好用的功能,分享给大家,供大家参考学习。
2025-10-16 13:08:27
355
原创 Python Pandas导出Excel时保留URL为纯文本的完美方案
在日常数据处理中,你是否遇到过这样的困扰?😫当你使用to_excel。这个看似贴心的功能,实际上却暗藏两个让人头疼的问题:🚨Excel单个工作表最多只能容纳65,530个超链接一旦超过这个限制,程序就会报错,或者更糟糕——静默丢弃超出的部分,导致数据丢失!🚨自动转换为超链接时,Excel对URL长度有严格限制(通常为255个字符)超过这个长度的链接会被无情截断,生成无效的超链接答案是肯定的!本文将为你揭秘如何通过简单的设置,彻底告别这些烦恼,确保你的URL数据完整无缺地导出到Excel中。
2025-09-28 17:33:21
361
原创 Python 基于plotly库快速绘制时间线图
本文借助库来绘制时间线图,该库是一个高级可视化库,相对 Matplotlib 更高级一些,上手相对比较容易。
2025-09-19 17:48:17
336
原创 Python 利用协程整合IPTV直播源
家里的电视,你还打开过吗?像小编这样长期在外打拼的“北漂族”,电视似乎早已慢慢淡出了日常生活。但每次过节回家,和家人围坐在一起,看看电视直播,却成了一种难得的仪式感。说起电视直播,就不得不提到小编偶然发现的一款神器——这款软件确实强大,装到电视上就能免费观看海量电影、电视剧和各地直播频道,不过有一点挺让人头疼:别人分享的直播源,常因为网络运营商不同,在自己家可能根本无法播放……于是,就有了今天这篇文章的主题:如何整合网络上分享的IPTV直播源,把它们变成适合自己家庭网络环境的稳定直播源。
2025-09-08 18:47:50
674
原创 Python 单实例模式详解
你是否听说过 Python 中的?,小编之前在阅读别人代码的时候曾经遇到过,一直不知道那段代码什么含义,后来在搜索资料时,才知道那段代码的含义是创建单实例,也正是从那之后,才知道这个名词,是 Python 中的一种设计模式,用大白话说就是类的实例对象在内存中只有一个。
2025-08-22 19:11:20
798
原创 Python collections详解:解锁高效数据结构
虽然 Python 中已提供了等非常灵活的数据结构,但是**** 模块提供了高性能的容器数据类型,能大幅优化代码效率和可读性,本文将深入解析该模块中的六大核心工具,助你写出更优雅的Python代码,避免你重复造轮子。
2025-08-13 17:21:10
428
原创 Python函数参数:列表作为默认值,一个隐藏的陷阱!
在Python编程中,函数参数的设计直接影响代码的健壮性和可预测性。**一个需要警惕的实践是:避免将可变对象(尤其是列表)作为函数参数的默认值。**这样做可能导致极其隐蔽且令人困惑的bug。
2025-08-05 19:50:03
297
原创 Python 项目管理新思路:用 uv Workspace 共享虚拟环境,省时省空间!
上手 uv一段时间后,真心觉得这款工具让 Python 项目管理变得省心不少!它不仅操作便捷,安装第三方包的速度更是快得飞起。不过,在使用过程中也发现了一个小痛点:uv默认会为每个项目创建独立的虚拟环境。这意味着,如果你同时开发多个项目,即使它们依赖相同的第三方包(比如常用的 requests、pandas),这些包也需要在每个项目的虚拟环境中。久而久之,宝贵的磁盘空间就这样被悄悄占用了不少。难道只能忍受这种“甜蜜的负担”吗?当然不是!仔细翻阅 uv的文档后发现,它其实贴心地提供了。
2025-07-29 19:14:31
808
原创 Python 2个好用的装饰器函数
装饰器:Python开发者的效率利器!🛠️在Python的世界里,装饰器绝对是一把强大的“瑞士军刀”。它能帮我们优雅地封装通用逻辑,大幅减少重复代码,真正实现事半功倍的开发效率。如果你是第一次接触装饰器这个概念,强烈建议先找些基础资料了解一下它的核心思想和工作原理(别担心,小编当初也是一头雾水,看别人的代码完全摸不着头脑)。打好基础再往下看,理解起来会顺畅得多,相信小编!
2025-07-22 18:05:21
388
原创 利用Python实现二维码自由
二维码,早已融入我们的日常!扫一扫加好友、支付买单、参加活动……处处可见它的身影。但你是否想过,自己也能轻松生成专属二维码?无论是分享链接、联系方式,还是传递一句悄悄话,一个专属二维码就能搞定!想知道如何实现?本文为你准备了详细案例教程,手把手教你玩转二维码生成!👇。
2025-07-15 15:15:31
324
原创 尝试 gemini-cli,在本地开发俄罗斯方块
如今,大家在遇到问题时,都已经学会了先去deepseek一下,然后得到自己需要的答案,这充分体现了大模型在信息检索领域的强大应用。然而,这仅仅是大模型潜力的一个方面。随着大模型技术的持续深化与普及,其影响力必将进一步渗透至各行各业。近期,谷歌开源的 gemini-cli 工具,无疑为开发者社区带来了显著利好,经过小编试用,感觉大模型在编程应用方面,又迈上了一个新台阶。
2025-07-04 17:32:49
334
原创 Python 迈向强类型化的优雅转变
Python 不再是你记忆中的“弱类型”语言了!随着类型注释的普及和高版本Python的演进,它正悄然蜕变为一门兼具灵活性与严谨性的现代语言。
2025-06-16 19:35:50
361
原创 Python 新晋包项目工具uv的简单尝试
小编最近看公众号里面uv文章比较多,于是也尝试着用了一下,整体感觉对于开发项目人员来说很好,方便自动管理项目依赖,后期在部署时,可以根据uv自动构建的项目依赖来进行配置,省去各种包冲突麻烦。
2025-05-20 19:52:58
1149
原创 Python 在指定文件夹安装三方库,并进行加载使用
在公司内部的服务器中,安装三方库是需要经过层层审批,最后由运维人员进行安装,员工一般是没有权限去随意安装三方库,在审批之前需要进行测试验证可行性,那么这时就需要把三方库安装到自己有权限的目录中,然后再进行使用。小编这里经过亲身测试验证,分享出来供大家参考学习。
2025-04-17 19:57:59
306
原创 Python 一个在本地给图片添加水印的小工具
在日常业务办理过程中,不知大家是否养成了为重要文件添加水印的习惯?特别是通过微信等社交平台传输的证件照片、合同扫描件等敏感资料,建议都应当添加包含个人/企业信息的水印,这样既能保护隐私又能防止资料被滥用小编这里分享的小工具,是在本地进行操作,不用把照片上传到其他系统中,更好的保护了个人隐私。
2025-04-08 19:41:25
445
原创 Clickhouse 读取存储在hdfs的hive表数据
离线数据经过 hive 处理后,生成的新数据,有时需要对接至研发侧 clikehouse,供前端用户查询使用,所以会涉及到hive数据同步至clikehouse,因为hive数据底层是存储在 hdfs ,因此只要知道hive的建表语句(元数据),再结合 clikehouse 中的特定表引擎(本质是表映射),即可实现 clikehouse 直接读取hdfs数据。
2025-03-18 09:45:39
465
原创 Python中一个构建 web 页面的神奇库 streamlit
在上一篇文章《基于DeepSeek,构建个人本地RAG知识库》中用到了streamlit库,于是小编初步深入了解了一下,感觉很好用,是数据人的一个好帮手,避免学习前端知识,利用该库直接在 Python 中编码代码,然后启动服务后,在浏览器中可以直接查看 web 页面,省略了后端、前端构建 web 的繁琐过程,数据人可以直接把自己的数据以 web 形式展示出来。
2025-03-07 17:19:57
1050
原创 基于DeepSeek,构建个人本地RAG知识库
经过一段使用DeepSeek后,感觉使用体验和ChatGPT基本差不多,问答问题的质量略有提升,因DeepSeek已开源,它的模型、模型权重参数从网上都可以下载到,所以可以基于开源的模型,在本地构建一个自己的知识库,小编这里使用的是蒸馏后的模型权重RAG (Retrieval-Augmented Generation)检索增强生成,是一种通过整合外部知识库来增强大模型(LLM)回答问题质量的模式。最简单的理解,可以认为是给大模型外挂了一个知识库。
2025-02-20 17:08:52
726
原创 基于DeepSeek,构建个人本地知识库RAG
背景经过一段使用DeepSeek后,感觉使用体验和ChatGPT基本差不多,问答问题的质量略有提升,因DeepSeek已开源,它的模型、模型权重参数从网上都可以下载到,所以可以基于开源的模型,在本地构建一个自己的知识库,小编这里使用的是蒸馏后的模型权重 deepseek-r1:1.5bRAG (Retrieval-Augmented Generation)检索增强生成,是一种通过整合外部知识...
2025-02-20 16:43:52
756
原创 从互联网+,到DeepSeek+,新一轮的技术变革
去年春节过后,ChatGPT成为了科技领域的热议话题,而今年过完年后,DeepSeek同样火爆异常,引发了广泛的讨论。随着大量文章的涌现,DeepSeek的功能和潜力成为了焦点。在这一波技术革新的浪潮中,这里小编也评论一下哪些行业和职业将会受到影响?毫无疑问,搜索引擎行业可能会受到DeepSeek的巨大冲击。无论是国内的百度,还是国外的Google,传统的搜索引擎模式似乎在面对像ChatGPT和DeepSeek这样的智能工具时,显得有些力不从心。
2025-02-08 16:33:52
483
原创 Python 基于Matplotlib制作动态图
一图胜千言,优秀的可视化图表不仅能以直观、简洁的方式呈现复杂的信息,还能够通过图形、颜色和布局的巧妙设计,引发观众的情感共鸣,增强数据背后故事的表达力与说服力。它们超越了单纯的数据展示,更能帮助观众深入理解潜在的趋势、关系和模式,从而更有效地支持决策和行动。
2025-01-21 17:01:53
402
原创 Python 基于协程的端口扫描工具
端口扫描技术广泛应用于网络运维、网络安全测试、以及黑客攻击服务器等领域。在网络运维中,管理员通过端口扫描来检查服务器或设备的开放端口,确保网络安全并及时发现潜在的漏洞。在网络安全测试中,端口扫描帮助识别网络中的弱点,进而制定防护措施,提升整体安全性。而在黑客攻击的情境下,攻击者通过端口扫描发现目标设备开放的服务,从而寻找攻击入口点,实施非法入侵。因此,端口扫描不仅是安全防护的一个重要工具,也常被黑客用作攻击手段。
2025-01-14 15:29:25
420
原创 管理的精髓
本文摘自《深层认知:深层洞悉事物的商业逻辑》,小编感觉讲的挺有道理,分享出来供大家品读。小编读后感到,国内公司在管理水平提升方面仍任重道远,未来的道路依然漫长且充满挑战。在中国企业家里,最懂“用人之道”和“管人之方”的,估计非任正非莫属。他对管理的认知极其深刻,甚至早已超越了企业的范畴,值得我们认真品味。要知道,华为近20万名员工都是有文化的聪明人,如何把这一群聪明能干的人拧成一股绳,形成一...
2025-01-06 10:06:35
1003
原创 Clickhouse 基础使用教程
不推荐使用外部语言编写自定义函数,例如:java、python 等,推荐使用自有的函数,逐步组合实现自定义函数,性能高--分割字符串并把类型转换为整数arrayMap(
2024-12-19 19:45:11
1037
原创 Clickhouse中创建生成日期序列自定义函数
因Clickhouse 是用C++语言编写,如果想扩展自定义函数,需要用C++来实现或借助sql方式实现,如果想使用其他语言,则只能进行桥接(把数据输出至系统,在系统中调用其他语言处理数据,然后把系统中输出的结果,拿回到clickhouse)。这里小编借助sql 方式来实现,感觉实现起来和编写python很像利用Chatgpt的帮助,可以一步一步完成所需要的函数功能arrayMap(和,结果是天数使用 arrayMap 遍历序列,将每个整数加到起始日期上,生成完整的日期序列。
2024-12-09 14:32:14
702
原创 Python 基于pyhive库操作hive
在大数据处理时,基本都是基于Hadoop集群进行操作,数据相关人员在开发数仓或做临时业务需求时,基本都是利用 hive,写 sql 进行数据处理与统计分析,但是 sql 在处理一些复杂业务逻辑时会比较复杂,本文通过基于 pyhive 操作 hive,把 sql 的查询结果转为 pandas 中的 DataFrame 数据框,用于后续数据分析pyhive库类似于pymysql库,都是 Python 中与不同数据库系统进行交互的库。它们都提供了简洁的接口来执行 SQL 查询,处理结果集,以及管理连接。
2024-11-14 17:08:02
592
原创 Python 基于plotly库快速画旭日图
本文借助库来画旭日图,该库是一个高级可视化库,相对 Matplotlib 更高级一些,上手起来相对比较容易。
2024-11-04 16:54:44
754
原创 Rust 是否会重写 Python 解释器与有关的库,替代 C 语言地位?
近2年随着Rust语言的大力发展,一些系统与软件开始逐渐使用Rust语言来实现,并且一些大型公司也开始逐渐转向Rust因为在学习 Polars 库时,看到该库是使用Rust实现的,小编近一年也逐渐开始学习Rust语言,了解到其中的一些思想相对其他语言来说确实比较先进,所有权概念的引入,不仅可以提升性能,而且还保证了数据安全、准确,不会有数据竞争问题的产生小编最近在处理加解密任务时,借助Rust语言实现了一个DES加解密库,借助Rust 中的pyo3包,在Python 中借助maturin。
2024-09-24 14:44:43
622
原创 Python pandas中重排列与列重名
把数据导出到Excel中时,有时需要对列的顺序进行调整,按业务需求进行排列,并且字段名字不能是英文,这样方便业务人员查看与理解数据,在pandas中有相应的函数可以满足以上2个要求,让我们来学习一下吧。
2024-09-06 09:49:58
770
原创 Python 利用矢量化,计算2个经纬度之间的距离
假如全国所有的酒店/民宿经纬度信息已知的情况下,基于当前位置,怎么快速计算附近5KM内的酒店/民宿呢?现实中有大量的这种业务场景,需要快速计算2点间的地球距离本篇文章,比如当前的定位是在北京,那么没有必要去计算与上海的酒店/民宿距离;来进行优化,看看性能大约能提升多少。
2024-08-20 16:04:55
519
原创 Python polars学习-10 时间序列类型
polars学习系列文章,第10篇 时间序列类型(Time series)该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习。
2024-08-05 17:22:25
1367
3
原创 Python polars学习-09 数据框关联与拼接
polars学习系列文章,第9篇 数据框关联与拼接(Join 、Concat)该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习。
2024-07-23 15:23:53
1498
原创 Python polars学习-08 分类数据处理
polars学习系列文章,第8篇 分类数据处理(Categorical data)该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习仓库地址:https://github.com/DataShare-duo/polars_learn。
2024-07-08 10:28:32
805
原创 Python polars学习-07 缺失值
在 polars 中缺失值用null来表示,只有这1种表示方式,这个与 pandas 不同,在 pandas 中NaN(NotaNumber)也代表是缺失值,但在polars中把NaN归属为一种浮点数据},print(df)┌───────┐│ value ││ --- ││ i64 │╞═══════╡│ 1 ││ 2 ││ 3 ││ null ││ 5 ││ 6 ││ null ││ 8 ││ 9 │└───────┘。
2024-06-25 19:22:20
1196
原创 Python polars学习-06 Lazy / Eager API
polars学习系列文章,第6篇 Lazy / Eager API延迟、惰性即时、实时该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习仓库地址:https://github.com/DataShare-duo/polars_learn。
2024-06-20 17:26:34
584
原创 Python polars学习-05 包含的数据结构
polars学习系列文章,第5篇 包含的数据结构,与pandas一样,polarsSeriesDataFrame,大部分操作与pandas保持一致,减少了大家的学习难度该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习仓库地址:https://github.com/DataShare-duo/polars_learn。
2024-06-14 17:06:19
522
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅