python
呆萌的代Ma
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
解决pandas使用to_datetime()转换日期时遇到报错或NaT的结果
当使用pd.to_datetime()处理包含None值的日期数据时,pandas会将其转换为pd.NaT而非保留None。解决方法是在转换时添加errors="coerce"参数,再通过.replace({pd.NaT: None})将NaT替换回None。这种两步处理方法可以确保无效日期被正确转换为None值而非NaT。原创 2025-11-18 15:21:37 · 182 阅读 · 0 评论 -
python相对路径导入函数
本文介绍了Python中使用相对路径导入模块的注意事项和两种实现方式。首先强调所有文件夹必须包含__init__.py文件且推荐统一使用相对路径导入。通过两个示例演示了导入方法:1)简单模块导入,在__init__.py中使用from .model_a import *;2)子目录模块导入,使用from .model_b_dir.model_b import *。最后在主文件中可直接调用导入的函数。该方式适用于组织项目结构时的模块导入需求。原创 2025-11-14 16:16:43 · 207 阅读 · 0 评论 -
python获取版本信息与所有的第三方库
本文介绍两个Python函数:get_python_base_version()获取Python版本、解释器路径等基本信息;get_python_site_packages()列出所有已安装的第三方库及其路径。后者通过遍历importlib.metadata和site模块,收集site-packages目录中的第三方包,并按名称排序返回包含库名和位置路径的字典。两个函数分别用于获取Python环境的基本信息和第三方包管理。原创 2025-11-07 14:54:55 · 156 阅读 · 0 评论 -
python找到文件夹A中但是不在文件夹B中的文件
该Python代码使用os模块比较两个文件夹路径中的子文件夹差异。主要功能是通过os.listdir()获取路径下所有文件夹,用os.path.isdir()验证路径类型,然后比较两个路径下文件夹集合的差集。代码包含异常处理,能检测路径存在性和访问权限问题,并输出在path_a中存在但path_b中缺失的文件夹列表。结果按字母排序并显示缺失总数。原创 2025-11-04 19:09:39 · 178 阅读 · 0 评论 -
解决报错statsmodels使用线性回归报错numpy.linalg.LinAlgError: SVD did not converge
本文介绍了处理数据分析中无穷大值的方法。当数据包含np.inf或-np.inf时,会导致统计模型计算错误。解决方法是先将这些无穷值替换为np.nan。示例代码展示了如何用Pandas的replace函数转换无穷值,使OLS回归能够正常计算残差。这种方法简单有效,适用于需要处理异常值的数据分析场景。原创 2025-11-03 18:40:35 · 214 阅读 · 0 评论 -
pandas计算加减乘除的时候指定按照行或列进行计算
这篇文章介绍了在Python中使用pandas进行按行或列操作的方法。通过内置的add()、sub()、mul()、div()函数可以实现基本运算,使用axis参数控制行/列方向(axis=0为列,axis=1为行)。文中提供了一个标准化数据的函数示例,展示如何计算均值与标准差,并实现按行/列标准化。该函数通过axis参数灵活支持行列转换,最终验证了行列转换后的计算结果一致性。代码演示了如何使用mean()、std()、sub()和div()方法结合axis参数实现特定维度的数据处理。原创 2025-11-03 17:49:43 · 175 阅读 · 0 评论 -
python apscheduler添加调度,固定在每个整数分钟执行代码
本文介绍了如何使用Python的APScheduler库实现定时任务调度。代码示例展示了如何创建一个每分钟整点执行的定时任务:通过BlockingScheduler调度器,使用cron触发器设置每分钟第0秒执行my_task函数,该函数会打印当前时间。调度器启动后会持续运行,按照设定时间规则自动触发任务执行。这段代码适用于需要周期性执行任务的场景,如定时数据采集、日志记录等。原创 2025-10-22 18:19:42 · 114 阅读 · 0 评论 -
通过pandas merge_asof模糊匹配,快速计算财务同比指标
这个工具函数使用pandas的merge_asof方法实现快速匹配去年同期数据。函数首先将日期列转换为datetime类型并排序,然后创建去年同期日期列(当前日期减1年)。merge_asof以direction="backward"参数进行模糊匹配,查找小于等于目标日期的最近记录。该函数适用于需要分析同比数据的场景,能高效地将当前值与去年同期值进行关联。示例展示了函数如何将2021-2022年的数据与2020-2021年对应日期的数据进行匹配,输出结果包含原始数据和匹配到的去年同期值。原创 2025-10-21 19:23:00 · 269 阅读 · 0 评论 -
解决pandas处理MultiIndex的dataframe数据赋值时,赋值后结果为NAN的问题
在处理带有MultiIndex的DataFrame时,使用.loc[]直接更新数据可能失效。当数据处理后返回乱序结果时,解决方案是确保返回值的索引与原始MultiIndex匹配,然后使用update()方法更新数据,而不是直接赋值。文中提供了完整代码示例,展示了错误和正确的两种更新方式,演示了如何通过重新设置索引并使用update()来正确更新MultiIndex数据。原创 2025-10-19 16:28:02 · 210 阅读 · 0 评论 -
python计算期货等市值对冲开仓所需的手数
本文提供了一个计算期货等市值对冲开仓手数的工具函数。函数通过公式手数 = (总资金 * 杠杆) / (价格 * 合约乘数)计算两个品种的对冲手数,并自动取整处理。示例中分别计算价格为1146(乘数60)和1642(乘数100)的品种,默认10万资金7倍杠杆下,输出结果为101手和42手。该函数简化了对冲策略中的仓位计算过程。原创 2025-10-13 18:43:36 · 222 阅读 · 0 评论 -
python使用多进程处理数据后,安全写入文件
本文介绍了一个多进程数据处理的实现方案。核心思路是:1)创建进程安全队列用于数据传输;2)启动独立进程监听队列并写入文件;3)使用进程池并行处理数据,结果存入队列;4)发送结束信号终止队列。示例代码展示了队列写入器、工作进程和主控逻辑的实现,使用Python的multiprocessing模块确保进程安全,并通过"STOP"信号优雅终止队列处理。该方案适用于需要并行处理数据并集中存储结果的场景。原创 2025-10-11 15:11:18 · 223 阅读 · 0 评论 -
迅投xtquant计算股票换手率
本文介绍了如何使用xtquant库计算股票换手率。通过自定义calculate_turnover函数,结合行情数据和财务数据,按照换手率公式(成交量/流通股本)进行计算。实现步骤包括:1)下载行情和财务数据到本地;2)合并日线行情与股本数据;3)填充缺失值后计算换手率百分比。该函数返回包含各股票每日换手率数据的字典,示例展示了如何计算000001.SZ和000002.SZ两只股票的换手率。使用前需确保已下载所需历史数据。原创 2025-09-30 17:20:54 · 305 阅读 · 0 评论 -
迅投xtquant获取前一日收盘价,解决get_market_data_ex无lastClose字段的问题
本文介绍了在获取股票历史行情数据时,如何正确使用get_market_data_ex函数获取前一日收盘价的方法。文章指出,lastClose是tick级别特有的字段,表示前一日收盘价;而preClose是1m、5m、1d等级别的字段,表示前一个周期的收盘价。提供了两种解决方案:1)使用tick级别获取lastClose字段;2)使用1d级别获取当天的preClose字段。同时通过代码示例展示了不同时间级别下获取的数据差异,帮助用户正确理解和使用这些字段。原创 2025-09-30 14:36:37 · 644 阅读 · 0 评论 -
pandas将excel导出到yaml文件中
本文介绍了一个将Excel文件转换为YAML格式的工具函数。该工具需要安装pandas和pyyaml库,主要功能包括:读取Excel表格数据,处理空值和日期格式,并将结构化数据输出为YAML文件。核心函数excel_to_yaml()接收Excel路径、输出YAML路径和可选表名参数,通过pandas读取数据后转换为字典列表,最后使用yaml.dump()写入文件。该工具可方便地将表格数据转换为更适合配置使用的YAML格式。原创 2025-08-30 11:13:53 · 189 阅读 · 0 评论 -
解决python代码import psycopg2报错from psycopg2._psycopg import ( # noqa
使用pip install psycopg2-binary可以快速安装PostgreSQL数据库的Python适配器。这个二进制包包含了预编译的库文件,相比标准版安装更简便,无需单独配置编译环境。适合开发测试或快速部署场景。原创 2025-07-06 16:18:42 · 143 阅读 · 0 评论 -
python实现对数据的公钥加密与私钥解密
本文介绍了使用Python进行RSA公钥加密的完整流程。首先通过cryptography库生成2048位的RSA密钥对(公钥存为my_public_key.pem,私钥存为my_private_key.pem并使用密码"my_secret_password"加密)。接着演示了公钥加密过程:随机生成明文消息,用OAEP填充模式加密后保存为二进制文件。最后展示私钥解密过程:用密码加载加密私钥,解密二进制密文并还原原始消息。整个流程包含了密钥生成、数据加密和解密的完整实现原创 2025-06-26 15:23:20 · 331 阅读 · 0 评论 -
Windows配置cuda,并安装配置Pytorch-GPU版本
Windows配置cuda,并安装配置Pytorch-GPU版本原创 2024-12-27 12:43:52 · 2220 阅读 · 0 评论 -
python回调函数使用及示例
在上面的逻辑中,回调函数执行了一个具体的操作(value+1),而中间函数对这个操作的调用和结果都进行了记录,而在使用的时候,我们看到的是main函数。这是回调函数一般的逻辑过程。回调函数一般用于对于结果的编程,或是在异步操作中执行,是在一般顺序编程的基础上,外加一个通用的处理模块,让代码更加简洁高效。的具体反馈,给与不同的逻辑,将逻辑都写在。这个函数,这里通过回调就可以根据不同的。原创 2024-12-26 11:19:44 · 473 阅读 · 0 评论 -
python使用多进程处理字符串格式的待执行函数及参数
python使用多进程处理字符串格式的待执行函数及参数原创 2024-06-26 13:17:49 · 414 阅读 · 0 评论 -
python解析字符串为可执行的函数,并指定参数
【代码】python解析字符串为可执行的函数,并指定参数。原创 2024-06-26 11:22:52 · 358 阅读 · 0 评论 -
pandas将dataframe展开/拉伸成一个series
【代码】pandas将dataframe展开/拉伸成一个series。原创 2024-06-25 13:21:12 · 437 阅读 · 0 评论 -
在dolphinDB上直接保存一个dataframe为分布式数据表
【代码】在dolphinDB上直接保存一个dataframe为分布式数据表。原创 2024-06-24 18:29:45 · 519 阅读 · 0 评论 -
使用python读取dolphinDB数据表的列名称
【代码】使用python读取dolphinDB数据表的列名称。原创 2024-06-24 18:23:19 · 396 阅读 · 0 评论 -
使用python在dolphinDB上运行SQL
使用python在dolphinDB上运行SQL原创 2024-06-24 18:17:03 · 983 阅读 · 0 评论 -
解决使用命令行运行python找不到根目录,无法import各个模块
【代码】解决使用命令行运行python找不到根目录,无法import各个模块。原创 2024-06-17 13:35:59 · 497 阅读 · 0 评论 -
pandas style设置渐变背景色 background_gradient
渐变背景色可以通过设置实现。原创 2024-06-06 13:47:25 · 1012 阅读 · 0 评论 -
Luigi任务调度框架学习2:运行每一个Task,避免因判定完成导致跳过执行Task主程序
在上一篇Luigi的线性调度文章中,我们知道Task运行的时候:每个任务是否完成有两次判定,即:进行判定(未完成) =》运行def run(self)函数 =》进行判定(完成) =》运行后续的Task;如果第一次判定就完成,则不会执行当前Task的def run(self)函数但是Luigi支持的判定条件只有文件与SQL,在有些情况下(尤其是定时任务),我们希望它梳理并运行整个拓扑,而不是根据判定去决定是否运行,因此本文来解决这个问题,让我们能够直接运行Task。原创 2024-03-29 15:46:38 · 697 阅读 · 0 评论 -
Luigi任务调度框架学习1:线性调用流程
Luigi是一个上手很快的框架,用几个小时就可以学到足以应付常规多模块多任务的程序了。原创 2024-03-29 14:52:59 · 773 阅读 · 0 评论 -
解决pandas使用to_sql,传入sqlalchemy的create_engine后无法保存数据的问题
【代码】解决pandas使用to_sql,传入sqlalchemy的create_engine后无法保存数据的问题。原创 2024-03-27 16:26:55 · 612 阅读 · 0 评论 -
python使用pypika,链式调用动态生成SQL语句(1 常用查询)
它可以通过python程序的链式调用生成最后的SQL语句,在需要通过判断条件确定要不要添加某些SQL语句的情境下非常方便,通过。写一个封装SQL的工具会非常方便,但是弊端就是需要先想好生成的SQL语句。它无法在不清楚SQL语句的前提下实现结果。原创 2024-03-12 16:26:22 · 874 阅读 · 0 评论 -
python apscheduler添加监听器listener,用于自动化任务的反馈
apscheduler可以通过添加监听器,得到定时任务的反馈。监听会监听到的是,进入常量描述事件类。原创 2024-03-12 15:19:46 · 1483 阅读 · 0 评论 -
解决pandas使用sqlalchemy保存到Mysql数据库时,bool布尔类型数据转为tinyint数据的读取
pandas在使用to_sql()保存数据到数据表中,Mysql会将bool类型的数据转为tinyint类型,比如:此时数据表字段的类型为:这样就可以在读取出数据之后,将指定的这两列bool_true与bool_false转为bool布尔类型的数据。原创 2024-03-11 14:58:45 · 686 阅读 · 0 评论 -
python处理带有时区的日期/时间数据
在实际的运算中,可以都转为UTC时间再计算。都表示:东八区 +8,相当于中国标准时区。这里我们使用一个辅助的库。任意时间直接转UTC时间。原创 2024-03-11 13:23:37 · 819 阅读 · 0 评论 -
解决python datetime创建UTC+8时区结果错误为+8:06的问题
修改原来的方法:datetime(2024, 1, 1, tzinfo=timezone("Asia/Shanghai"))为:datetime(2024, 1, 1,tzinfo=timezone("ETC/GMT-8"))原创 2024-03-11 10:21:32 · 900 阅读 · 0 评论 -
python使用unittest进行单元测试
通过一种规范的测试方法,可以帮助我们在修改程序后能够快速的检测一些bug,使用unittest。原创 2024-02-27 13:57:01 · 822 阅读 · 0 评论 -
pandas剔除带时区的数据
【代码】pandas剔除带时区的数据。原创 2024-02-04 12:58:03 · 495 阅读 · 0 评论 -
python使用read_sql与to_sql读写数据库
使用pandas读写数据库的方法(以Mysql为例)如下:读取数据库读取数据库read_sql()在读取的时候容易报错,有几个要点:1. 首先导入,然后以的形式传入第一个参数2. 在第二个参数需要使用。原创 2024-01-24 15:42:29 · 1447 阅读 · 0 评论 -
使用dataframe_image将dataframe表格转为图片
这个库可以将dataframe的表格转换为图片格式,比起数字,图片的格式在手机上会更清晰的看清楚数据及对应行列。原创 2024-01-15 09:17:31 · 1764 阅读 · 0 评论 -
pandas保存style到excel文件中
【代码】pandas保存style到excel文件中。原创 2024-01-04 15:29:04 · 1103 阅读 · 0 评论 -
解决pycharm格式化程序自动删除未使用的import或代码行
使用pycharm的格式化时,不知道点了哪个导致未引用的import被自动删除。原创 2024-01-03 14:13:39 · 2367 阅读 · 0 评论
分享