python
文章平均质量分 89
可持续编码
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据分布的秘密:从正态分布到偏度和峰度的全面解析
正态分布(Normal Distribution),又称高斯分布,是统计学中最重要、最常见的连续概率分布。它的形状像一个对称的钟形曲线,因此常被称为"钟形曲线"。成年人的身高分布学生考试成绩(理想情况下)测量误差自然界中许多现象的分布偏度是衡量数据分布不对称性的统计量。简单来说,它告诉我们数据分布是向左偏还是向右偏。三种偏度情况:对称分布(偏度≈0):数据左右对称,如正态分布正偏/右偏(偏度>0):右侧尾巴较长,均值>中位数>众数负偏/左偏(偏度<0):左侧尾巴较长,均值<中位数<众数。原创 2025-12-26 09:11:21 · 945 阅读 · 0 评论 -
拒绝被“平均”忽悠:用 Python & Pandas 玩转“标准差”,看透数据的“稳不稳”
标准差就是数据分布的“量角尺”。想看数据准不准,看平均值。想看数据稳不稳,看标准差。在 Pandas 中,一个.std()就能让你从只会看热闹的“小白”,变成能洞察数据波动本质的“专家”。下次汇报工作时,试着在平均值后面加上标准差,你的老板一定会对你刮目相看!欢迎关注我的博客,带你用 Python 玩转数据,让复杂变得简单!原创 2025-12-25 10:21:26 · 945 阅读 · 0 评论 -
时间机器大法:用两年前的利率预测今天!利率滞后特征全揭秘
滞后特征(Lag Feature)就是把历史数据"平移"到未来,让机器学习模型能看到过去的模式。用大白话说:就像开车看后视镜,你不能只看前面,也要看后面发生了什么!经过20年的实践,我总结了滞后特征的四大黄金法则滞后阶数要合理:太少则信息不足,太多则引入噪声业务理解是关键:不同业务合适的滞后阶数不同股票价格:可能需要滞后1-5天利率变化:可能需要滞后1-12个月销售额:可能需要季节性滞后(12个月)避免数据泄漏:永远记住,模型只能使用历史信息组合使用更强大。原创 2025-12-24 14:51:57 · 772 阅读 · 0 评论 -
fillna(method=‘ffill‘, inplace=True) 前向填充
前向填充()就像是一个时间胶囊,把过去的信息带到未来。对于利率这类时间序列数据,它是最简单、最直观的缺失值处理方法。记住这个小口诀:时间序列有缺失,前向填充是首选。昨日数据今日用,趋势连续不会变。短期缺失效果好,长期缺失需谨慎。结合业务多思考,数据清洗不犯难。希望这篇文章能帮到你!如果你有任何问题,欢迎在评论区留言。我是老王,我们下次再见!免责声明:本文中的利率数据仅为示例,不构成投资建议。在实际金融分析中,请遵循行业规范和监管要求。原创 2025-12-24 14:41:59 · 574 阅读 · 0 评论 -
Python包导入终极指南:子文件如何成功调用父目录模块
想象一下Python解释器是个寻宝猎人,当你在代码中写下时,猎人就会按照一张"藏宝图"去搜寻这个模块。这张藏宝图就是sys.path。import sysprint("Python模块搜索路径:")print(f" -import sys print("Python模块搜索路径:") for path in sys . path : print(f" - {path } ")原创 2025-12-23 15:41:23 · 754 阅读 · 0 评论
分享