予期一束花.-优快云博客

原创数据驱动的基石：从质量清洗到特征工程的实战指南（进阶版）

data quality 与特征工程，核心不是掌握多少工具，而是建立“业务理解→技术落地→效果复盘业务为核：所有数据处理动作都要回归业务目标（如复购预测的核心是“用户与商品的匹配度”），脱离业务的技术是空中楼阁。自动化为翼：手动处理无法应对动态数据，搭建监控与自动化流程，才能解放人力聚焦核心特征创新。复盘为镜：每次建模后复盘“哪些特征有效、哪些质量问题影响最大”，将经验沉淀为规则，形成持续优化的闭环。数据科学的竞争，本质是数据处理精度的竞争。

2025-11-18 15:01:59 978

原创从代码到浏览器：Linux 下 Flask 应用部署与调试全流程（附跨网络访问实战）

在 Linux 世界里，“文件管理” 是所有操作的基石 —— 小到查看日志，大到部署项目，都绕不开对文件和目录的操作。但对新手而言，要么因命令记不住频频卡壳，要么因参数用错上演 “删库” 惊魂。本文不堆砌枯燥语法，而是用 “场景化 + 避坑指南” 的方式，带你吃透find（精准搜索）、cp（安全复制）、mv（灵活移动 / 重命名）这 3 个文件管理核心命令，每个操作都附 “新手验证步骤”，确保你学完就能落地，告别 “一看就会，一用就废”。

2025-11-02 16:32:28 469

原创 Python 数据分析实战：从 Excel 处理到数据合并清洗

how='right' ：使用右连接方式，即以 data2 （经 set_index 后的）数据为基础，保留 data2 所有的 KEY 对应行， data1 中匹配上的行与之合并，匹配不上的位置用 NaN 填充。从输出结果能看到， data1 中原本存在 NaN 的列（如 D 、 E 列部分行），被 data2 中对应的值填充了，使得数据更加完整，但 data1 中原本的有效数据（如 A 、 B 、 C 、 KEY 列）依然保留。我们给它起别名 pd ，后续调用更方便。

2025-06-30 10:24:41 1080

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 数据驱动的基石：从质量清洗到特征工程的实战指南（进阶版）

原创 从代码到浏览器：Linux 下 Flask 应用部署与调试全流程（附跨网络访问实战）

原创 Python 数据分析实战：从 Excel 处理到数据合并清洗

空空如也

空空如也

原创数据驱动的基石：从质量清洗到特征工程的实战指南（进阶版）

原创从代码到浏览器：Linux 下 Flask 应用部署与调试全流程（附跨网络访问实战）