- 博客(3)
- 收藏
- 关注
原创 数据驱动的基石:从质量清洗到特征工程的实战指南(进阶版)
data quality 与特征工程,核心不是掌握多少工具,而是建立“业务理解→技术落地→效果复盘业务为核:所有数据处理动作都要回归业务目标(如复购预测的核心是“用户与商品的匹配度”),脱离业务的技术是空中楼阁。自动化为翼:手动处理无法应对动态数据,搭建监控与自动化流程,才能解放人力聚焦核心特征创新。复盘为镜:每次建模后复盘“哪些特征有效、哪些质量问题影响最大”,将经验沉淀为规则,形成持续优化的闭环。数据科学的竞争,本质是数据处理精度的竞争。
2025-11-18 15:01:59
978
原创 从代码到浏览器:Linux 下 Flask 应用部署与调试全流程(附跨网络访问实战)
在 Linux 世界里,“文件管理” 是所有操作的基石 —— 小到查看日志,大到部署项目,都绕不开对文件和目录的操作。但对新手而言,要么因命令记不住频频卡壳,要么因参数用错上演 “删库” 惊魂。本文不堆砌枯燥语法,而是用 “场景化 + 避坑指南” 的方式,带你吃透find(精准搜索)、cp(安全复制)、mv(灵活移动 / 重命名)这 3 个文件管理核心命令,每个操作都附 “新手验证步骤”,确保你学完就能落地,告别 “一看就会,一用就废”。
2025-11-02 16:32:28
469
原创 Python 数据分析实战:从 Excel 处理到数据合并清洗
how='right' :使用右连接方式,即以 data2 (经 set_index 后的 )数据为基础,保留 data2 所有的 KEY 对应行, data1 中匹配上的行与之合并,匹配不上的位置用 NaN 填充。从输出结果能看到, data1 中原本存在 NaN 的列(如 D 、 E 列部分行),被 data2 中对应的值填充了,使得数据更加完整,但 data1 中原本的有效数据(如 A 、 B 、 C 、 KEY 列)依然保留。我们给它起别名 pd ,后续调用更方便。
2025-06-30 10:24:41
1080
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅