自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 数据驱动的基石:从质量清洗到特征工程的实战指南(进阶版)

data quality 与特征工程,核心不是掌握多少工具,而是建立“业务理解→技术落地→效果复盘业务为核:所有数据处理动作都要回归业务目标(如复购预测的核心是“用户与商品的匹配度”),脱离业务的技术是空中楼阁。自动化为翼:手动处理无法应对动态数据,搭建监控与自动化流程,才能解放人力聚焦核心特征创新。复盘为镜:每次建模后复盘“哪些特征有效、哪些质量问题影响最大”,将经验沉淀为规则,形成持续优化的闭环。数据科学的竞争,本质是数据处理精度的竞争。

2025-11-18 15:01:59 978

原创 从代码到浏览器:Linux 下 Flask 应用部署与调试全流程(附跨网络访问实战)

在 Linux 世界里,“文件管理” 是所有操作的基石 —— 小到查看日志,大到部署项目,都绕不开对文件和目录的操作。但对新手而言,要么因命令记不住频频卡壳,要么因参数用错上演 “删库” 惊魂。本文不堆砌枯燥语法,而是用 “场景化 + 避坑指南” 的方式,带你吃透find(精准搜索)、cp(安全复制)、mv(灵活移动 / 重命名)这 3 个文件管理核心命令,每个操作都附 “新手验证步骤”,确保你学完就能落地,告别 “一看就会,一用就废”。

2025-11-02 16:32:28 469

原创 Python 数据分析实战:从 Excel 处理到数据合并清洗

how='right' :使用右连接方式,即以 data2 (经 set_index 后的 )数据为基础,保留 data2 所有的 KEY 对应行, data1 中匹配上的行与之合并,匹配不上的位置用 NaN 填充。从输出结果能看到, data1 中原本存在 NaN 的列(如 D 、 E 列部分行),被 data2 中对应的值填充了,使得数据更加完整,但 data1 中原本的有效数据(如 A 、 B 、 C 、 KEY 列)依然保留。我们给它起别名 pd ,后续调用更方便。

2025-06-30 10:24:41 1080

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除