自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

转载 当决策树遇上脏数据:连续值与缺失值的解决方案

决策树是一种基于特征分裂的模型,其核心思想是将数据划分为不同的区域。然而,连续值特征无法直接用于离散分裂点的划分。例如,对于一个年龄特征,我们不能简单地将其划分为“年龄”和“非年龄”,而是需要将其转化为“离散区间”,如“≤30岁”和“>30岁”。这就是对连续值的处理。数据中的缺失值可能导致数据稀疏性、信息损失甚至模型偏差。因此,在决策树中,如何处理缺失值是一个关键问题。决策树在处理连续值和缺失值时的核心思想是灵活性与鲁棒性。

2025-05-21 13:12:49 62

转载 MCP (Model Context Protocol)初体验:企业数据与大模型融合初探

从记录可以看到,大模型非常聪明的根据已有的工具,做了系统性的探索,首先执行初步查询,发现查询名称可能不准确,使用list_tables命令查看可用表,识别可能包含"customer"信息的表,检查其他可能包含客户信息的表,并最终发现"CrmDemo"数据库中的"Customers"表,并识别CustomerType可能用于识别VIP客户。模型的知识通常止于训练数据的截止日期,对于企业内部的数据库、文档仓库等信息孤岛则完全不了解​,即使模型具备一定的上下文窗口,也无法直接访问动态更新的业务数据。

2025-05-11 15:12:57 100

转载 为了管理日常,我写了个 TODO LIST 微信小程序

前言在日常的生活中,之前笔者是使用 notion 来记录事情,或者是使用苹果自带的备忘录来记录。但是,这两个工具,自己都不常用。而微信,是日常使用占比最长的应用,就比如下图来自 2024-06-29 20:46 分的截图:那么,我直接在微信上使用一个计事的工具不就很方便了。问题又来了,可是我不希望别人保存我的数据,并且我需...

2024-07-09 04:14:22 398

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除