- 博客(3)
- 收藏
- 关注
转载 当决策树遇上脏数据:连续值与缺失值的解决方案
决策树是一种基于特征分裂的模型,其核心思想是将数据划分为不同的区域。然而,连续值特征无法直接用于离散分裂点的划分。例如,对于一个年龄特征,我们不能简单地将其划分为“年龄”和“非年龄”,而是需要将其转化为“离散区间”,如“≤30岁”和“>30岁”。这就是对连续值的处理。数据中的缺失值可能导致数据稀疏性、信息损失甚至模型偏差。因此,在决策树中,如何处理缺失值是一个关键问题。决策树在处理连续值和缺失值时的核心思想是灵活性与鲁棒性。
2025-05-21 13:12:49
62
转载 MCP (Model Context Protocol)初体验:企业数据与大模型融合初探
从记录可以看到,大模型非常聪明的根据已有的工具,做了系统性的探索,首先执行初步查询,发现查询名称可能不准确,使用list_tables命令查看可用表,识别可能包含"customer"信息的表,检查其他可能包含客户信息的表,并最终发现"CrmDemo"数据库中的"Customers"表,并识别CustomerType可能用于识别VIP客户。模型的知识通常止于训练数据的截止日期,对于企业内部的数据库、文档仓库等信息孤岛则完全不了解,即使模型具备一定的上下文窗口,也无法直接访问动态更新的业务数据。
2025-05-11 15:12:57
100
转载 为了管理日常,我写了个 TODO LIST 微信小程序
前言在日常的生活中,之前笔者是使用 notion 来记录事情,或者是使用苹果自带的备忘录来记录。但是,这两个工具,自己都不常用。而微信,是日常使用占比最长的应用,就比如下图来自 2024-06-29 20:46 分的截图:那么,我直接在微信上使用一个计事的工具不就很方便了。问题又来了,可是我不希望别人保存我的数据,并且我需...
2024-07-09 04:14:22
398
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅