- 博客(2)
- 收藏
- 关注
原创 《数据科学实战》学习记录及思考
核心思想是:它是多维空间中函数的“二阶导数”,描述了函数在每个点处各个方向上的曲率(即弯曲程度)。:对异常值极度敏感:由于误差被平方,任何一个远离群体的异常值都会对MSE产生不成比例的巨大影响,可能使评估结果失真。量纲问题:MSE的单位是原始数据单位的平方(例如“元²”),这使其解释性变差。2、利用了曲率信息:因为使用了二阶导数(海森矩阵),它知道函数的弯曲方向,从而可以做出更智能的更新,绕过“之字形”路径。的核心思想是:一个矩阵所包含的“真正有效信息”的维度,或者说是其“线性无关”的列(或行)的数量。
2025-11-27 15:14:05
666
原创 presto 函数记录
过滤 NULL 值:array_agg(product) FILTER (WHERE product IS NOT NULL) AS non_null_products。array_agg(product ORDER BY quantity DESC) --排序后聚合。大数据量时,确保过滤条件尽量精确。它允许在不影响整体查询结果的情况下,对特定聚合操作应用局部过滤条件。结合使 2.性能优化:当多个聚合函数需要不同过滤条件时,是一个聚合函数,用于将多行数据合并成一个数组;)中根据条件过滤数据,
2025-03-11 15:07:30
326
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅