
聚类
文章平均质量分 91
Daisy_JuJuJu
一个努力发paper的左家陇职业技术学院的在读GISer博士生!!!
展开
-
聚类系列 (二)——HDBSCAN算法详解
最详细最全最易懂的HDBSCAN算法详解,从DBCSN到OPTICS再到HDBSCAN。DBSCAN、OPTICS 和 HDBSCAN 都是基于密度的聚类算法,它们在处理复杂数据分布、发现任意形状簇和识别噪声点方面表现良好。DBSCAN 是密度聚类的基础算法,OPTICS 改进了其对不同密度簇的适应性,而 HDBSCAN 进一步结合了层次聚类的思想,并提供了自动化的簇提取方法,适用于更广泛的场景。原创 2025-01-05 21:39:34 · 2475 阅读 · 0 评论 -
聚类系列(一)——什么是聚类?
目前, 机器学习/深度学习研究的热火朝天,归根到底可以将其分为两大类: 有监督学习和无监督学习(当然也有半监督学习,弱监督学习等等)。有监督学习和无监督学习的区别就是是否样本可以去训练和学习。当有足够的训练样本,有大量强大模型可以用于服务于不同的任务,比如用于手写数字识别的CNN及其变体、用于空气质量预测的LSTM及其变体。但如果没有样本标签呢?对于分类任务来说, 如何对样本进行分类?如何将样本划分为不同相似的子集?这就是聚类问题!原创 2023-11-21 21:15:29 · 875 阅读 · 0 评论 -
空间扫描统计详解——从空间扫描统计到时空扫描统计
空间扫描统计由学者Kulldorff在1997年提出,是一种利用概率分布模型检测空间数据中是否存在显著聚集或者异常的统计方法,其通过在空间中滑动或“扫描”一个窗口,检查窗口内和窗口外的事件数量(通常计算窗口内外的扫描统计量),是否存在显著差异,以识别可能的空间集群,常用于地理疾病聚集检测、聚类检测和评价。例如,考虑一个地理空间内的疾病发病情况。通过空间扫描统计,可以检测是否存在显著的空间聚类,即疾病在某个地理区域内的发病率明显高于其他地方。顾名思义,空间扫描统计涉及三个核心内容:“窗口”、“扫描、“统计”。原创 2023-12-02 20:01:15 · 3314 阅读 · 3 评论