论文笔记:Lifelong Spectral Clustering
论文信息
题目:Lifelong Spectral Clustering ,终身谱聚类
作者:Gan Sun, Yang Cong, Qianqian Wang, Jun Li, Yun Fu
论文链接:https://arxiv.org/abs/1911.11908v1
个人总结
本论文基于两篇论文,对谱聚类的目标函数拆分成矩阵相乘相加的形式,然后这些矩阵分为3类,第一类是任务样本直接相关的矩阵,第二类是多个任务共享的矩阵,第三个是其他。这篇论文中的第二类矩阵有两个,灵感来自两篇论文。
终身学习体现在,多个任务共享的矩阵要保存下来,每一个新的任务加入时,可以加快聚类速度,然后更新共享的矩阵;多个任务的整体目标函数为多个任务目标函数的平均值,一个任务的目标函数为F的话,多个就为 1 m ∑ F \frac{1}{m}\sum F m1∑F。
谱聚类
刚开始被“拉普拉斯矩阵”吓到了,看上去很高级的样子,其实计算方式很简单。只推荐两个博客:
- 原理和Python手写代码:谱聚类(Spectral Clustering)原理及Python实现
- Python调库:用scikit-learn学习谱聚类
我个人对这两篇博客的笔记在:github链接 的“谱聚类”部分
论文做了什么(Abstract)
在本文中,旨在探讨终身机器学习框架中的谱聚类问题,即终身谱聚类( L 2 S C L^2SC L2SC,Lifelong Spectral Clustering)。它的目标是通过有选择地从知识库中转移以前积累的经验,为新的谱聚类任务有效地学习一个模型。
具体来说, L 2 S C L^2SC L2SC的知识库包含两个组件:1)正交基础库:在每对任务中的集群中捕获潜在的聚类中心; 2)特征嵌入库:嵌入在多个相关任务之间共享的特征流形信息。
随着新的谱聚类任务的到来, L 2 S C L^2SC L2SC首先从基础库和特征库两者中转移知识以获得编码矩阵,然后随着时间的推移重新定义库的基础,以最大程度地提高所有聚类任务的性能。同时,推导了通用的更新公式来交替更新基础库和特征库。
公式解读
The Proposed L2SC Model 提出模型
- 公式(1):L是拉普拉斯矩阵(度矩阵-权重矩阵),D是用来归一化的,得到