一、公式
二、理解
1、先对矩阵按行求向量2范数,得到一个向量,再对该向量求1范数。外层的1范数强制部分行2范数为0,也就意味着该行所有值都为0。
2、由此可以看出l21范数实则为矩阵每一行的l2范数之和,综上可以这样解释,不同于l1范数(矩阵元素绝对值之和)的稀疏要求,l21范数要求行稀疏。
三、总结
1、正则化项的作用:使每一行的l2范数尽可能小,行内出现尽可能多的0元素,尽可能稀疏,也称为行稀疏。【看的论文里有提到L21范数是列稀疏,有点疑惑,有知道的大佬可以指点迷津】
2、行稀疏、列稀疏统称结构化稀疏。