计算机视觉与优化算法综合解析
1. 优化技术概述
在处理许多计算机视觉和相关领域的问题时,优化技术起着至关重要的作用。对于参数平滑函数的一般优化技术,前人已经进行了深入的研究,如Luenberger(1984)、Bertsekas(1995)和Heath(2002)等都有相关论述。在结构从运动(structure-from-motion)的情境中,Triggs等人(2000)对最小二乘法进行了出色的综述和讨论。当数据点的坐标被建模为服从正态分布的随机变量时,最小二乘法的输出可以用最大似然的术语进行统计解释,这一解释在相关研究中具有重要意义。
在选择排序时,如果不考虑特定的场景,可能需要先验地考虑指数级数量的排序,这在计算上通常是难以处理的。而且,无论使用何种优化方法,选择特定的排序都可能导致次优解。例如在alpha扩张(alpha expansion)的情况下,每次迭代时α值的顺序可以随机选择。
2. 稀疏编码与字典学习
稀疏编码和字典学习是计算机视觉中的重要技术。相关的介绍主要基于Mairal等人(2010,2011)的工作。不同类型的小波已被用作自然图像的字典(Mallat 1999)。凸基追踪(convex basis pursuit)和Lasso问题在(Chen等人1999;Tibshirani 1996)中被定义。近年来,许多解决这类问题的方法基于带软阈值的坐标下降法(Fu 1998;Friedman,Hastie,Hölfling,& Tibshirani 2001;Wu & Lange 2008)。当字典的列高度相关时,Efron等人(2004)的LARS算法提供了一种有效的替代方法,这种情况在图像处理和计算机视觉应用中的学习
超级会员免费看
订阅专栏 解锁全文
11万+

被折叠的 条评论
为什么被折叠?



