brandy
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
29、机器学习中的符号、缩写与相关研究
本博客介绍了机器学习和统计学领域中常见的符号与缩写,涵盖了输入变量、概率密度函数、估计器、核函数等核心概念。同时,讨论了密度比估计、核方法和交叉验证等关键技术,并分析了其在不同场景中的应用。此外,博客还总结了相关研究的发展趋势,以及如何通过优化算法提升模型性能。原创 2025-09-13 00:50:27 · 41 阅读 · 0 评论 -
28、密度比估计的数值稳定性与计算效率研究
本文研究了密度比估计方法在数值稳定性和计算效率方面的表现,重点分析了不同方法(如R-KuLSIF、KMM、KuLSIF和KL散度)的Hessian矩阵条件数、迭代次数和计算时间。通过人工数据集和基准数据集实验,验证了R-KuLSIF在收敛速度和鲁棒性方面的优势,并探讨了其在离群点检测等任务中的应用。研究结果为密度比估计方法的实际应用提供了理论支持和实验依据。原创 2025-09-12 15:57:05 · 31 阅读 · 0 评论 -
27、密度比估计中的数值稳定性分析:KuLSIF与KMM的比较
本文深入分析了密度比估计中的两种重要方法——KuLSIF和KMM,从优化准则、损失函数、条件数分析以及KuLSIF的最优性四个方面展开比较。通过理论推导和数值实验,揭示了KuLSIF及其简化形式R-KuLSIF在数值稳定性和收敛速度方面的优势,并进一步探讨了其在ASC散度框架下的推广形式。同时,文章结合条件数的概率评估和平滑分析思想,为实际应用提供了方法选择依据。原创 2025-09-11 12:51:07 · 32 阅读 · 0 评论 -
26、统计检验与非参数数值稳定性分析
本文系统介绍了统计检验方法与非参数估计中的数值稳定性分析。首先,比较了KL检验、MI检验、经验似然比检验、经验似然得分检验和Hotelling T^2检验在不同数据分布下的第一类错误与功效函数表现。其次,深入探讨了非参数密度比估计中的核uLSIF和KMM方法,并通过条件数分析证明uLSIF在数值稳定性和计算效率方面的优势。最后,通过数值实验验证了理论分析的结论,并对未来的研究方向提出了展望。原创 2025-09-10 11:29:33 · 41 阅读 · 0 评论 -
25、ASC 散度估计与两样本检验
本文介绍了ASC散度估计与两样本检验的统计方法。首先,基于密度比模型和共轭函数理论,探讨了ASC散度的估计方法,并讨论了其推广到一般分解形式的情况。随后,从渐近方差的角度出发,分析了ASC散度的最优估计问题,并通过具体例子说明最优估计量的构造方式。最后,文章将ASC散度估计应用于两样本同质性检验,介绍了基于ASC估计量的检验方法,并与其他常见检验方法(如经验似然-得分检验和经验似然-比检验)进行了比较,分析了其在不同假设下的功效表现。研究表明,ASC散度估计在两样本检验中具有良好的统计性质和应用价值。原创 2025-09-09 11:28:52 · 34 阅读 · 0 评论 -
24、非参数与参数密度比估计的收敛分析及双样本检验
本文系统研究了非参数和参数方法在密度比估计与双样本检验中的理论性质与应用。详细分析了KLIEP在Hellinger距离下的收敛性,并探讨了KuLSIF在不同假设条件下的收敛速度,包括基于括号数条件和核谱条件的理论结果。在参数方法部分,介绍了密度比模型、矩匹配估计器及其渐近性质,并基于ASC散度构造了双样本检验统计量。通过数值示例展示了整个流程的具体实现。对比了参数与非参数方法的收敛速度与模型处理能力,为实际应用中方法选择提供了参考依据。原创 2025-09-08 12:14:47 · 37 阅读 · 0 评论 -
23、非参数收敛分析:理论基础与KLIEP算法应用
本文深入探讨了非参数估计中的收敛分析理论基础,并以KLIEP(Kullback-Leibler Importance Estimation Procedure)算法为例详细推导了其在不同条件下的收敛速率。通过引入局部化技术、覆盖数与括号数等工具,结合Bernstein不等式、Hoeffding不等式和Talagrand集中不等式,系统分析了非参数密度比估计的快速学习率。同时,文章在特定假设条件下,推导了KLIEP算法在Hellinger距离下的收敛界,并通过具体示例验证了理论结果的有效性。最后,文章总结了理原创 2025-09-07 12:35:42 · 34 阅读 · 0 评论 -
22、密度比估计方法的参数与非参数收敛性分析
本文系统分析了三种密度比估计方法(最大似然密度估计器的比值法、逻辑回归法和经验非归一化Kullback-Leibler散度法)在参数模型和非参数模型下的收敛性表现。通过理论推导与比较,得出在参数模型正确指定的情况下,方法A表现最优;而在模型错误指定或数据分布复杂时,方法C(经验非归一化KL散度法)更具鲁棒性和一致性。此外,还分析了KLIEP和uLSIF两种非参数方法的收敛速率,并给出了在不同应用场景下的方法选择建议。原创 2025-09-06 14:18:36 · 24 阅读 · 0 评论 -
21、密度比估计的理论分析
本文深入探讨了参数设置下密度比估计的理论分析,重点研究了KLIEP、LSIF和逻辑回归等方法的渐近性质,包括统计一致性和渐近正态性。同时比较了不同密度比估计方法的准确性,分析了在不同模型假设下方法的适用性。通过理论推导与实验验证,为实际应用中选择合适的密度比估计方法提供了重要依据。原创 2025-09-05 11:53:54 · 27 阅读 · 0 评论 -
20、最小二乘概率分类器(LSPC):原理、实现与性能评估
本文介绍了最小二乘概率分类器(LSPC)的基本原理、实现方法和性能评估。LSPC 通过使用高斯核的线性组合建模类后验概率,并采用最小二乘法进行拟合,具有解析求解、类级学习和计算效率高等优点。与核逻辑回归(KLR)相比,LSPC 在计算时间上快两个数量级,且分类准确率相当。文章还探讨了 LSPC 的优化策略、应用场景及与其他分类方法的比较,展示了其在多类分类问题中的强大优势。原创 2025-09-04 09:27:12 · 51 阅读 · 0 评论 -
19、条件密度估计与概率分类方法解析
本文深入探讨了条件密度估计与概率分类的核心方法及其应用。重点介绍了最小二乘条件密度估计(LSCDE)的理论基础与高效计算方式,并通过实验验证其在异方差性、多峰性等复杂数据结构中的优越性能。同时,文章还详细解析了最小二乘概率分类器(LSPC)的设计思想与实现步骤,并通过多组实验展示了其在概率分类任务中的准确性和计算效率。文中对比了多种现有方法,如SVM、逻辑回归、KLR、MDN和KQR,全面评估了LSCDE和LSPC的优势。最后,展望了未来在模型改进、多模态数据处理及实际应用拓展方面的研究方向。原创 2025-09-03 16:05:04 · 83 阅读 · 0 评论 -
18、独立成分分析与条件概率估计:原理、算法与实践
本博客详细探讨了独立成分分析(ICA)与条件概率估计的原理、算法及实践。首先介绍了ICA的基本概念及其多种实现方法,重点分析了最小二乘ICA(LICA)的数学基础与算法实现,并通过实验比较了LICA与其他ICA方法的性能。随后,博客深入探讨了条件概率估计问题,重点介绍了基于密度比的最小二乘条件密度估计(LSCDE)方法,并与其他条件密度估计方法进行了对比实验。整体内容理论与实践结合,适用于对信号处理、概率建模和机器学习感兴趣的读者。原创 2025-09-02 15:18:22 · 47 阅读 · 0 评论 -
17、互信息估计与充分降维方法解析
本文系统解析了互信息估计中的密度比方法以及充分降维的相关理论与应用。重点介绍了基于密度比的互信息估计方法(如 MLMI)相较于传统方法(如 KDE、KNN 和 EDGE)在不同类型数据上的稳定性能优势。同时,详细阐述了充分降维框架,尤其是基于最小二乘密度比估计的 LSDR 方法,并通过实验验证其在处理非线性依赖和复杂分布数据时的良好表现。最后,对各类方法进行了总结对比,并讨论了实际应用中的选择依据及未来研究方向。原创 2025-09-01 12:24:35 · 56 阅读 · 0 评论 -
16、分布比较与互信息估计方法解析
本文系统解析了分布比较和互信息估计的相关方法。在分布比较部分,详细介绍了MMD和LSTT的基本原理,并通过数值实验比较了它们在I型错误和II型错误方面的性能差异。在互信息估计部分,涵盖了核密度估计、直方图方法、最近邻方法、Edgeworth展开方法、MLMI和LSMI等多种估计方法的定义、优缺点及适用场景。此外,还提供了数值实验结果、代码实现示例以及在特征选择、独立成分分析和聚类分析等实际应用场景下的方法选择建议。最后展望了未来的研究方向,包括方法改进、高维数据处理和实际应用拓展。原创 2025-08-31 13:22:38 · 57 阅读 · 0 评论 -
15、分布比较与两样本检验方法解析
本文详细解析了分布比较与两样本检验的相关方法,重点介绍了基于密度比估计的最小二乘两样本检验(LSTT)和最大均值差异(MMD)方法的原理、应用场景及实验性能比较。通过假设检验框架和数值实验,分析了LSTT与MMD在不同数据集上的表现,并提供了在实际应用中选择合适方法的决策依据。原创 2025-08-30 09:59:19 · 30 阅读 · 0 评论 -
14、多任务学习与分布比较:密度比方法在异常检测中的应用
本文探讨了多任务学习的基本概念及其在小样本学习中的应用,并重点介绍了基于密度比估计的异常检测方法。通过比较无约束最小二乘重要性拟合(uLSIF)和Kullback–Leibler重要性估计程序(KLIEP)等技术,分析了其在异常检测中的优势和适用场景。实验结果显示,KLIEP在精度上表现最佳,而uLSIF则在计算效率方面具有明显优势。文章还提供了方法选择建议、异常检测流程总结以及未来研究方向,为基于密度比的异常检测提供了全面的理论和实践指导。原创 2025-08-29 09:54:43 · 32 阅读 · 0 评论 -
13、多任务学习方法解析与实践
本文深入解析了多任务学习的核心思想和关键方法,包括显式样本共享和隐式样本共享两种主要策略。通过理论分析与在UMIST人脸识别数据集及地雷图像分类数据集上的实验验证,展示了多任务学习相较于单任务学习在分类准确率和计算效率上的优势。文章还总结了多任务学习方法的选择流程、操作要点以及未来发展方向。原创 2025-08-28 13:12:39 · 29 阅读 · 0 评论 -
12、协变量偏移适应:原理、方法与应用
本文深入探讨了机器学习中的协变量偏移问题,介绍了其基本原理及应对方法,包括重要性加权经验风险最小化(IWERM)和重要性加权交叉验证(IWCV)。通过数值示例展示了这些方法在回归和分类任务中的有效性,并总结了协变量偏移适应的主要步骤和未来研究方向。原创 2025-08-27 16:39:35 · 41 阅读 · 0 评论 -
11、高维空间中的密度比估计及应用
本文探讨了高维空间中的密度比估计方法及其广泛应用。重点介绍了直接降维密度比估计(D3)方法,包括D3-LFDA/uLSIF和D3-LHSS两种实现方式,并通过数值实验验证其在不同数据集上的性能。此外,还详细阐述了密度比估计在重要性采样、协变量偏移适应、多任务学习、分布比较、互信息估计以及条件概率估计等多个领域的应用,展示了该方法在提升机器学习模型性能和解决实际问题中的重要作用。原创 2025-08-26 12:35:08 · 36 阅读 · 0 评论 -
10、基于散度最大化的直接密度比估计方法
本文介绍了一种基于散度最大化方法的高维密度比估计技术——D3-LHSS。该方法通过重新定义异分布子空间并结合Pearson散度与uLSIF估计器,有效克服了传统D3-LFDA/uLSIF方法的局限性。文章详细阐述了其理论基础、优化策略(如普通梯度、自然梯度、Givens旋转和子空间旋转)以及其在实际应用中的潜力,为处理高维数据提供了更灵活、高效的解决方案。原创 2025-08-25 11:57:14 · 32 阅读 · 0 评论 -
9、降维的直接密度比估计
本文介绍了一种结合局部Fisher判别分析(LFDA)和无约束最小二乘重要性拟合(uLSIF)的降维直接密度比估计方法(D3)。该方法通过识别异分布子空间,在低维空间内进行密度比估计,有效解决了高维数据带来的计算复杂性和估计不稳定性问题。D3利用LFDA的监督降维能力,提取异分布和同分布子空间,并通过uLSIF在低维空间中进行高效密度比估计。该方法在处理高维数据、多模态数据和存在离群点的数据时表现出良好的鲁棒性和高效性,并通过交叉验证实现模型选择,提高了估计的准确性和可靠性。原创 2025-08-24 12:46:49 · 24 阅读 · 0 评论 -
8、密度比拟合:理论、方法与应用
本文系统介绍了密度比拟合的理论基础、方法实现与应用。密度比拟合是一种通过Bregman散度来估计密度比的重要技术,涵盖了多种现有方法如最小二乘重要性拟合(LSIF)、核均值匹配(KMM)、逻辑回归和Kullback–Leibler重要性估计程序(KLIEP)等。文章从散度估计和矩匹配两个视角解释了密度比拟合的理论依据,并引入基于Basu幂散度的方法以提升鲁棒性。通过理论推导和数值实验,展示了该方法在处理离群样本时的优势。最后,文章总结了密度比拟合的优势与局限,并展望了其在机器学习、信号处理和金融等领域的应用原创 2025-08-23 12:50:04 · 50 阅读 · 0 评论 -
7、密度比估计方法:从KLIEP到统一框架
本文系统介绍了密度比估计的相关方法,包括KLIEP、最小二乘重要性拟合(LSIF)及其变体cLSIF和uLSIF,并提出了一个基于Bregman散度的统一框架,将多种现有方法整合在一起。通过数值示例和算法分析,比较了不同方法的优缺点与适用场景,为密度比估计的实际应用提供了全面的指导。原创 2025-08-22 11:22:28 · 43 阅读 · 0 评论 -
6、概率分类与密度拟合在密度比估计中的应用
本文介绍了密度比估计中的两种主要方法:概率分类和密度拟合。概率分类方法通过将密度比估计转化为类后验概率学习问题,避免了直接估计密度,同时利用交叉验证进行模型选择,具有理论和计算优势。密度拟合方法基于 Kullback-Leibler 散度最小化,特别是 KLIEP 方法在不同模型下展现了灵活性和有效性,如线性模型、对数线性模型、高斯混合模型等。文章通过对比不同模型的特点和适用场景,结合实际案例分析,展示了这些方法在数据分析中的应用价值,并对未来研究方向进行了展望。原创 2025-08-21 13:45:51 · 28 阅读 · 0 评论 -
5、密度比估计:矩匹配与概率分类方法
本文系统介绍了密度比估计的两种主要方法:矩匹配方法和概率分类方法。矩匹配方法包括有限阶矩匹配和无限阶矩匹配(KMM),其中有限阶矩匹配计算效率高但收敛性有限,而KMM通过核函数匹配所有阶矩,理论上能收敛到真实密度比。概率分类方法则通过将密度比估计转化为分类问题,包括逻辑回归、最小二乘概率分类器和支持向量机等,具有良好的实际应用效果。文章还对各种方法的优缺点进行了对比,并提供了方法选择建议和未来发展方向。原创 2025-08-20 10:22:08 · 108 阅读 · 0 评论 -
4、密度比估计与矩匹配方法详解
本文详细介绍了密度估计与密度比估计的相关方法,包括参数化方法和非参数化方法的基本原理。重点探讨了核密度估计(KDE)和最近邻密度估计(NNDE)的实现细节,并分析了基于密度估计的密度比方法的局限性。为了解决这些问题,文章引入了矩匹配方法,通过匹配分布的矩来直接估计密度比,避免了中间密度估计带来的误差。同时比较了AIC和BIC等模型选择准则,并通过数值示例展示了不同方法的效果。最后总结了各类方法的优缺点,并展望了未来的研究方向。原创 2025-08-19 15:39:00 · 52 阅读 · 0 评论 -
3、密度比估计:理论、方法与应用
本文深入探讨了密度比估计(Density-Ratio Estimation)的理论基础、方法实现与实际应用。密度比估计旨在通过样本数据估计两个概率密度函数的比值,广泛应用于机器学习和数据挖掘领域。博文详细介绍了多种估计方法,包括单独密度估计、矩匹配、概率分类、密度拟合和密度比拟合,并分析了它们的优缺点及适用场景。同时,针对高维数据带来的挑战,提出了带降维的直接密度比估计框架(D3),并探讨了其理论性质,如参数与非参数收敛性、数值稳定性等。文章还列举了密度比估计在重要性采样、分布比较、互信息估计、条件概率估计原创 2025-08-18 16:28:07 · 114 阅读 · 0 评论 -
2、机器学习中的密度比方法与估计算法
本博文介绍了机器学习中的密度比方法及其估计算法,探讨了密度比框架在非平稳性适应、多任务学习、异常值检测、两样本检验、变化点检测、条件密度估计、概率分类等场景中的应用。文章还详细分析了多种密度比估计算法,包括密度估计、矩匹配、概率分类、密度拟合和密度比拟合,并提出了一个统一的密度比拟合框架以涵盖这些方法。最后,文章总结了在实际应用中选择合适密度比方法的考量因素,并展望了密度比方法在未来机器学习领域的发展潜力。原创 2025-08-17 10:54:48 · 34 阅读 · 0 评论 -
1、机器学习中的密度比估计:原理与应用
本文深入探讨了机器学习的基本分类及其研究主题,并重点介绍了密度比估计这一新兴范式。密度比估计为解决非平稳性适应、多任务学习、异常检测、特征选择、因果推断等复杂问题提供了系统化方法。文章详细阐述了多种密度比估计方法,包括密度估计、矩匹配、概率分类、密度拟合和密度比拟合,并结合理论分析和实际应用展示了其强大潜力。通过统一框架和带降维的直接密度比估计方法,进一步拓宽了其在重要性采样、分布比较、互信息估计和条件概率估计等领域的应用。未来,密度比估计有望在更多前沿领域推动机器学习的发展。原创 2025-08-16 10:07:27 · 39 阅读 · 0 评论
分享