模式识别误差估计相关研究综述
在模式识别领域,误差估计是一个至关重要的环节,它对于评估分类器的性能、选择合适的特征以及指导模型的优化都具有关键作用。以下将对相关的研究成果进行详细介绍。
1. 支持向量机与误差估计
支持向量机在模式识别中应用广泛,Afra和Braga - Neto(2011)研究了支持向量机的峰值现象和误差估计。他们在IEEE国际基因组信号处理与统计研讨会上发表的成果,为支持向量机在实际应用中的误差评估提供了重要参考。
2. 基于RNA表达的表型预测
Afsari等人(2014)提出了用于从RNA表达预测表型的秩判别方法。该研究发表在《应用统计年鉴》上,为生物信息学领域的表型预测提供了新的思路。
3. 列联表的精确推断
Agresti(1992)对列联表的精确推断进行了全面调查,其成果发表在《统计科学》上。此外,他在2002年出版的《分类数据分析(第二版)》,成为了该领域的经典著作。
4. 基因提取的选择偏差
Ambroise和McLachlan(2002)指出了基于微阵列基因表达数据进行基因提取时存在的选择偏差问题。他们的研究成果发表在美国国家科学院院刊上,引起了学术界对基因提取过程中偏差问题的关注。
5. 多元分析分类
Anderson在多元分析分类领域做出了诸多贡献。他在1951年研究了通过多元分析进行分类的方法,1973年对学生化分类统计量W的分布进行了渐近展开,1984年出版了《多元统计分析导论(第二版)》。
6. 线性模型与多元分析理论
Arnold(1981)的《线性模型与多元分析理论》为相关领域的研究提供了坚实的理论基础。
7. 模型选择与误差估计
Bartlett等人(2002)研究了模型选择和误差估计问题,他们的成果发表在《机器学习》杂志上。
8. 神经网络模式识别
Bishop(1995)的《用于模式识别的神经网络》为神经网络在模式识别中的应用提供了系统的指导。
9. 生物信息学研究的过度乐观问题
Boulesteix(2010)指出了生物信息学研究中存在的过度乐观问题,提醒研究者在进行相关研究时要保持谨慎。
10. 分类统计量的表示与分布
Bowker在1961年研究了Hotelling的t2和Anderson的分类统计量w的简单统计表示,以及w - 分类统计量分布函数的渐近展开。
11. 小样本微阵列分类的误区
Braga - Neto(2007)批判了以小样本微阵列分类名义存在的一些流行趋势和谬误,为该领域的研究提供了理性的思考。
12. 强化误差估计
Braga - Neto和Dougherty在误差估计方面进行了一系列研究。他们在2004年研究了强化误差估计,探讨了交叉验证在微阵列分类中的有效性,2005年研究了离散分类器误差估计器的精确性能,2010年研究了离散分类中实际误差和估计误差的精确相关性,2014年研究了单独采样下交叉验证的强偏差及纠正方法。
13. 二项随机变量和的分布
Butler和Stephens(1993)研究了二项随机变量和的分布,其技术报告可在相关网站获取。
14. 离散预测中cod估计器的精确性能
Chen和Braga - Neto(2010)研究了离散预测中cod估计器的精确性能,为离散预测领域的误差估计提供了新的视角。
15. 自助法
Chernick(1999)的《自助法:实践者指南》为自助法在实际应用中的使用提供了详细的指导。
16. 概率论课程
Chung(1974)的《概率论课程(第二版)》是概率论领域的经典教材。
17. 多元定性数据的分类问题
Cochran和Hopkins(1961)研究了多元定性数据的一些分类问题,为相关领域的研究提供了参考。
18. 模式识别学习
Cover在模式识别学习领域做出了重要贡献。他在1969年研究了模式识别中的学习问题,1967年提出了最近邻模式分类方法,1977年研究了测量选择问题中可能的排序。
19. 统计学的数学方法
Cramér(1946)的《统计学的数学方法》为统计学的理论研究提供了重要的数学工具。
20. 贝叶斯MMSE误差估计器的应用
Dalton和Dougherty在贝叶斯MMSE误差估计器方面进行了深入研究。他们在2011年研究了该估计器在基因表达微阵列数据分类误差中的应用,以及离散分类和高斯模型线性分类中的贝叶斯最小均方误差估计。2012年研究了该估计器在精确样本条件下的MSE性能,2013年研究了贝叶斯框架下具有最小期望误差的最优分类器。
以下是部分研究成果的简单列表:
|作者|年份|研究内容|发表刊物/会议|
| ---- | ---- | ---- | ---- |
|Afra和Braga - Neto|2011|支持向量机的峰值现象和误差估计|IEEE国际基因组信号处理与统计研讨会|
|Afsari等|2014|基于RNA表达的表型预测秩判别方法|《应用统计年鉴》|
|Agresti|1992|列联表的精确推断调查|《统计科学》|
|Agresti|2002|《分类数据分析(第二版)》| - |
|Ambroise和McLachlan|2002|基因提取的选择偏差|美国国家科学院院刊|
下面是一个简单的mermaid流程图,展示误差估计在模式识别中的基本流程:
graph TD;
A[数据收集] --> B[特征选择];
B --> C[模型选择];
C --> D[误差估计];
D --> E[模型评估与优化];
E --> F[应用];
以上内容涵盖了模式识别误差估计相关的多个方面研究成果。这些研究从不同角度为模式识别领域的误差估计提供了理论支持和实践方法,对于推动该领域的发展具有重要意义。后续还将继续介绍更多相关的研究成果。
模式识别误差估计相关研究综述(续)
21. 判别分析统计量的表示与渐近展开
Deev在1970年和1972年分别研究了判别分析统计量的表示以及统计量w、m和w⋆在判别分析中的渐近展开,不过其研究成果以俄语发表。
22. 最优统计决策
DeGroot(1970)的《最优统计决策》为统计决策领域提供了重要的理论指导。
23. 模式识别的概率理论
Devroye、Gyorfi和Lugosi(1996)的《模式识别的概率理论》从概率的角度深入探讨了模式识别问题。
24. 势函数规则的分布无关性能界限
Devroye和Wagner(1979)研究了势函数规则的分布无关性能界限,为相关规则的性能评估提供了依据。
25. 贝叶斯估计的一致性
Diaconis和Freedman(1986)研究了贝叶斯估计的一致性问题,为贝叶斯方法在统计中的应用提供了理论支持。
26. 生物标志物发现的谨慎性
Dougherty(2012)强调了生物标志物发现中谨慎、风险和可重复性的重要性。
27. 细胞的认识论
Dougherty和Bittner(2011)从系统的角度探讨了细胞的认识论,为生物学知识的理解提供了新的视角。
28. 特征选择方法的性能
Dougherty、Hua和Sima(2009)研究了特征选择方法的性能,为特征选择在实际应用中的选择提供了参考。
29. 模式分类
Duda和Hart(2001)的《模式分类(第二版)》是模式分类领域的经典著作。
30. 肿瘤分类的判别方法比较
Dudoit、Fridlyand和Speed(2002)比较了使用基因表达数据进行肿瘤分类的判别方法。
31. 自助法与刀切法
Efron在1979年提出了自助法,将其视为对刀切法的另一种审视,1983年研究了改进交叉验证的预测规则误差率估计方法,1997年与Tibshirani一起提出了.632 + 自助法。
32. 单独采样对分类准确性的影响
Esfahani和Dougherty在2014年研究了单独采样对分类准确性的影响,以及在构建最优贝叶斯分类先验时纳入生物通路知识的方法。
33. 统计分布
Evans、Hastings和Peacock(2000)的《统计分布(第三版)》是统计分布领域的重要参考书籍。
34. 神经网络分类器的强通用一致性
Farago和Lugosi(1993)研究了神经网络分类器的强通用一致性。
35. 概率论及其应用导论
Feller(1968)的《概率论及其应用导论(第一卷)》是概率论领域的经典教材。
36. 光与物质的奇异理论
Feynman(1985)的《QED:光与物质的奇异理论》从物理学的角度为相关研究提供了独特的视角。
37. 相关系数的频率分布
Fisher在1915年、1921年、1928年和1936年分别研究了相关系数在样本中的频率分布、小样本相关系数的“可能误差”、多重相关系数的一般抽样分布以及多变量测量在分类学问题中的应用。
38. 样本和特征大小的考虑
Foley(1972)研究了样本和特征大小的相关问题。
39. 离散情况下贝叶斯估计的渐近行为
Freedman(1963)研究了离散情况下贝叶斯估计的渐近行为。
40. 线性判别函数的渐近近似误差界限
Fujikoshi(2000)研究了线性判别函数在样本大小和维度较大时的渐近近似误差界限。
41. 贝叶斯数据分析
Gelman、Carlin、Stern和Rubin(2004)的《贝叶斯数据分析(第二版)》为贝叶斯数据分析提供了系统的方法。
42. 癌症研究中的基因表达比较
Geman、d’Avignon、Naiman、Winslow和Zeboulon(2004)研究了癌症研究中用于类别预测的基因表达比较。
43. 多元正态概率的数值计算
Genz在1992年研究了多元正态概率的数值计算,2002年与Bretz一起研究了多元t - 概率的计算方法。
44. 基于样本的分类程序
Glick在1972年、1973年和1978年分别研究了基于密度估计器的样本分类程序、基于样本的多项分类以及正确分类概率的加法估计器。
45. 分类问题的渐近有效解
Gordon和Olshen(1978)研究了分类问题的渐近有效解。
46. 高维环境下真实和估计分类器误差的去相关
Hanczar、Hua和Dougherty(2007)研究了高维环境下真实和估计分类器误差的去相关问题。
47. 误差率估计的最新进展
Hand(1986)介绍了误差率估计的最新进展。
48. Wald分类统计量的分布
Harter(1951)研究了Wald分类统计量的分布。
49. 基于统计力学的严格学习曲线
Haussler、Kearns和Tishby(1994)从统计力学的角度研究了严格学习曲线。
50. 分配规则及其误差率
Hills(1966)研究了分配规则及其误差率。
51. 精确逻辑回归的分布计算
Hirji、Mehta和Patel(1987)研究了精确逻辑回归的分布计算。
52. 多组线性判别分析的误差率估计
Hirst(1996)研究了多组线性判别分析的误差率估计。
53. 高维数据分类中特征选择方法的性能
Hua、Tembe和Dougherty(2009)研究了高维数据分类中特征选择方法的性能。
54. 二次判别分析的最优特征数量
Hua、Xiong、Lowey、Suh和Dougherty(2005)研究了二次判别分析中最优特征数量与样本大小的关系。
55. 统计模式识别器的平均准确率
Hughes(1968)研究了统计模式识别器的平均准确率。
56. 正态变量二次型分布的计算
Imhof(1961)研究了正态变量二次型分布的计算。
57. 模式识别中的维度和样本大小考虑
Jain和Chandrasekaran(1982)研究了模式识别中维度和样本大小的考虑因素。
58. 多元高斯数据分类的最优特征数量
Jain和Waller(1978)研究了多元高斯数据分类的最优特征数量。
59. 特征选择的评估、应用和小样本性能
Jain和Zongker(1997)研究了特征选择的评估、应用和小样本性能。
60. 高维空间中的朴素贝叶斯强化误差估计
Jiang和Braga - Neto(2014)研究了高维空间中的朴素贝叶斯强化误差估计。
以下是另一部分研究成果的简单列表:
|作者|年份|研究内容|发表刊物/会议|
| ---- | ---- | ---- | ---- |
|Deev|1970|判别分析统计量的表示| - |
|Deev|1972|判别分析中统计量的渐近展开| - |
|DeGroot|1970|《最优统计决策》| - |
|Devroye、Gyorfi和Lugosi|1996|《模式识别的概率理论》| - |
|Devroye和Wagner|1979|势函数规则的分布无关性能界限|IEEE Transactions on Information Theory|
下面是一个mermaid流程图,展示特征选择在模式识别误差估计中的作用流程:
graph TD;
A[原始数据] --> B[特征提取];
B --> C[特征选择];
C --> D[误差估计模型构建];
D --> E[误差估计];
E --> F[模型评估];
F --> G{是否满足要求};
G -- 是 --> H[应用];
G -- 否 --> C;
综上所述,模式识别误差估计领域的研究成果丰富多样,涉及多个学科和方法。这些研究成果为模式识别系统的设计、评估和优化提供了坚实的理论基础和实践指导。在实际应用中,研究者可以根据具体问题选择合适的方法和模型,以提高模式识别的准确性和可靠性。
超级会员免费看

被折叠的 条评论
为什么被折叠?



