神经网络的概率设计:理论与实践
1. 引言
在当今的信息处理系统中,人工神经网络发挥着至关重要的作用,广泛应用于模式识别、时间序列预测、机器人控制等领域。然而,工程师们在实际应用中常常面临一些困惑。例如,神经网络的输出究竟代表什么含义?它能否对未知输入做出响应?其答案的可靠性如何?以及它是否具备解释所学概念的能力?
早期,由于神经网络的非线性和复杂性,这些问题似乎难以找到答案,甚至有人认为神经网络的设计是一门艺术。但随着研究的深入,神经网络学习的统计结构逐渐明晰,使得我们能够对这些问题进行解答,并将神经网络的设计纳入工程范畴。
2. 神经网络的统一概率框架
2.1 定义
为了建立神经网络设计方法的理论基础,我们构建了一个统一的概率框架。假设输入空间为 $X$,输出空间为 $Y$,输入 - 输出对的真实概率密度函数为 $q(x, y)$,它代表了输入和输出之间的真实关系,但通常是复杂且未知的。
输入空间的概率密度为:
$\rho(x) = \int q(x, y)dy$
给定输入 $x$ 时,输出空间的概率密度为:
$\rho(y|x) = \frac{q(x, y)}{\rho(x)}$
为了估计 $q(x, y)$,我们采用参数化的概率密度函数 $p(x, y; w)$,其中 $w$ 是待优化的参数。以下是两个具体的例子:
- 函数逼近神经网络 :当输入空间和输出空间的直积为 $R^M \times R^N$ 时,函数逼近神经网络定义为 $p(x, y; w, \sigma) = q(x)g_N(y; \
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



