如何减小神经网络的“黑匣子”属性?

一、什么是“黑匣子”

        在学习人工智能知识的过程中,我们经常会听到有人说,神经网络就是个“黑盒”或者“黑匣子”,这是什么意思呢?实际上,神经网络的“黑匣子”属性(Black Box Property)是指神经网络作为一个整体系统在处理输入和输出时的不透明性。简单来说,就是我们并不知道给定输入之后,神经网络的输出为什么是abc而不是cba,这与决策树之类的白盒模型形成了鲜明的对比(在白盒模型中,我们能够非常准确地解释模型每一步决策的决定因素)。换句话来说,就是神经网络有着较差的可解释性,这个属性主要体现在以下几个方面:

  • 网络复杂性: 神经网络,尤其是如今的大模型,包含大量的层和参数(上亿量级的参数已经是家常便饭了),这使得我们很难弄清楚每个神经元和层是如何贡献于最终的输出的。

  • 数据驱动: 神经网络的训练过程高度依赖于数据,网络的行为和输出主要由训练数据决定(给什么学什么),而不是由明确的规则或逻辑决定。

  • 模型内部的不可见性: 在神经网络中,输入数据如何通过网络的层被转换为输出的过程是不可见的,我们无法直接观察到网络内部的状态。即便我们能够打印出每一层的参数、数据值,我们也无法解释清楚每个数值的取值原因。

        当然,实践证明这种“黑匣子”属性也使得神经网络变得比白盒模型要更为强大。毕竟很多非线性的、隐含的数据规律,单纯通过定义规则是很难发现的,而激活函数的非线性以及反向传播机制等却使得神经网络能够自主学习数据规律,即便在面对未见过的数据时也能做出合理的预测。

二、如何提高神经网络的可解释性

        这里,我们介绍近些年来有些名堂的一个概念——物理信息神经网络(Physics-Informed Neural Network,PINN)。PINN在与物理规律相关的深度学习建模任务中发挥了重要作用,是提高神经网络可解释性、提高模型性能的一种有效手段。

        PINN通过将物理定律(一般是偏微分方程的形式)嵌入到神经网络的损失函数中,指导神经网络的学习过程朝着与底层物理原理更一致的解决方案发展。这么做的好处是,即便训练的数据量很少,或者数据质量不高,由于有物理规律的制约,神经网络的预测结果也能够符合特定规律,从而减少了输出的随机性和不合理性,提高了整个模型结构以及输出结果的可解释程度。这里,推荐阅读《Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations》这篇论文,文章非常详细地介绍了如何构建一个PINN,且提出了正问题、反问题两种策略:正问题是基于已有的物理规律来控制神经网络的训练过程;而反问题则是基于目前的数据规律推导出潜在的物理关系。此外,作者也很慷慨地给出了可复现的论文源码(Github)。

        关于PINN的论文中,物理公式的推导或许很令人头疼,至少对于上一次学物理还是在高中的笔者来说是这样的,而当我们扒开源码来看就很清晰了。例如,作者在论文中用薛定谔方程式作为其中的一个例子。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值