麦克斯韦方程组 | 从积分形式到微分形式

注:本文为 “麦克斯韦方程组” 相关合辑。
图片清晰度受引文原图所限。
略作重排,如有内容异常,请看原文。


最美的公式:你也能懂的麦克斯韦方程组(积分篇)

原创 长尾君 长尾科技 2019年07月01日 23:36

在 2004 年,英国科学期刊《物理世界》举办了一次评选活动,邀请读者选出科学史上最伟大的公式。评选结果显示,麦克斯韦方程组力压质能方程、欧拉公式、牛顿第二定律、勾股定理、薛定谔方程等著名公式,高居榜首。

麦克斯韦方程组

麦克斯韦方程组以一种近乎完美的方式统一了电和磁,并预言光是一种电磁波。这是物理学家在统一理论之路上取得的重大进步。尽管麦克斯韦方程组广为人知,其形式优美且描述了经典电磁学的全部内容,但真正能够理解该方程组的人却寥寥无几。原因在于,它采用了积分微分的形式,而大多数人直到大学阶段才正式接触微积分。

然而,读者无需对此感到担忧。尽管麦克斯韦方程组的形式较为复杂,但其物理内涵却十分简洁。微积分本身并非难以理解的数学工具,只要跟随本文的思路,理解这一“最伟大”的方程并非难事。

01 电磁统一之路

电与磁之间并无明显的联系,科学家最初也是分别研究电现象和磁现象的。这种情况并不令人意外,毕竟很难想象闪电与磁铁之间会存在某种关联。

1820 年,奥斯特在一次讲座中偶然发现,通电导线能使附近的小磁针发生偏转。这一微小的现象并未引起听众的注意,却让奥斯特兴奋不已。他随即对这一现象进行了为期三个月的深入研究,最终发现了电流的磁效应,即电流能够像磁铁一样对周围的小磁针产生影响。

奥斯特实验

这一发现迅速在物理学界引起了广泛关注,众多物理学家沿着这一方向展开了深入研究。奥斯特指出电流周围会产生磁场,但这一磁场在空间中的分布情况如何呢?例如,一小段电流在空间某处产生的磁感应强度有多大呢?这种研究思路是十分自然的。在定性地发现了某一规律之后,必然需要进一步定量地描述它。只有这样,我们才能不仅知晓其存在,还能精确地计算它,从而真正理解这一现象。

在奥斯特正式发表其发现后的短短三个月内,毕奥萨伐尔拉普拉斯的帮助下,找到了电流在空间中产生磁场大小的定量规律,即著名的毕奥 - 萨伐尔定律。根据该定律,我们可以计算出任意电流在空间中产生的磁场大小,但这种方法在实际应用中较为繁琐。

两个月后,安培发现了一种更为实用且简单的计算电流周围磁场的方法,即安培环路定理。同时,安培还总结出了一个实用的规律,用于判断电流产生磁场的方向,即安培定则(也就是高中所学的右手螺旋定则)。

至此,“电生磁”的问题似乎得到了基本解决。我们知道了电流能够产生磁场,并且能够利用安培环路定理(或更为基础的毕奥 - 萨伐尔定律)计算磁场的大小,同时借助安培定则判断磁场的方向。然而,问题并未完全解决。我们知道,安培环路定理是基于奥斯特发现电流周围磁场的基础上推导出来的,因此它只能处理电流周围磁场的情况。

那么,如果没有电流呢?如果不存在导线形成电流,仅电场发生变化,这种情况能否产生磁场呢?读者可能会觉得这个问题有些牵强,但请思考一下:根据电磁感应定律,变化的磁场能够产生电场。因此,反过来猜想变化的电场是否能够产生磁场是十分自然的。而这,正是安培环路定理所缺失的部分。

于是,麦克斯韦对安培环路定理进行了扩充,将“变化的电场也能产生磁场”这一项添加进去,补齐了这一短板。

至此,电与磁的统一之路基本完成,麦克斯韦方程组的基本形式也逐渐清晰。在此,我们先提出一个问题供读者思考:麦克斯韦方程组描述了经典电磁学的全部内容,且由四个方程组成。如果让你选择四个方程来描述电磁现象的一切,你会选择哪四个方程呢?

请读者思考一分钟。

无论读者如何思考,笔者认为以下思路是十分自然的:如果要用四个方程描述电磁现象的一切,那么第一个方程描述电,第二个方程描述磁,第三个方程描述磁如何生电,第四个方程描述电如何生磁。巧合的是,麦克斯韦方程组正是如此。

因此,我们学习麦克斯韦方程组,就是要理解它如何用四个方程优雅且自洽地描述电、磁、磁生电、电生磁这四种现象。接下来,我们将逐一探讨。

02 库仑的发现

在奥斯特发现电流的磁效应之前,人类已经对电进行了长时间的单独研究。人们发现电荷分为正负两种,同性相斥,异性相吸。后来,库仑发现了电荷之间相互作用的定量关系,即电荷之间的作用力与距离的平方成反比。具体而言,如果将两个电荷之间的距离扩大为原来的两倍,这两个电荷之间的作用力将减少为原来的四分之一;若扩大为三倍,则减少为九分之一。

这一规律与引力的效果相同。引力在距离扩大为原来的两倍时,其大小也会减少为原来的四分之一。大自然为何如此偏爱“平方反比”规律呢?原因在于我们生活在一个各向同性的三维空间中。

为了更深入地理解这一点,我们可以设想一个点源向四周均匀地辐射能量。由于能量是守恒的,因此在任意时刻,能量所到达的位置会形成一个球面。球面的面积公式为 S = 4 π r 2 S = 4 \pi r^2 S=4πr2(其中 r r r 为半径),这表明能量与半径的平方 r 2 r^2 r2 成正比。因此,单位面积上的能量自然会与 4 π r 2 4 \pi r^2 4πr2 成反比,这就是平方反比定律的深层次来源。

如果我们将这一现象推广到四维空间,那么我们将看到许多遵循立方(三次方)反比的定律。这也是科学家寻找高维度的一种方法。许多理论(如超弦理论)都预言了高维度的存在。科学家们通过在极小的尺度上测量引力,如果引力在极小尺度下不再遵循平方反比定律,那么很有可能发现了额外的维度。

在深入理解了静电力遵循平方反比定律之后,推导出静电力的公式就变得十分简单。显而易见,两个电荷之间的静电力与两者的电荷量有关,且电荷量越大,静电力越大。结合距离平方反比规律,两个电荷之间的静电力大致可以表示为:

库仑定律

这就是我们熟知的库仑定律:两个电荷之间的静电力与两个电荷量的乘积成正比,与它们之间的距离的平方成反比。公式中的常数部分为真空的介电常数 ε 0 \varepsilon_0 ε0(其具体含义暂且不论,只需知道它是一个与电相关的常数即可)。我们熟悉的球面积公式 S = 4 π r 2 S = 4 \pi r^2 S=4πr2 出现在分母中,这是三维空间平方反比规律的体现。

在这里插入图片描述

库仑定律是一个实验定律,即库仑通过大量实验发现两个电荷之间确实存在如此大小的静电力。然而,该定律并未解释静电力是如何传递的。两个并未接触的物体之间存在某种力,一个常见的假设是这两个物体之间存在着某种看不见的介质,帮助它们传递作用力。有人认为这种介质是“以太”,有人认为是某种弹性介质,但法拉第认为是“力线”。这种力线并非虚拟的辅助工具,而是一种客观存在的物理实体。它可以传递作用力,也可以具有能量。这些思想逐渐形成了我们现在熟知的“场”概念。

03 电场的叠加

引入“场”的概念后,我们可以更加细致地描述两个电荷之间的相互作用。为什么两个电荷之间会存在静电力呢?原因在于电荷会在其周围的空间中产生一个电场,而这个电场会对处于其中的电荷产生力的作用。电场的强度越大,电荷受到的力也越大,正电荷受力的方向即为该点电场的方向。因此,电场具有大小和方向,是一个矢量。

为了直观形象地描述电场,我们引入了电场线。电场线的密度恰好代表了电场强度的大小,而某点电场线的切线方向则代表了该处电场的方向。正电荷像太阳发光一样向四周发射电场线,而负电荷则汇集电场线。

电场线

这些内容在中学阶段已经有所涉及,此处不再赘述。接下来,我们考虑一个稍复杂的问题:库仑定律给出了两个点电荷之间静电力的大小,据此我们可以求出一个点电荷周围的电场强度。然而,一个点电荷是最简单的情况。如果带电体更为复杂,例如有许多个电荷,或者直接是一块形状不规则的带电体,此时我们该如何求解它所产生的电场呢?

一个直观且自然的想法是:如果有多个电荷,我们可以分别计算每个电荷在某点产生的电场强度,然后将它们叠加起来。如果是一个连续的带电体(例如一根带电的线),那么我们可以借助微积分这一强大的工具,将带电体切成无数个无穷小的部分。每个无穷小的部分可以视为一个点电荷,然后将这无数个点电荷在某点产生的电场强度叠加起来(即积分)即可。

上述思路实际上体现了“万物皆可切成点,万物皆可积”的思想,强行将库仑定律与微积分结合起来,通过“硬算”求出任意带电体在任意位置的场强。从原理上来说,这种方法是可行的,但在具体操作中较为复杂。那么,是否存在一种更简单、更优雅的方法呢?

答案是肯定的,但这需要我们从另一个角度思考问题。物理学致力于研究物体运动变化的规律,然而物体始终处于变化之中,我们该如何从中寻找规律呢?这里涉及科学研究的一个重要思想:把握变化世界中那些不变的东西

牛顿发现,一切物体在运动中都存在某种共同不变的量,无论物体如何运动,受到何种力,这个量仅由物体的密度和体积决定。于是,牛顿从中提炼出了“质量”的概念(当然,现在质量是一个比密度和体积更基本的概念)。科学家们还发现,在物体的各种变化过程中,存在某种守恒的量,从而提炼出了“能量”的概念。那么,带电体在其周围空间中产生电场的过程中,是否也能提炼出某种不变的量呢?

04 通量的引入

我们先暂时抛开电,先来看我们更为熟悉的水。毕竟,水流与电流在某种程度上具有相似性。

假设我们在一个水龙头的出口处安装一个喷头,使水龙头向周围空间喷射水流(类似于正电荷喷射电场线)。然后,我们用一个完全透水(水能够自由穿过塑料袋)的塑料袋将水龙头包裹起来。这样一来,从水龙头流出的所有水都必须穿过这个塑料袋,然后才能流向其他地方。穿过塑料袋表面的水流量是所有水的必经之路。

这一看似平常的现象背后隐藏着一个重要的事实:无论塑料袋的大小和形状如何,只要它是密封的,那么从水龙头流出的水量必定等于通过这个塑料袋表面的水量。

从这一现象中,我们可以抽象出一个非常重要的概念:通量。通量,顾名思义,就是通过一个曲面的某种流量。通过塑料袋表面的水流量被称为塑料袋的水通量。因此,上述例子可以表述为:水龙头的出水量等于塑料袋的水通量。

接下来,我们将这一概念重新应用于电。仍然使用上述实验装置,但将水龙头替换为一个正电荷,用一个完全透电(对电没有任何阻力)的塑料袋套住正电荷。此时,水龙头的喷头喷射的是水流,而正电荷“喷射”的是电场线;通过塑料袋的水流量称为塑料袋的水通量,那么通过塑料袋的电场线条数自然被称为塑料袋的电通量。对于水通量,我们知道它等于水龙头的出水量,那么塑料袋的电通量等于什么呢?

我们知道,电场线的存在是因为空间中存在电荷。电荷的电量越大,其产生的电场强度越大,电场线越密集,穿过塑料袋的电场线条数越多,对应的电通量也越大。因此,虽然我们无法确定电通量的具体形式,但可以肯定的是,它一定与塑料袋内包含的电荷量有关,且呈正相关。

这表明:通过一个闭合曲面的电通量与曲面内包含的电荷总量成正比。电荷量越大,通过任意闭合曲面的电通量越大,反之亦然。这就是麦克斯韦方程组的第一个方程——高斯电场定律的核心思想。

将这一思想从电推广到水,可以表述为:通过一个闭合曲面的水量是该曲面内包含的水龙头水压的量度。水压越大,水龙头越多,通过闭合曲面的水量就越大。这几乎已经接近“废话”了。因此,当我们面对那些看似高深的公式和方程时,不要被它们吓倒。许多所谓的高深思想,一旦用人话翻译过来,就会发现它们其实非常简单自然。

我们再来审视一下高斯电场定律的核心思想:通过一个闭合曲面的电通量与曲面内包含的电荷量成正比。那么,我们该如何将这一思想数学化呢?电荷总量的计算较为简单,只需将所有电荷的带电量相加即可。然而,通过一个闭合曲面的电通量该如何表示呢?

05 电场的通量

我们先从最简单的情况入手。

问题 1:假设空间中存在一个电场强度为 E \mathbf{E} E 的匀强电场,同时有一个面积为 a a a 的木板与电场方向垂直。那么,通过该木板的电通量 Φ \Phi Φ 应该如何表示呢?

电场与木板

我们最初是从水通过曲面的流量引入通量这一概念的。在电学中,我们用电场线通过一个曲面的数量来表示电通量。同时,我们也知道电场线的密度代表了电场强度的大小。因此,我们可以清楚地看到:电场强度越大,通过木板的电场线条数越多;木板的面积越大,通过木板的电场线条数也越多。而电场线条数越多,就意味着电通量越大。

由于电场强度 E \mathbf{E} E 是一个矢量(具有大小和方向),我们用 E \mathbf{E} E 的绝对值 ∣ E ∣ |\mathbf{E}| E 来表示其大小。因此,直接用电场强度的大小 ∣ E ∣ |\mathbf{E}| E 与木板面积 a a a 的乘积来表示电通量的大小是十分合理的。也就是说,通过木板的电通量 Φ = ∣ E ∣ × a \Phi = |\mathbf{E}| \times a Φ=E×a

当木板与电场方向垂直时,情况最为简单。但如果木板与电场方向不垂直呢?

问题 2:仍然考虑上述木板和电场,如果木板与电场方向不垂直,它们之间存在一个夹角 θ \theta θ,那么此时的电通量该如何计算呢?

在这里插入图片描述

如上图所示,当木板不再与电场方向垂直时,我们可以直观地感受到,木板被电场线穿过的有效面积减小了。原来长度为 A B AB AB 的面都能挡住电场线,现在虽然木板本身未变,但真正能够有效挡住电场线的变成了 B C BC BC 这个面。

接下来,我们讨论一下曲面的方向。可能很多人会认为曲面的方向就是 A B AB AB 的方向。其实并非如此,我们是用一个垂直于该平面的向量的方向来表示这个平面的方向,这个向量称为该平面的法向量。如上图所示,我们画了一个与木板垂直的法向量 n \mathbf{n} n,那么法向量 n \mathbf{n} n 与电场 E \mathbf{E} E 之间的夹角才是木板这个平面与电场的夹角 θ \theta θ

A B AB AB B C BC BC θ \theta θ 之间存在一个简单的三角关系: B C = A B × cos ⁡ θ BC = AB \times \cos \theta BC=AB×cosθ(因为夹角 θ \theta θ 与角 A B C ABC ABC 相等, cos ⁡ θ \cos \theta cosθ 表示直角三角形中邻边与斜边的比值)。而我们已知当垂直时,通过木板的电通量 Φ = ∣ E ∣ × ∣ a ∣ \Phi = |\mathbf{E}| \times |a| Φ=E×a。那么,当它们之间存在夹角 θ \theta θ 时,通过木板的电通量自然就变成了:

Φ = ∣ E ∣ × ∣ a ∣ × cos ⁡ θ \Phi = |\mathbf{E}| \times |a| \times \cos \theta Φ=E×a×cosθ

06 矢量的点乘

至此,我们有必要稍微讲解一下矢量以及矢量的乘法

通俗地说,标量是只有大小而没有方向的量。例如温度,房间某一点的温度仅具有大小,而无方向;再如质量,我们只说一个物体的质量是多少千克,而不涉及质量的方向。而矢量则是既有大小又有方向的量。例如速度,我们描述一辆汽车的速度时,不仅要说明其大小,还要指明其方向,即它是向东还是向南;再如力,你推桌子时,这个推力不仅有大小(决定能否推动桌子),还有方向(将桌子推向哪一边)。

标量仅具有大小而无方向,因此标量的乘法可以直接像代数乘法一样,仅让它们的大小相乘即可。然而,矢量既有大小又有方向,因此两个矢量相乘时,不仅要考虑它们的大小,还要考虑它们的方向。假设你有两个矢量,一个矢量的方向向北,另一个向东,那么它们相乘后得到的结果是否还有方向呢?如果有,该方向又该如何确定呢?

这就意味着,我们从小学开始学习的代数乘法概念,在矢量领域并不适用。我们需要重新定义一套矢量的乘法规则,其中最常用的是点乘(符号为“(\cdot)”)。两个标量相乘时,直接让它们的大小相乘即可。但现在矢量不仅有大小还有方向,那么如何体现方向呢?方法很简单:我们不是直接让两个矢量的大小相乘,而是让一个矢量在另一个矢量方向上的投影与另一个矢量的大小相乘,这样既体现了大小又体现了方向

矢量点乘

如上图所示,我们有两个矢量 O A \mathbf{OA} OA O B \mathbf{OB} OB(线段的长短代表矢量的大小,箭头的方向代表矢量的方向)。我们过点 A A A A C AC AC 垂直于 O B \mathbf{OB} OB(即 O A \mathbf{OA} OA O B \mathbf{OB} OB 方向上的投影)。那么,线段 O C \mathbf{OC} OC 的长度就代表了矢量 O A \mathbf{OA} OA O B \mathbf{OB} OB 方向上的投影。根据三角函数的定义,一个角度 θ \theta θ 的余弦 cos ⁡ θ \cos \theta cosθ 被定义为邻边( O C \mathbf{OC} OC)与斜边( O A \mathbf{OA} OA)的比值,即 cos ⁡ θ = ∣ O C ∣ ∣ O A ∣ \cos \theta = \frac{|\mathbf{OC}|}{|\mathbf{OA}|} cosθ=OAOC(绝对值表示矢量的大小, ∣ O A ∣ |\mathbf{OA}| OA 表示矢量 O A \mathbf{OA} OA 的大小)。因此,矢量 O A \mathbf{OA} OA O B \mathbf{OB} OB 方向上的投影 O C \mathbf{OC} OC 可以表示为:

O C = ∣ O A ∣ × cos ⁡ θ \mathbf{OC} = |\mathbf{OA}| \times \cos \theta OC=OA×cosθ

既然两个矢量的点乘被定义为一个矢量的投影与另一个矢量大小的乘积,现在我们已经得到了投影 O C \mathbf{OC} OC 的表达式,那么矢量 O A \mathbf{OA} OA O B \mathbf{OB} OB 的点乘可以表示为:

O A ⋅ O B = O C × ∣ O B ∣ = ∣ O A ∣ × ∣ O B ∣ × cos ⁡ θ \mathbf{OA} \cdot \mathbf{OB} = \mathbf{OC} \times |\mathbf{OB}| = |\mathbf{OA}| \times |\mathbf{OB}| \times \cos \theta OAOB=OC×OB=OA×OB×cosθ

我们之前还在讨论电场通过一个平面的通量,接下来却开始讲解矢量的点乘,这两者之间有何联系呢?原因在于电场强度也是一个矢量,它既有大小也有方向(电场线的密度代表大小,电场线的方向代表其方向);而平面实际上也可以视为一个矢量,平面的大小不言而喻,平面的方向是用垂直于该平面的法向量来表示的。再回顾一下,当平面与电场方向存在夹角 θ \theta θ 时,通过该平面的电通量 Φ = ∣ E ∣ × ∣ a ∣ × cos ⁡ θ \Phi = |\mathbf{E}| \times |a| \times \cos \theta Φ=E×a×cosθ。这与上述两个矢量点乘右边的形式是否一模一样呢?

也就是说,从矢量的角度来看:电场 E \mathbf{E} E 通过一个平面 a \mathbf{a} a 的电通量 Φ \Phi Φ 可以表示为这两个矢量(电场和平面)的点乘,即 Φ = E ⋅ a \Phi = \mathbf{E} \cdot \mathbf{a} Φ=Ea(因为根据点乘的定义有 E ⋅ a = ∣ E ∣ × ∣ a ∣ × cos ⁡ θ \mathbf{E} \cdot \mathbf{a} = |\mathbf{E}| \times |\mathbf{a}| \times \cos \theta Ea=E×a×cosθ)。

这种表述既简洁又精确。试想,如果不使用矢量表述,那么在公式中就不可避免地会出现许多与夹角 θ \theta θ 相关的项。更重要的是,电场强度和平面本身就是矢量,使用矢量运算才是最自然的选择,为何要用标量来代替它们呢?

总之,我们知道一个电场通过一个平面的电通量可以简洁地表示为:

Φ = E ⋅ a \Phi = \mathbf{E} \cdot \mathbf{a} Φ=Ea

然而,高斯电场定律的核心思想是通过闭合曲面的电通量与曲面内包含的电荷量成正比,而我们这里得到的只是一个电场通过一个平面的电通量。一个平面和一个闭合曲面之间还是存在相当大的区别的。

07 闭合曲面的电通量

既然已经知道如何求一个平面的电通量,那么如何求一个曲面的电通量呢?

这里需要稍微涉及一些微积分的思想。我们都知道,我们生活在地球的表面,而地球表面实际上是一个球面。那么,为什么我们在平常行走时感觉不到这种球面的弯曲呢?答案很简单,因为地球的半径很大。当我们从月球上遥望地球时,可以清晰地看到地球表面是一个弯曲的球面。然而,当我们仅关注周围很小的一块区域时,就感觉不到地球的这种弯曲,而是觉得我们行走在一个平面上。

地球的表面是一个曲面,但当我们只关注非常小的一块区域时,它看起来就像一个平面。这其实为我们提供了一个启示:我们可以将一个曲面分割成许多小块,只要分割得足够细,使得每一小块都足够小,那么就可以将这一小块近似地当作平面来处理。而且不难想象,我们把曲面分割得越细,每一小块就越接近平面,将这些小平面加起来就越接近曲面本身

这是重点:如果我们把曲面分割成无穷多份,那么每一小块的面积就趋近于无穷小,于是我们就可以认为这些小块加起来就等于这个曲面了。这就是微积分最朴素的思想。

曲面分割

如上图所示,我们将一个球面分割成许多小块,每一小块变成了一个长为 d x dx dx、宽为 d y dy dy 的小方块,这个小方块的面积 d a = d x ⋅ d y da = dx \cdot dy da=dxdy。如果这个小块处的电场强度为 E \mathbf{E} E,那么通过这个小块的电通量就是 E ⋅ d a \mathbf{E} \cdot da Eda。如果我们把这个球面分割成无穷多份,那么将这无穷多个小块的电通量加起来,就能得到穿过这个曲面的总电通量

这个思想总体来说还是相对简单的,只是涉及到了微积分最朴素的一些思想。如果要具体计算可能会比较复杂,但幸运的是,我们不需要知道具体的计算过程,我们只需要知道如何表示这个思想即可。一个小块 d a da da 的电通量是 E ⋅ d a \mathbf{E} \cdot da Eda,那么我们就可以用下面的符号表示通过这个曲面 S S S 的总电通量

Φ = ∮ S E ⋅ d a \Phi = \oint_{S} \mathbf{E} \cdot d\mathbf{a} Φ=SEda

这个“拉长的大 S S S 符号”就是积分符号,它代表了上述微积分思想。它的右下角的 S S S 表示曲面 S S S,即我们这里是把曲面 S S S 切割成无穷小块,然后对每一块都求其通量 E ⋅ d a \mathbf{E} \cdot d\mathbf{a} Eda,再将这些通量累积起来。至于这个大 S S S 中间的圆圈则表示这是一个闭合曲面。因此,整个表达式 (\Phi = \oint_{S} \mathbf{E} \cdot d\mathbf{a}) 表示的是通过闭合曲面 (S) 的总电通量。

08 方程一:高斯电场定律

上述公式表示电场 E \mathbf{E} E 通过闭合曲面 S S S 的总电通量。高斯电场定律的核心思想为:通过闭合曲面的电通量与该曲面所包含的电荷量成正比。基于此,可清晰理解麦克斯韦方程组的第一个方程——高斯电场定律:

图片

方程左侧表示电场 E \mathbf{E} E 通过闭合曲面 S S S 的电通量;方程右侧的 Q enc Q_{\text{enc}} Qenc 表示闭合曲面内包含的电荷总量,而 ε 0 \varepsilon_0 ε0 为真空介电常数。等号两侧分别对应闭合曲面的电通量与闭合曲面所包含的电荷,从而以数学公式的形式精准地诠释了上述思想。

麦克斯韦方程组共包含四个方程,分别用于描述静电、静磁、磁生电以及电生磁的过程。库伦定律从点电荷的角度对静电进行描述,而高斯电场定律则从通量的角度对静电现象进行阐述。为了准确描述任意闭合曲面的通量,微积分的思想被引入其中。电通量是电场线通过某一曲面的数量,磁场亦存在磁感线(因历史原因无法使用“磁场线”这一名称),因此,可类似地建立磁通量的概念,并在此基础上构建高斯磁场定律。

09 方程二:高斯磁场定律

磁通量的概念可完全仿照电通量的概念建立,将磁感线通过某一曲面的数量定义为磁通量。由于磁场线的密度同样表征了磁感应强度(因历史原因,无法使用“磁场强度”这一名称)的大小,因此,可仿照电场,将磁感应强度为 B \mathbf{B} B 的磁场通过一个平面 a a a 的磁通量 Φ \Phi Φ 表示为 Φ = B ⋅ a \Phi = \mathbf{B} \cdot a Φ=Ba

同样,依据在电场中运用的微积分思想,类比通过闭合曲面电通量的处理方式,可将通过一个闭合曲面 S S S 的磁通量表示为:

图片

随后,可类比高斯电场定律的思想“通过闭合曲面的电通量与该曲面所包含的电荷量成正比”,构建高斯磁场定律,其核心思想似乎是:通过闭合曲面的磁通量与该曲面所包含的“磁荷量”成正比

然而,此处存在一个问题。自然界中存在独立的正负电荷,电场线从正电荷出发,汇集于负电荷。但是,自然界中尚未发现(至少目前尚未发现)独立的磁单极子,任何一个磁体均为南北两极共存。因此,磁感线与电场线不同,它不会有一个单独的源头,也不会汇集到某个地方,它只能是一条闭合的曲线。

图片

上图展示了一个常见的磁铁周围的磁感线。磁铁外部的磁感线从 N 极指向 S 极,而在磁铁内部又从 S 极指向 N 极,从而形成一个完整的闭环。

如果磁感线均为闭环,且不存在独立的磁单极子,那么可以思考:如果在一个闭环内画一个闭合曲面,那么结果必然是有多少磁感线进入曲面,就有多少磁感线从曲面出来。因为如果有一根磁感线只进不出,那么它就不可能是闭合的,反之亦然。

如果一个闭合曲面有多少根磁感线进入,就有多少根磁感线出来,这意味着什么呢?这意味着进入的磁通量与出来的磁通量相等,因此该闭合曲面包含的总磁通量恒为 0。这便是麦克斯韦方程组的第二个方程——高斯磁场定律的核心思想:闭合曲面包含的磁通量恒为 0

通过闭合曲面的磁通量( B ⋅ a \mathbf{B} \cdot a Ba 是磁通量,加上曲面的积分符号即表示曲面的磁通量)我们已经讨论过,恒为 0 无非是在等号的右边加上 0,因此高斯磁场定律的数学表达式为:

图片

对比高斯电场定律和高斯磁场定律,会发现它们不仅名字相似,思想也几乎相同。只不过目前尚未发现磁荷、磁单极子,因此高斯磁场定律的右边是一个 0。再思考一下:为什么这种高斯 × × \times \times ×× 定律能够成立?为什么通过任意闭合曲面的某种通量会刚好是某种量的一个量度?

原因在于它们的“平方反比”关系。因为电场强度和磁感应强度都与距离的平方成反比,而表面积与距离的平方成正比,所以前者减小多少,后者就增加多少。如果有一个量的表示形式是前者和后者的乘积,那么它的总量就会保持不变。通量恰好是 × × \times \times ×× 强度和表面积的乘积,因此电通量和磁通量都具有这样的性质。

因此,进一步思考可以发现:只要一种力的强度与距离平方成反比,那么它就可以有类似的高斯 × × \times \times ×× 定律,例如引力,我们同样可以找到对应的高斯定律。数学王子高斯发现了高斯定理,将其应用在物理学的各个领域,便得到了各种高斯 × × \times \times ×× 定律。麦克斯韦方程组共有四个方程,其中有两个高斯定律,可见其重要性。

关于静电和静磁的内容就先讲到这里,如有疑问,请咨询高斯,毕竟这是他“独家冠名”的成果。接下来,我们来看看电和磁之间的相互作用,探讨磁如何生电,以及电如何生磁。说到磁如何生电,就不得不提到法拉第。奥斯特发现电流的磁效应之后,人们基于对称性的原则,认为磁也一定能生电,但磁到底如何生电呢?这需要通过实验来研究。

10 电磁感应

既然要通过实验研究磁如何生电,那么首先需要一个磁场。这很简单,找两块 N 极和 S 极相对的磁铁,它们之间就会形成一个磁场。再拿一根金属棒,看看它是否能从磁场中产生电。因为金属棒是导电的,所以将其用导线连接到一个检测电流的仪器上,如果仪器检测到电流,那么就说明磁生电成功了。

图片

法拉第进行了许多这样的实验,他发现:如果金属棒静止不动,则不会产生电流(这是自然的,否则就违背了能量守恒定律。如果这样能发电,那么我买一块磁铁回家,就再也不用交电费了)。

然后,他发现金属棒在运动时,有时能产生电流,有时不能。如果沿着磁感线的方向运动(在上图中是左右运动),则没有电流;但如果做切割磁感线的运动(在上图中是上下运动),则能产生电流。用一个通俗的比喻来说:如果把磁感线想象成一根根面条,只有把面条(磁感线)切断了才会产生电流

此外,他还发现,即使金属棒在磁场中静止不动,但如果改变磁场的强度,让磁场变强或变弱,那么即使金属棒不动也会产生电流。

法拉第仔细总结了这些情况,他发现无论是金属棒运动切割磁感线产生电流,还是磁场强度变化产生电流,都可以用一个通用的方式来表达:只要闭合回路的磁通量发生改变,就会产生电流。我们来思考一下,磁通量是磁场强度 B \mathbf{B} B 和面积 a a a 的乘积( B ⋅ a \mathbf{B} \cdot a Ba),切割磁感线相当于改变了磁感线通过回路的面积 a a a,而改变磁场强度则是改变了 B \mathbf{B} B。无论是改变了 a a a 还是 B \mathbf{B} B,它们的乘积 B ⋅ a \mathbf{B} \cdot a Ba(磁通量)肯定都会改变。

也就是说:只要通过曲面(我们可以把闭合回路当作一个曲面)的磁通量发生改变,回路中就会产生电流,而且磁通量变化得越快,电流就越大

到这里,我们要表示通过一个曲面的磁通量应该已经轻车熟路了。磁通量是 B ⋅ a \mathbf{B} \cdot a Ba,那么通过一个曲面 S S S 的磁通量只需加上积分符号即可。因此,通过曲面 S S S 的磁通量可以表示为:

图片

细心的读者会发现,这个表达式与我们高斯磁场定律中磁通量部分略有不同。高斯磁场定律中的积分符号(拉长的 S S S)中间有一个圆圈,而这里没有。高斯磁场定律指出“闭合曲面的磁通量恒为 0”,那里的曲面是闭合曲面,所以有圆圈。而我们这里的曲面并非闭合曲面(我们是将电路回路当作一个曲面,考虑通过这个回路的磁通量),也不能是闭合曲面。因为法拉第发现“通过一个曲面的磁通量有变化就会产生电流”,如果是闭合曲面,那么根据高斯磁场定律,其磁通量恒为 0,恒为 0 就是没有变化,没有变化按照法拉第的说法就没有电流,那还怎么生电呢?

因此,我们要明确,这里不再是讨论闭合曲面的磁通量,而是一个非闭合曲面的磁通量。这个磁通量发生改变就会产生电流,而且变化得越快,产生的电流就越大。上面的式子给出的只是通过一个曲面 S S S 的磁通量,但我们看到最终决定电流大小的并不是通过曲面的磁通量的大小,而是磁通量变化的快慢。那么,我们该如何表示这种变化的快慢呢?

我们先来看看我们是如何衡量快慢的。例如身高,一个人在十二三岁时一年可以长 10 厘米,我们说他这时候长得快;到了十七八岁时可能一年只长 1 厘米,我们就说他长得慢。也就是说,我们衡量一个量(假设身高用 y y y 表示)变化快慢的方法是:给定一个变化的时间 d t dt dt(比如一年,或者更小),看看这个量的变化 d y dy dy 是多少,如果这个量的变化很大,我们就说它变化得很快,反之则变化得慢

因此,我们可以用这个量的变化 d y dy dy 和给定的时间 d t dt dt 的比值 d y d t \frac{dy}{dt} dtdy 来衡量这个量 y y y 变化的快慢。所以,我们现在要衡量磁通量变化的快慢,只需要将磁通量的表达式替换掉上面的 y y y 即可,那么通过曲面 S S S 的磁通量变化的快慢可以表示为:

图片

这样,我们就完成了磁生电过程中磁的部分的讨论,那么电呢?一个闭合回路(曲面)的磁通量有变化就会产生电,那么这种电该如何描述呢?

11 电场的环流

可能有人会觉得磁通量的变化不是在回路里产生了电流吗,那么我直接用电流来描述这种电不就行了么不行,我们的实验中之所以有电流,是因为我们用导线把金属棒连成了一个闭合回路,如果没有用导线连接金属棒,那么肯定就没有电流了。

因此,电流并不是最本质的东西,那个最本质的东西是电场。一个曲面的磁通量发生改变,就会在这个曲面的边界感应出一个电场,这个电场会驱动导体中的自由电子定向移动,从而形成电流。因此,即使没有导线和电流,这个电场依然存在。所以,我们需要描述的是这个被感应出来的电场

首先,一个曲面的磁通量发生改变,就会在曲面的边界感应出一个电场,这个电场是环绕着磁感线的,就像是磁感线的腰部套了一个呼啦圈。而且,磁通量是增大还是减小,决定了这个电场是顺时针环绕还是逆时针环绕,如下图所示:

图片

如果我们从上往下看,这个成闭环的感应电场如下图所示:它在这个闭环每点的方向都不一样,这样就可以沿着回路驱动带电粒子,就好像电场在推着带电粒子在这个环里流动一样。

图片

这里,我们需要引入一个新的概念:电场环流。电场的环流就是电场沿着闭合路径的线积分。这里有两个关键词:闭合路径线积分。闭合路径很好理解,只有路径是闭合的,才是一个环,感应电场也是一个环状的电场。

电场的线积分是指:由于感应电场是一个环状电场,其在每一个点的方向都不相同。然而,可以运用微积分的思想进行处理。虽然电场在大范围内(比如整个圆环)的方向是不同的,但如果在圆环中取一个非常小的线段 d l d\mathbf{l} dl,电场 E \mathbf{E} E 可以近似为恒定的,此时 E ⋅ d l \mathbf{E} \cdot d\mathbf{l} Edl 具有明确的物理意义。将圆环上所有部分的 E ⋅ d l \mathbf{E} \cdot d\mathbf{l} Edl 累加起来,即沿着圆环逐段累加 E ⋅ d l \mathbf{E} \cdot d\mathbf{l} Edl,便完成了对电场的线积分。这个线积分的结果称为电场环流,其数学表达式为:

在这里插入图片描述

其中,积分符号下的 C C C 表示积分路径为闭合曲线,与前面的面积分(下标为 S S S)不同,积分符号中间的圆圈表示这是一个闭合路径的积分。如果读者已经熟悉了曲面通量的概念,理解电场在闭合路径上的积分(即电场环流)应该并不困难。

电场环流的物理意义是电动势,即电场对沿着该路径移动的单位电荷所做的功。此处不深入讨论,仅需直观理解电场沿着回路推动电荷做功的概念,类似于一个人用鞭子驱赶磨坊的驴。这种表述方式更适合描述变化的磁感应产生的电场,因为它既包含了感应电场的大小信息,也包含了方向信息。

12 方程三:法拉第定律

麦克斯韦方程组的第三个方程——法拉第定律,其表述为:曲面的磁通量变化率等于感应电场的环流。用公式表示为:

在这里插入图片描述

其中,方程右侧的磁通量变化率和左侧的感应电场环流已在前面讨论过。公式右侧的负号反映了楞次定律的内容,即感应电场产生的磁通量与原磁场的磁通量变化方向相反,以维持系统的稳定。这一负号体现了楞次定律,即感应电流的方向总是试图抵消产生它的磁通量变化。

至此,完成了麦克斯韦方程组的第三个方程——法拉第定律的讲解,它描述了变化的磁通量如何产生电场的过程。需要注意的是,这里的磁通量变化包括两种情况:导体运动导致的磁通量变化和磁场变化导致的磁通量变化。这两种情况虽不同,但可以用统一公式表达,这曾被认为是一种巧合。爱因斯坦则认为这是一种暗示,最终从这里发现了狭义相对论。

此外,由于这两种情况的不同,法拉第定律还有另一个版本,将这两种情况区分,认为只有磁场变化导致的磁通量变化才是法拉第定律,而导体运动导致的磁通量变化只是通量法则。其公式为:

对比这两个法拉第定律,后者将变化率从针对整个磁通量改为只针对磁场强度 B \mathbf{B} B,即使用偏导符号 ∂ B ∂ t \frac{\partial \mathbf{B}}{\partial t} tB,只考虑变化磁场导致的磁通量变化。这种形式与法拉第定律的微分形式对应得更好。

磁生电的过程讲解至此,接下来探讨电生磁的情况。可能有人觉得出场次序有些奇怪:奥斯特先发现电流的磁效应,法拉第十年后才发现磁如何生电,为何先讲磁生电的法拉第定律,最后讲电生磁呢?

13 安培环路定理

奥斯特首先发现电流的磁效应,证实电与磁并非毫无关联。

图片

假设电流从下往上,周围会产生环形磁场。磁场方向可通过右手定则判断:手握导线,拇指指向电流方向,右手四指弯曲方向即为磁场 B \mathbf{B} B 方向。

随后,毕奥、萨伐尔和安培等人着手定量研究电流的磁效应,得到描述电流磁效应的毕奥 - 萨伐尔定律安培环路定理。其中,毕奥 - 萨伐尔定律类似库伦定律安培环路定理类似高斯电场定律。麦克斯韦方程组采用后一套语言,因此这里只介绍安培环路定理

图片

安培环路定理的左侧与法拉第定律的左侧相似,因为法拉第定律指出磁通量变化会在周围产生旋转闭合的电场,而电流的磁效应同样在电流周围产生旋转闭合的磁场。因此,使用磁场环流(磁场在闭合路径的线积分)来描述这种旋转闭合的磁场。

安培环路定理的右侧较为简单, μ 0 \mu_0 μ0 是真空磁导率, I enc I_{\text{enc}} Ienc 表示被包含在闭合路径内的总电流。安培环路定理表明:通电导线周围会产生旋转磁场,可以在电流周围任意画一个圈,该磁场的环流(沿着该圈的线积分)等于圈内包含的电流总量乘以真空磁导率。

然而,安培环路定理仅描述了电流产生磁的现象,是否变化的电通量也能产生磁呢?这需要进一步探讨。

14 方程四:安培 - 麦克斯韦定律

安培环路定理描述了电生磁,但仅涉及电流产生磁的部分。根据对称性,变化的电通量是否也能产生磁呢?当时的科学家们尝试通过实验寻找电通量变化产生磁场的证据,但未成功。这可能是因为不存在,或者实验精度不足。

麦克斯韦选择了后者,认为“变化的电通量也能产生磁”,并基于概念模型发现必须加入这一项。修正后的安培环路定理才能与高斯电场定律、高斯磁场定律、法拉第定律融洽相处,否则会产生矛盾。以下是一个简单的例子,说明为何必须加入“变化的电通量也能产生磁”这一项。

在安培环路定理中,可以随意选择一个曲面,所有穿过该曲面的电流会在曲面的边界上形成环绕磁场。但关键在于曲面的选取。理论上,只要曲面边界相同,曲面的其他部分选择应无关紧要。然而,以下例子将展示即使曲面边界相同,使用安培环路定理仍可能得出矛盾的结果。

图片

上图展示了一个包含电容器的简单电路。电容器可容纳一定量的电荷。当开关闭合时,电荷在电池驱动下移动至电容器,因电容器可容纳一定量电荷,电荷可在电路中移动,表现为电流。因此,在给电容器充电时,电路中有电流,但电容器之间无电流。如果选择上图的曲面,有电流穿过该曲面,按照安培环路定理,会产生环绕磁场。但如果选择另一个曲面(此处图片来自《麦克斯韦方程直观》,需要的可以后台回复“麦克斯韦方程组”),情况则不同。

图片

该曲面边界与上图相同,但底部延伸至电容器。因电容器充电时内部无电流,所以该曲面无电流穿过。按照安培环路定理,该曲面不会产生环绕磁场。然而,这与前面的结论矛盾,即相同的曲面边界却得出不同的结论,说明安培环路定理存在缺陷。

再分析电容器充电过程:电池驱使电荷向电容器聚集,电容器中间虽无电流,但两边聚集的电荷越来越多。电荷增多导致电容器两极板之间的电场强度增大,而电场强度增大意味着通过该曲面的电通量增大。因此,尽管无电流穿过该曲面,但通过该曲面的电通量发生了变化。基于此,合理地将“变化的电通量”加入产生磁场的原因中。麦克斯韦完成了这一工作,修正后的公式即麦克斯韦方程组的第四个方程——安培 - 麦克斯韦定律

图片

与安培环路定理相比,安培 - 麦克斯韦定律仅在右侧增加了变化的电通量一项。其中, E ⋅ d a \mathbf{E} \cdot d\mathbf{a} Eda 表示电通量,加上面积分符号表示通过曲面 S S S 的电通量,再加 d d t \frac{d}{dt} dtd 表示通过曲面 S S S 的电通量变化率。 ε 0 \varepsilon_0 ε0 是真空介电常数,将其与电通量变化率相乘,得到的量与电流单位相同,称为位移电流

因此,麦克斯韦提出了位移电流假说,其核心是“变化的电通量也能产生磁”,因当时无实验能证明这一点,故称为假说。加入这一项后,安培 - 麦克斯韦定律与其它定律和谐统一。麦克斯韦方程组能预言电磁波的存在,这一项至关重要。因为电磁波的产生关键在于“变化的电场产生磁场,变化的磁场产生电场”,变化的电场产生磁场正是麦克斯韦添加的这一项的核心内容。

至于麦克斯韦方程组如何推导出电磁波,后续将专门讲解,此处只需了解电磁波的产生与位移电流假说密切相关。

15 麦克斯韦方程组

至此,麦克斯韦方程组的四个方程:描述静电的高斯电场定律、描述静磁的高斯磁场定律、描述磁生电的法拉第定律和描述电生磁的安培 - 麦克斯韦定律的积分形式均已介绍完毕。将它们总结如下:

图片

  • 高斯电场定律:穿过闭合曲面的电通量正比于该曲面所包含的电荷量。
  • 高斯磁场定律:穿过闭合曲面的磁通量恒为 0。
  • 法拉第定律:穿过曲面的磁通量的变化率等于感应电场的环流。
  • 安培 - 麦克斯韦定律:穿过曲面的电通量的变化率和曲面所包含的电流等于感应磁场的环流。

在这些方程中,通量始终是核心概念。

图片

如果一个曲面是闭合的,那么通过它的通量就是曲面内某种物理量的量度。由于自然界存在独立的电荷,所以高斯电场定律的右侧是电荷量的大小;由于尚未发现磁单极子,所以高斯磁场定律的右侧为 0。

如果一个曲面不是闭合的,那么它无法包含任何物理量,也就不能作为某种物理量的量度。然而,非闭合曲面存在边界,因此当非闭合曲面的通量发生变化时,会在其边界感应出某种旋涡状的场,这种场可以用环流来描述。因此,当非闭合曲面的磁通量发生变化时,会在其边界感应出电场,这就是法拉第定律;当非闭合曲面的电通量发生变化时,会在其边界感应出磁场,这就是安培 - 麦克斯韦定律的内容。

通过闭合曲面和非闭合曲面的通量将这四个方程联系起来,可以发现麦克斯韦方程组并非杂乱无章。闭上眼睛,想象空间中到处飞舞的电场线和磁场线,它们有的从一个闭合曲面中飞出,有的穿过一个闭合曲面,有的穿过一个普通曲面后在曲面边界产生新的电场线或磁场线。它们就像漫天飞舞的音符,而麦克斯韦方程组则是它们的指挥官。

16 结语

许多人误以为麦克斯韦方程组是麦克斯韦一人写出的一组方程,其实不然。麦克斯韦方程组包含四个方程,其中三个半(高斯电场定律、高斯磁场定律、法拉第定律、安培环路定理)在麦克斯韦之前就已经存在,麦克斯韦真正加入的只有安培 - 麦克斯韦定律中的“电通量变化产生磁场”这一项。了解这些后,有人可能会觉得麦克斯韦并不那么伟大。

然而,事实并非如此。在麦克斯韦之前,电磁学领域已经有许多实验定律,但哪些是根本的,哪些是表象?如何从这些定律中筛选出最核心的部分,并构建一个完善且自洽的模型来解释所有电磁学现象?这本身就是一件极为困难的事情。更不用说麦克斯韦在没有任何实验证据的情况下,凭借其卓越的数学能力和物理直觉,直接修正了安培环路定理,解决了几个定律之间的矛盾,并从中发现了电磁波。因此,完全没有必要因为麦克斯韦没有发现方程组的全部方程而质疑他的伟大。

最后,本文介绍的是麦克斯韦方程组的积分形式,方程均以积分形式呈现。积分形式主要从通量、宏观角度描述电磁学,相对容易理解。既然有积分形式,那么必然存在麦克斯韦方程组的微分形式,相关内容将在下一篇文章中介绍。


最美的公式:你也能懂的麦克斯韦方程组(微分篇)

原创 长尾君 长尾科技 2019年08月16日 20:28

在上一篇文章《最美的公式:你也能懂的麦克斯韦方程组(积分篇)》中,我们从零开始逐步介绍了麦克斯韦方程组的积分形式。本文将探讨其微分形式。

在积分篇中,我们主要处理电场和磁场的通量。我们任意选取一个曲面,该曲面可以是闭合的,也可以是非闭合的,然后让电场线和磁感线穿过这些曲面,从而形成四个积分形式的方程。积分形式的麦克斯韦方程组是从宏观角度描述问题的,这些曲面都是宏观可见的。那么微分形式呢?微分形式应当从微观角度去分析问题。那么,我们应如何将曲面、通量这些宏观概念引入微观领域呢?

一个直观的想法是:将宏观物体不断缩小,直至缩小为一个点,从而进入微观层面。积分形式的麦克斯韦方程组需要选定一个曲面,但并未限定该曲面的大小。我们可以选择一个非常小的曲面。当曲面被选得极小的时候,麦克斯韦方程组的积分形式自然会转化为微分形式。因此,微分形式的基本思想较为简单,其真正复杂之处在于如何寻找一种便捷的计算方法,这将在后文详细阐述。

鉴于微分形式与积分形式的这种承接关系,建议读者先阅读积分篇的内容。在积分篇中,我们从零开始讲解电磁学和麦克斯韦方程组,因此阅读起来并无门槛。然而,在微分篇中,我们将不再详细解释已在积分篇中提及的概念(如电场、通量、环流等)。如果在本文中遇到难以理解的内容,可以回顾积分篇的相关内容。

下面进入正题。在积分篇中,我们介绍了麦克斯韦方程组的四个方程,分别描述了静电(高斯电场定律)、静磁(高斯磁场定律)、磁生电(法拉第定律)和电生磁(安培-麦克斯韦定律)。这四个方程各有积分和微分两种形式。积分形式已在上篇中讨论,微分形式我们将按照顺序,从静电开始介绍。

01 微分形式的静电

在积分篇中,我们这样描述静电:在空间中任意画一个闭合曲面,那么通过该闭合曲面的电场线数量(即电通量)与该曲面包含的电荷量成正比。用公式表示为:

图片

这是积分形式的高斯电场定律。左侧表示通过闭合曲面 S S S 的电通量(电场强度 E \mathbf{E} E 通过面积为 S S S 的闭合曲面的通量,可表示为 E ⋅ d a \mathbf{E} \cdot d\mathbf{a} Eda,其中 d a d\mathbf{a} da 为微小面积元,积分符号表示将所有微小面积元上的电通量累加,从而得到通过整个闭合曲面 S S S 的电通量)。右侧的 Q enc Q_{\text{enc}} Qenc 表示闭合曲面包含的电荷量, ε 0 \varepsilon_0 ε0 为常数。这些内容在积分篇中已详细说明,此处不再赘述。

接下来是重点:由于闭合曲面 S S S 可以任意选取,其大小和形状均无限制,既可以是球面,也可以是其他任意形状。因此,我们可以尝试将闭合曲面不断缩小,直至缩小为无穷小。此时,高斯电场定律将如何变化?

这里涉及极限的概念。我们可作如下考虑:将闭合曲面缩小至无穷小,即其表面积或体积无限趋近于 0。假设有一个球体,其体积为 Δ V \Delta V ΔV,让 Δ V \Delta V ΔV 无限趋近于 0,即可表示该球体缩小至无穷小。用数学符号表示为:

lim ⁡ Δ V → 0 \lim_{\Delta V \to 0} limΔV0

“Lim” 是英文单词“极限”(limit)的缩写, Δ V \Delta V ΔV 通过箭头指向 0,形象地表示其无限趋近于 0。有了极限的概念,我们就可以自然地表示通过无穷小曲面的电通量。此时,高斯电场定律变为:

在这里插入图片描述

这样,我们便将高斯电场定律从宏观层面拉到了微观层面:方程左侧表示曲面缩小至无穷小时的电通量,方程右侧表示无穷小曲面包含的电荷量。然而,当曲面缩小至无穷小时,再使用电荷量 Q Q Q 已不合适,因此我们改用电荷密度(符号为 ρ \rho ρ)。电荷密度从名称上可推断为单位体积内包含的电荷量,其表达式为电荷量除以体积,即 ρ = Q V \rho = \frac{Q}{V} ρ=VQ

因此,若将微观的高斯电场定律左右两边同时除以体积 Δ V \Delta V ΔV,那么右侧的电荷量 Q Q Q 除以体积 Δ V \Delta V ΔV 就变为电荷密度 ρ \rho ρ,左侧同样除以体积 Δ V \Delta V ΔV,公式即变为:

在这里插入图片描述

公式右侧除以体积 Δ V \Delta V ΔV 后变为电荷密度 ρ \rho ρ 除以真空介电常数 ε 0 \varepsilon_0 ε0,那么左侧呢?左侧原本是通过无穷小曲面的电通量,除以体积 Δ V \Delta V ΔV 后所表示的物理量,我们赋予其一个新的名称:散度。

也就是说,电场 E \mathbf{E} E 在一个点(被无穷小曲面包围的点)上的散度被定义为电场通过该无穷小曲面的电通量除以体积。散度的英文单词是 divergence,因此我们通常用 div ( E ) \text{div}(\mathbf{E}) div(E) 表示电场 E \mathbf{E} E 的散度,即:

在这里插入图片描述

因此,高斯电场定律的微分形式可表示为:

div ( E ) = ρ ε 0 \text{div}(\mathbf{E}) = \frac{\rho}{\varepsilon_0} div(E)=ε0ρ

它表明:电场在某点的散度与该点的电荷密度成正比。

那么,微分篇的第一个方程就此结束了吗?这不过是将高斯电场定律积分形式中的曲面缩小至无穷小,随后两边同时除以体积,右侧得到电荷密度,左侧经整理后得到一个新的物理量,并将其定义为散度而已?事实并非如此。这个散度究竟具有怎样的物理意义?我们应如何具体计算散度(尽管通过无穷小通量定义散度较为简便,但以此进行计算则颇为繁琐)?此外,不少人对麦克斯韦方程组的形式略有了解,虽未能完全理解,但对倒三角符号 ∇ \nabla 尚有印象,为何此公式中未出现该符号呢?

02 初入江湖的 ∇ \nabla

诚然,我们借助无穷小曲面的通量与体积的比值来定义散度,这种定义方式旨在凸显其与通量的关联,同时便于大家从积分思维自然过渡至微分思维。然而,这种定义在实际计算中作用有限,我们不会通过计算无穷小曲面的通量与体积的比值来确定某点的散度,因其过程过于繁琐。实际上,存在一种更为简便的方法来计算电场在某点的散度,而该方法将运用我们熟知的倒三角 ∇ \nabla 符号。

在这种新的表示方法中,电场 E \mathbf{E} E 的散度可表示为 ∇ ⋅ E \nabla \cdot \mathbf{E} E,因此我们可用这一表达式替代方程左侧的 div ( E ) \text{div}(\mathbf{E}) div(E),如此一来,麦克斯韦方程组的第一个方程——描述静电的高斯电场定律的微分形式可写为:

∇ ⋅ E = ρ ε 0 \nabla \cdot \mathbf{E} = \frac{\rho}{\varepsilon_0} E=ε0ρ

这样的表述是否更为熟悉?也就是说,为表示散度,我们用 ∇ ⋅ E \nabla \cdot \mathbf{E} E 替代了原本由无穷小曲面通量与体积比值构成的复杂表达式。并且,这种表述极具计算优势,采用此方式,只要给定一个电场,我们便能迅速得出电场的散度。倒三角 ∇ \nabla 符号无疑是符号简化史上的一项创举。

因此,接下来的核心工作,即理解麦克斯韦方程组微分形式的关键,在于阐明倒三角 ∇ \nabla 符号的含义、 ∇ ⋅ \nabla \cdot (后面附带一个点)的含义、 ∇ ⋅ E \nabla \cdot \mathbf{E} E 能够表示电场 E \mathbf{E} E 散度的原因,以及 ∇ ⋅ E \nabla \cdot \mathbf{E} E 与前文所定义的散度 div ( E ) \text{div}(\mathbf{E}) div(E) 等价的原因,即:

在这里插入图片描述

上述等式为何成立,且二者均可用于表示电场 E \mathbf{E} E 的散度?

正如开篇所述:微分形式的基本思想其实并不复杂,其真正的难点在于探寻一种便捷的计算方法,而这种方法的核心便是 ∇ \nabla 符号。接下来,我们将暂时搁置电磁相关的物理内容,一同探究这一传奇符号 ∇ \nabla 的来龙去脉。理解了它,便掌握了麦克斯韦方程组微分形式的精髓。

03 从导数说起

要理解 ∇ \nabla ,我们还需重新审视衡量事物变化快慢的概念:导数。之所以说“重新审视”,是因为我们在积分篇中已经提到过:法拉第发现了电磁感应,发现变化的磁场能产生电场,而且磁场变化得越快,产生的电场越大。这里就需要一个量来描述磁场变化的快慢,只不过当时我们并未深入展开。

我们仍以身高为例来探讨如何描述变化的快慢。一个人在十二三岁时,一年可以长 10 厘米,我们说他此时长得快;而到了十七八岁时,一年可能只长 1 厘米,我们则说他长得慢。也就是说,我们衡量一个量(此处为身高,假设用 y y y 表示)变化快慢的方法是:给定一个变化的时间 d t dt dt(比如一年,或者更短),观察这个量的变化 Δ y \Delta y Δy,如果这个量的变化较大,我们就说它变化得快,反之则变化得慢。

在这里,我稍作解释: Δ y \Delta y Δy d y dy dy 有何区别?如下图所示,假设函数在 x x x 轴上有一个增量 Δ x \Delta x Δx,用 Δ x \Delta x Δx d x dx dx 表示均可,两者相等。然而,这个 x x x 轴上的变化带来的 y y y 轴上的变化却不相同: Δ y \Delta y Δy 表示 y y y 轴实际的变化量,是我用前后两个不同的 x x x 对应的 y y y 值直接相减得到的真实结果;而 d y dy dy 则不同, d y dy dy 是我们在 M M M 点处作了一条切线,然后用这条直线来近似曲线,当 x x x 轴上变化了 Δ x \Delta x Δx 时,这条直线上对应的 y y y 上的变化。

图片

从图中可以看出: Δ y \Delta y Δy 的值略大于 d y dy dy,但随着 Δ x \Delta x Δx d x dx dx 的减小,它们之间的差值会迅速减小,且比 Δ x \Delta x Δx 减小得快得多。这个差值也是我们常说的高阶无穷小。 Δ y \Delta y Δy 被称为函数从一点到另一点的增量,而 d y dy dy 则被称作函数的微分,或者叫它的线性主部。“以直( d y dy dy)代曲( Δ y \Delta y Δy)”是现代微积分的一个核心思想,从图中可见一斑。

在微积分创立初期,莱布尼茨将 d x dx dx 视为一个接近 0 但又不等于 0 的无穷小量,这种“朴素”的思维很符合直觉,用这种思想进行计算也并无错误,但其基础却非常不牢固。正是这种幽灵般的无穷小量 d x dx dx(时而可以视为 0,时而可以作为除数进行约分)引发了第二次数学危机。经过数学家们一个多世纪的努力,微积分才找到了坚实的理论基础:极限理论

图片

这段内容如果不理解也无妨,只需知道我们可以用 d y d x \frac{dy}{dx} dxdy 表示函数在 M M M 点的导数(即切线的斜率),用它来表示图像在此处变化的快慢即可。

再回到人的身高随年龄变化的例子。人在各个年龄 t t t 都对应一个身高 y y y,每个 ( t , y ) (t, y) (t,y) 就对应图上的一个点,将这些点连起来大致能得到这样一个图:

图片

在导数 d y d t \frac{dy}{dt} dtdy 较大的地方,图形的斜率较大,通俗地说就是曲线较陡峭;而在导数较小的地方,对应的曲线较平缓。

在这个例子中,身高 y y y 随年龄 t t t 变化而变化,即给定任何一个 t t t 的值,都有一个 y y y 的值与之对应,我们就可以说身高 y y y 是一个关于年龄 t t t 的函数(function),记作 y = f ( t ) y = f(t) y=f(t)。这个 f f f 自然是函数的英文单词 function 的缩写,函数就是这样一种对应(映射)关系。在这里,身高 y y y 的值只与年龄 t t t 这一个变量相关,我们称其为一元函数。然而,如果我们的问题稍微复杂一些,某个量不仅与一个变量有关,而是与多个变量有关呢?

04 多个变量的偏导数

例如,山的高度,一座山在不同点的高度各不相同,而在地面上确定一个点的位置需要经度和纬度两个信息。或者,你可以自己在地面上建立一个坐标系,然后地面上每一个点都可以用 ( x , y ) (x, y) (x,y) 来表示。因为每一个位置 ( x , y ) (x, y) (x,y) 都对应了那个地方山的高度 z z z,那么 z z z 就成了一个关于 x x x y y y 的函数,记作 z = f ( x , y ) z = f(x, y) z=f(x,y)。因为山的高度 z z z 需要两个变量 x x x y y y 才能确定,所以我们说 z = f ( x , y ) z = f(x, y) z=f(x,y) 是一个二元函数。

再例如,我房间的每一个点都有一个温度,所以房间的温度 T T T 是一个关于房间内空间点的函数,而房间里每一个点的位置需要长、宽、高三个变量 ( x , y , z ) (x, y, z) (x,y,z) 才能确定。因此,我房间里的温度 T T T 是一个关于 x , y , z x, y, z x,y,z 的三元函数,记作 T = f ( x , y , z ) T = f(x, y, z) T=f(x,y,z)

我们再回过头来看看导数。在一元函数 y = f ( t ) y = f(t) y=f(t) 中,我们用 d y d t \frac{dy}{dt} dtdy 来表示这个函数的导数,导数越大的地方曲线变化得越快。因为一元函数的图像是一个曲线,曲线上的一点只有一个方向(要么向前,要么向后,反正都是沿着 x x x 轴方向),所以我们可以直接用 d y d t \frac{dy}{dt} dtdy 表示函数变化的快慢。然而,如果这个函数不是一元函数,而是二元、三元等多元函数呢?

图片

例如,山的高度 z z z 是关于位置 x , y x, y x,y 的二元函数 z = f ( x , y ) z = f(x, y) z=f(x,y),此时地面上的每一个点 ( x , y ) (x, y) (x,y) 都对应一个值,其函数图像就是一个曲面(如山的表面),而不再是一个曲线。而曲面上的每一个点有无数个方向(前后左右 360° 都可以), x x x y y y 只是这无数方向中的两个,那么我们要如何把握这无数个方向上的高度变化快慢呢?

当然,我们不可能把这无数个方向都一一找出来,也没有这个必要。一个平面上有无数个点,但我们可以只用 x x x y y y 这两个方向组成的 ( x , y ) (x, y) (x,y) 来表示所有的点。同样地,虽然在函数曲面上的一点有无数个方向,不同方向函数变化的快慢都不相同,但我们只要把握其中的两个方向,就能获取很多信息。

那么我们要如何表示函数 z z z 沿着 x x x 轴方向变化的快慢呢?直接用 d z d x \frac{dz}{dx} dxdz 吗?似乎不太合适,因为我们的 z z z 是一个关于 x x x y y y 的二元函数,它的变量有两个,直接用 d z d x \frac{dz}{dx} dxdz 是否合适、是否合法呢?然而,如果我们在考虑 x x x 轴方向的时候,把 y y y 视作一个常数,即把 y y y 轴固定住,这样函数 z z z 就只与 x x x 相关了,于是我们就把一个二元函数(曲面)变成了一个一元函数(曲线)。

图片

如上图所示,当我们将 y y y 固定为 1 时,这个曲面被 y = 1 y = 1 y=1 的平面切割成两半,而平面与曲面相交的地方就出现了一条曲线。这条曲线其实就是当 y y y 固定时,函数 z z z 的图像,只不过此时 z z z 只与 x x x 这一个变量有关,因此它变成了一个一元函数。于是,我们就可以仿照一元函数的方法定义导数了,也就是说:我们在 z = f ( x , y ) z = f(x, y) z=f(x,y) 上无法直接定义导数,但如果我们把 y y y 的值固定下来,此时二元函数的曲面就变成了一元函数的曲线,那么我们就可以在曲线上定义导数了。这种在固定 y y y 的值的情况下,计算函数在 x x x 轴方向上的导数,称为关于 x x x 的偏导数,记作 ∂ z ∂ x \frac{\partial z}{\partial x} xz。同样地,如果我们固定 x x x 的值,计算函数在 y y y 轴方向上的导数,那么自然就是关于 y y y 的偏导数,记作 ∂ z ∂ y \frac{\partial z}{\partial y} yz

05 全微分

有了偏导数的概念,我们就可以写出 d z dz dz d x dx dx d y dy dy 之间的关系了。在一元函数中,导数是 d y d t \frac{dy}{dt} dtdy,我们自然可以写出 d y dy dy d t dt dt 之间的关系:

d y = d y d t d t dy = \frac{dy}{dt} dt dy=dtdydt

那么,到了二元函数 z = f ( x , y ) z = f(x, y) z=f(x,y) 的时候呢?我们设想有一个人在山上从一点爬到另一点,让他先沿着 x x x 轴的方向爬(即固定 y y y 的值),假设他沿 x x x 轴移动了 d x dx dx。根据偏导数的定义,如果我们把 y y y 的值固定下来,那么他在 x x x 轴方向上的导数可以用偏导数 ∂ z ∂ x \frac{\partial z}{\partial x} xz 来表示,那么当他沿着 x x x 轴移动时,他上升的高度就可以表示为 ( ∂ z ∂ x ) d x \left( \frac{\partial z}{\partial x} \right) dx (xz)dx。同样地,当他沿着 y y y 轴方向移动时,他上升的高度可以表示为 ( ∂ z ∂ y ) d y \left( \frac{\partial z}{\partial y} \right) dy (yz)dy。我们将这两个部分上升的高度加起来,不就得到了最终爬山的高度变化 d z dz dz 了吗?也就是说:

d z = ( ∂ z ∂ x ) d x + ( ∂ z ∂ y ) d y dz = \left( \frac{\partial z}{\partial x} \right) dx + \left( \frac{\partial z}{\partial y} \right) dy dz=(xz)dx+(yz)dy

这个公式可以被视作全微分定理,它是对一元函数导数关系的一个自然推广。它告诉我们:虽然在曲面的一个点上有无数个方向,但只要我们掌握了其中 x x x y y y 两个方向上的偏导数,我们就能把握它的函数变化 d z dz dz。还原到爬山的例子中,这个公式是在告诉我们:如果我知道你沿着 x x x 轴和 y y y 轴分别走了多少,然后我知道你这座山在 x x x 轴和 y y y 轴方向的倾斜度(即偏导数)是多少,那么我就知道你爬山的纯高度变化有多少。

我们费了这么多劲推导出这个公式,那么这个公式里肯定隐藏了重要的东西。然而,目前这种形式还不太容易看清楚,我们需要稍微了解一点矢量分析的内容,将公式拆成矢量点乘的形式,这样就会更加明显。

06 再谈矢量点乘

关于矢量点乘的内容,我在积分篇的第六节已经介绍过一次,因为电场的通量 Φ \Phi Φ 就是电场 E \mathbf{E} E 和面积 a a a 的点乘: Φ = E ⋅ a \Phi = \mathbf{E} \cdot a Φ=Ea。由于矢量是既有大小又有方向的量,而我们小时候学习的乘法只管大小不管方向,因此两个矢量之间需要重新定义一套乘法规则,其中最常见的是点乘(符号为“ ⋅ \cdot ”)。

两个矢量 O A \mathbf{OA} OA O B \mathbf{OB} OB 的点乘被定义为: O A ⋅ O B = ∣ O A ∣ ∣ O B ∣ cos ⁡ θ \mathbf{OA} \cdot \mathbf{OB} = |\mathbf{OA}| |\mathbf{OB}| \cos \theta OAOB=OA∣∣OBcosθ(矢量的表示通常在其顶部加箭头,但此处为了方便,我们用黑体表示)。它表示一个矢量 O A \mathbf{OA} OA 在另一个矢量 O B \mathbf{OB} OB 上的投影 O C \mathbf{OC} OC O C = ∣ O A ∣ cos ⁡ θ \mathbf{OC} = |\mathbf{OA}| \cos \theta OC=OAcosθ)和另一个矢量的大小的乘积。显然,两个矢量点乘后的结果是一个标量(只有大小没有方向)。

图片

这些内容在上一篇文章中已经提到过,接下来我们再看看矢量点乘的几个性质。

性质 1:点乘满足交换律,即 O A ⋅ O B = O B ⋅ O A \mathbf{OA} \cdot \mathbf{OB} = \mathbf{OB} \cdot \mathbf{OA} OAOB=OBOA。这是显而易见的,因为根据定义,前者的结果是 ∣ O A ∣ ∣ O B ∣ cos ⁡ θ |\mathbf{OA}| |\mathbf{OB}| \cos \theta OA∣∣OBcosθ,后者的结果是 ∣ O B ∣ ∣ O A ∣ cos ⁡ θ |\mathbf{OB}| |\mathbf{OA}| \cos \theta OB∣∣OAcosθ,它们显然是相等的。

性质 2:点乘满足分配律,即 O A ⋅ ( O B + O C ) = O A ⋅ O B + O A ⋅ O C \mathbf{OA} \cdot (\mathbf{OB} + \mathbf{OC}) = \mathbf{OA} \cdot \mathbf{OB} + \mathbf{OA} \cdot \mathbf{OC} OA(OB+OC)=OAOB+OAOC。这个稍微复杂一些,此处不作证明,留作习题。

性质 3:如果两个矢量相互垂直,那么它们点乘的结果为 0。这很容易理解,如果两个矢量垂直,那么一个矢量在另一个矢量上的投影就是一个点,一个点的大小显然是 0,0 乘以任何数都是 0。如果学过三角函数,从 cos ⁡ 9 0 ∘ = 0 \cos 90^\circ = 0 cos90=0 也能一眼看出来。

性质 4:如果两个矢量方向相同,那么它们点乘的结果就是它们大小的乘积。理解了性质 3,理解性质 4 就很容易了,从 cos ⁡ 0 ∘ = 1 \cos 0^\circ = 1 cos0=1 也能一眼看出。

此外需要注意的是,点乘不满足结合律,即不存在 ( O A ⋅ O B ) ⋅ O C = O A ⋅ ( O B ⋅ O C ) (\mathbf{OA} \cdot \mathbf{OB}) \cdot \mathbf{OC} = \mathbf{OA} \cdot (\mathbf{OB} \cdot \mathbf{OC}) (OAOB)OC=OA(OBOC)。原因在于两个矢量点乘后的结果是一个标量,而标量再去点乘另一个矢量是没有意义的,点乘是两个矢量之间的运算。

我们从小学就开始学习的加法和乘法满足交换律、结合律和分配律,而矢量的点乘除了不满足结合律以外,其他性质都满足。我这样写是为了告诉大家:点乘虽然是一种新定义的运算,但它与我们平常接触的加法、乘法非常相似,大家无需对这种陌生的运算产生恐惧。

07 坐标系下的点乘

矢量既有大小又有方向,我们通常用箭头来表示,箭头的方向代表矢量的方向,箭头的长度代表矢量的大小。如果我们建立一个坐标系,将箭头的一端移动到坐标原点,那么箭头的另一端就会固定在坐标系的某个点上,这样我们就可以用一个坐标点来表示一个矢量。

图片

如上图,点 A A A 的坐标是 ( 4 , 3 ) (4, 3) (4,3),那么矢量 O A \mathbf{OA} OA 可以表示为 ( 4 , 3 ) (4, 3) (4,3)。然后,我们将矢量 O A \mathbf{OA} OA 沿 x x x 轴和 y y y 轴进行分解:

图片

于是,矢量 O A \mathbf{OA} OA 可以表示为: O A = O B + O C \mathbf{OA} = \mathbf{OB} + \mathbf{OC} OA=OB+OC(矢量的加法就是将两个矢量首尾相连,因此 O B + B A = O A \mathbf{OB} + \mathbf{BA} = \mathbf{OA} OB+BA=OA,而 B A = O C \mathbf{BA} = \mathbf{OC} BA=OC,所以有上述结论)。此时,如果我们在 x x x 轴上定义一个单位向量 x ( 1 , 0 ) \mathbf{x} (1, 0) x(1,0),那么 O B \mathbf{OB} OB 的长度是 x \mathbf{x} x 长度的四倍,且它们的方向相同,因此矢量 O B = 4 x \mathbf{OB} = 4\mathbf{x} OB=4x。同样地,在 y y y 轴上定义一个单位向量 y ( 0 , 1 ) \mathbf{y} (0, 1) y(0,1),那么 O C = 3 y \mathbf{OC} = 3\mathbf{y} OC=3y。因此,我们的 O A \mathbf{OA} OA 可以重新写为: O A = O B + O C = 4 x + 3 y \mathbf{OA} = \mathbf{OB} + \mathbf{OC} = 4\mathbf{x} + 3\mathbf{y} OA=OB+OC=4x+3y

这样,任意一个矢量 ( x 1 , y 1 ) (x_1, y_1) (x1,y1) 都可以写成 x 1 x + y 1 y x_1\mathbf{x} + y_1\mathbf{y} x1x+y1y。于是我们成功地将坐标表示的矢量转换为熟悉的加法运算形式。这里需要特别区分: x 1 , y 1 x_1, y_1 x1,y1 是坐标,是数,是标量,而黑体的 x , y \mathbf{x}, \mathbf{y} x,y 代表的是单位矢量。因此,矢量的点乘可以写成如下形式: ( x 1 , y 1 ) ⋅ ( x 2 , y 2 ) = ( x 1 x + y 1 y ) ⋅ ( x 2 x + y 2 y ) (x_1, y_1) \cdot (x_2, y_2) = (x_1\mathbf{x} + y_1\mathbf{y}) \cdot (x_2\mathbf{x} + y_2\mathbf{y}) (x1,y1)(x2,y2)=(x1x+y1y)(x2x+y2y)。由于点乘满足分配律(见性质 2),我们可以直接将上述结果完全展开为: x 1 x 2 x ⋅ x + x 1 y 2 x ⋅ y + y 1 x 2 y ⋅ x + y 1 y 2 y ⋅ y x_1x_2\mathbf{x} \cdot \mathbf{x} + x_1y_2\mathbf{x} \cdot \mathbf{y} + y_1x_2\mathbf{y} \cdot \mathbf{x} + y_1y_2\mathbf{y} \cdot \mathbf{y} x1x2xx+x1y2xy+y1x2yx+y1y2yy

接下来是重点:由于矢量 x \mathbf{x} x y \mathbf{y} y 分别沿着 x x x 轴和 y y y 轴,因此它们是相互垂直的。根据性质 3,如果两个矢量相互垂直,它们的点乘结果为 0。即 x ⋅ y = y ⋅ x = 0 \mathbf{x} \cdot \mathbf{y} = \mathbf{y} \cdot \mathbf{x} = 0 xy=yx=0,因此我们展开式中的中间两项 x 1 y 2 x ⋅ y + y 1 x 2 y ⋅ x x_1y_2\mathbf{x} \cdot \mathbf{y} + y_1x_2\mathbf{y} \cdot \mathbf{x} x1y2xy+y1x2yx 直接等于 0。而根据性质 4, x ⋅ x = y ⋅ y = 1 \mathbf{x} \cdot \mathbf{x} = \mathbf{y} \cdot \mathbf{y} = 1 xx=yy=1(因为 x \mathbf{x} x y \mathbf{y} y 都是长度为 1 的单位矢量,且它们与自身点乘的方向相同)。

因此,我们发现两个矢量点乘后的结果只剩下第一项和第四项的系数部分,即:

( x 1 , y 1 ) ⋅ ( x 2 , y 2 ) = ( x 1 x + y 1 y ) ⋅ ( x 2 x + y 2 y ) = x 1 x 2 + y 1 y 2 (x_1, y_1) \cdot (x_2, y_2) = (x_1\mathbf{x} + y_1\mathbf{y}) \cdot (x_2\mathbf{x} + y_2\mathbf{y}) = x_1x_2 + y_1y_2 (x1,y1)(x2,y2)=(x1x+y1y)(x2x+y2y)=x1x2+y1y2

08 梯度的诞生

对于很多高中生来说,这只是一个非常熟悉的结论,但我还是从头到尾进行了扎实的推导。我们不喜欢那种凭空出现的结论,因此希望读者在阅读我们的文章时,每个结论都是通过严密的逻辑推导得出的。这个公式有什么用呢?我们看看它的后半部分(带箭头的 x \mathbf{x} x y \mathbf{y} y 表示矢量,对应上面公式中的黑体 x \mathbf{x} x y \mathbf{y} y):

图片

再对比一下我们之前推导出的全微分定理:

图片

全微分定理的右边与矢量点乘的右边非常相似,都是两个量相乘后将结果相加。如果我们把 d x dx dx 看作 x 2 x_2 x2 d y dy dy 看作 y 2 y_2 y2,两个偏导数看作 x 1 x_1 x1 y 1 y_1 y1,那么我们就可以按照点乘的公式将全微分定理拆成两个矢量点乘的形式,即 d z dz dz 可以写为:

图片

于是, d z dz dz 被我们拆成了两个矢量点乘的形式。我们再仔细看看这两个矢量:右边的矢量的两个分量分别是 d x dx dx d y dy dy,它们分别表示我沿着 x x x 轴和 y y y 轴移动的无穷小距离,它们相加的结果用 d l d\mathbf{l} dl 表示:

图片

而左边呢?左边的矢量的两个分量分别是函数 z = f ( x , y ) z = f(x, y) z=f(x,y) x x x y y y 的两个偏导数,我们用一个新的符号来表示它:

图片

经过这么多的推导,我们终于看到了 ∇ \nabla 符号。这个 ∇ z \nabla z z 的名称叫作 z z z 的梯度。

将左右两边的矢量单独提取出来后,我们可以将原来的公式写得更加简洁:

图片

这一部分内容信息量较大,对于没有接触过矢量分析的人来说可能会有些难以理解。我们在前面花了大量篇幅讲解全微分 d z dz dz 和矢量的点乘,都是为了引出这个公式,并从中提炼出梯度 ∇ z \nabla z z 的概念。如果理解起来有困难,可以仔细再阅读前面的内容,我们基本上是从零开始逐步推导的,只要耐心阅读,肯定能够理解。

理解了这些概念的来龙去脉之后,我们重点来看一看我们引出的 ∇ z \nabla z z,即 z z z 的梯度。

09 梯度的性质

梯度 ∇ z \nabla z z 是一个矢量,既有大小又有方向。我们先来看看梯度的方向。

我们已经得到了 d z = ∇ z ⋅ d l dz = \nabla z \cdot d\mathbf{l} dz=zdl,将 d z dz dz 表示为两个矢量的点乘。根据矢量点乘的定义,我们可以将其展开为:

在这里插入图片描述

其中, d z dz dz 表示山的高度的一个微小变化。那么,沿着哪个方向移动时,这个变化最快呢?换句话说,选择哪个方向可以使 d z dz dz 的变化最大?

cos ⁡ θ \cos \theta cosθ 表示直角三角形中邻边与斜边的比值,而斜边总是比两个直角边长的,因此它的最大值只能是 1(当 θ = 0 ∘ \theta = 0^\circ θ=0 时),最小值为 0(当 θ = 9 0 ∘ \theta = 90^\circ θ=90 时)。根据上述公式 d z = ∣ ∇ z ∣ ∣ d l ∣ cos ⁡ θ dz = |\nabla z| |d\mathbf{l}| \cos \theta dz=∣∇z∣∣dlcosθ,显然要使 d z dz dz 取得最大值,就必须使 cos ⁡ θ \cos \theta cosθ 取最大值 1,即 ∇ z \nabla z z d l d\mathbf{l} dl 两个矢量的夹角 θ \theta θ 必须为 0°。

两个矢量的夹角为 0° 是什么意思?这意味着这两个矢量的方向相同。也就是说,当我们移动的方向( d l d\mathbf{l} dl 的方向)与梯度 ∇ z \nabla z z 的方向一致时, d z dz dz 的变化最大,即我们爬山的高度变化最大。这告诉我们:梯度 ∇ z \nabla z z 的方向就是高度变化最快的方向,即山坡最陡的方向。

图片

假设你站在山坡上四处眺望,最陡的地方就是梯度的方向。如果你去测量这个方向的斜率,这就是梯度的大小。因此,梯度这个名字是非常形象的。

10 ∇ \nabla 算子

我们再仔细看看梯度 ∇ z \nabla z z 的表示:

图片

这是一个矢量,但它看起来好像 ∇ \nabla 和一个标量 z z z “相乘”。我们把 z z z 提到括号外面,此时梯度 ∇ z \nabla z z 可以写为:

图片

因此,如果单独提取 ∇ \nabla ,就可以得到如下形式:

在这里插入图片描述

这个 ∇ \nabla 本身并不是一个具体的矢量,而是一个算子。具体来说,它是一个矢量微分算子,用于对函数进行操作。当我们把 ∇ \nabla 放在一个函数 z z z 前面时,它会对函数 z z z 进行操作,具体过程是分别对 z z z x x x y y y 的偏导数,最终返回一个矢量,即函数 z z z 的梯度。

换句话说, ∇ \nabla 本身并没有具体的意义,它需要与一个函数结合,才能产生具体的结果。这就好比一个模具:你给它一堆面粉,它经过处理后返回一个饼。显然, ∇ \nabla 本身既不是面粉,也不是饼,它单独存在是没有意义的,只有与面粉结合才能产生有具体意义的东西。

图片

这种东西被称为算子 ∇ \nabla 就是 ∇ \nabla 算子。基于 ∇ \nabla 算子的巨大影响力,它还有许多其他的名字:从它的具体功能来看,它被称为矢量微分算子;因为它是由哈密顿引入的,所以它又被称为哈密顿算子;从读音上来说,它又被称为nabla 算子del 算子。了解这些名称即可,以便在他人讨论时知道他们指的都是 ∇ \nabla 算子。

11 梯度、散度和旋度

∇ \nabla 算子不是一个矢量,除非你把它作用在一个函数上,否则它没啥意义。但是,它在各个方面的表现确实又像一个矢量,只要你把 ∇ \nabla 算子的 “作用” 看成矢量的 “相乘”。

一个矢量一般来说有 3 种 “乘法”:

  1. 矢量 A \mathbf{A} A 和一个标量 a a a 相乘 a A a\mathbf{A} aA。比如我把一个矢量 A \mathbf{A} A 大小变为原来的 2 倍,方向不变,那么这时候就可以写成 2 A 2\mathbf{A} 2A

  2. 矢量 A \mathbf{A} A 和一个矢量 B \mathbf{B} B 进行点乘 A ⋅ B \mathbf{A} \cdot \mathbf{B} AB。这个点乘我们上面介绍很多了, A ⋅ B = ∣ A ∣ ∣ B ∣ cos ⁡ θ \mathbf{A} \cdot \mathbf{B} = |\mathbf{A}||\mathbf{B}|\cos \theta AB=A∣∣Bcosθ,这里就不说了。

  3. 矢量 A \mathbf{A} A 和一个矢量 B \mathbf{B} B 进行叉乘 A × B \mathbf{A} \times \mathbf{B} A×B。这个叉乘跟点乘类似,也是我们单独针对矢量定义的另外一种乘法, ∣ A × B ∣ = ∣ A ∣ ∣ B ∣ sin ⁡ θ |\mathbf{A} \times \mathbf{B}| = |\mathbf{A}||\mathbf{B}|\sin \theta A×B=A∣∣Bsinθ。大家可以看到,这个叉乘跟点乘唯一的区别就是:点乘是两个矢量的大小乘以它们的余弦值 cos ⁡ θ \cos \theta cosθ,叉乘是两个矢量的大小乘以它们的正弦值 sin ⁡ θ \sin \theta sinθ(在直角三角形里,角的对边和斜边的比为正弦 sin ⁡ θ \sin \theta sinθ邻边和斜边的比值为余弦 cos ⁡ θ \cos \theta cosθ)。

那么,同样的,我们的 ∇ \nabla 算子也有 3 种作用方式:

  1. ∇ \nabla 算子作用在一个标量函数 z z z 上: ∇ z \nabla z z。这个 ∇ z \nabla z z 我们上面说过了,它表示函数 z z z梯度,它表示这个函数 z z z 变化最快的方向。

  2. ∇ \nabla 算子跟一个矢量函数 E \mathbf{E} E 点乘 ∇ ⋅ E \nabla \cdot \mathbf{E} E。这就表示 E \mathbf{E} E散度,我们开篇讲的高斯电场定律的左边就是电场 E \mathbf{E} E 的散度,它就是表示成 ∇ ⋅ E \nabla \cdot \mathbf{E} E 这样。

  3. ∇ \nabla 算子跟一个矢量函数 E \mathbf{E} E 叉乘 ∇ × E \nabla \times \mathbf{E} ×E。它叫 E \mathbf{E} E旋度,这个我们后面会再详细说。

在这里插入图片描述

这样,我们就以一种很自然的方式引出了这三个非常重要的概念:梯度 ∇ z \nabla z z散度 ∇ ⋅ E \nabla \cdot \mathbf{E} E旋度 ∇ × E \nabla \times \mathbf{E} ×E。大家可以看到, ∇ \nabla 算子的这三种作用跟矢量的三种乘法是非常相似的,只不过 ∇ \nabla 是一个算子,它必须作用在一个函数上才行,所以我们把上面的标量和矢量换成了标量函数矢量函数

我们在描述山的高度的函数 z = f ( x , y ) z = f(x,y) z=f(x,y) 的时候,不同的点 ( x , y ) (x,y) (x,y) 对应不同的山的高度,而山的高度只有大小没有方向,所以这是个标量函数,我们可以求它的梯度 ∇ z \nabla z z。但是,电场 E \mathbf{E} E 既有大小又有方向,这是一个矢量,所以我们可以用一个矢量函数 E = f ( x , y ) \mathbf{E} = f(x,y) E=f(x,y) 表示空间中不同点 ( x , y ) (x,y) (x,y) 的电场 E \mathbf{E} E 的分布情况。那么对这种矢量函数,我们就不能去求它的梯度了,我们只能去求它的散度 ∇ ⋅ E \nabla \cdot \mathbf{E} E旋度 ∇ × E \nabla \times \mathbf{E} ×E

为了让大家对这些能够有更直观的概念,我们接下来就来仔细看看电场的散度 ∇ ⋅ E \nabla \cdot \mathbf{E} E

12 电场的散度

当我们把电场的散度写成 ∇ ⋅ E \nabla \cdot \mathbf{E} E 这样的时候,我们会觉得:啊,好简洁!但是我们也知道 ∇ \nabla 算子的定义是这样的:

在这里插入图片描述
那么 ∇ ⋅ E \nabla \cdot \mathbf{E} E 就应该写成这样:

而我们知道电场 E \mathbf{E} E 其实是一个矢量函数(不同点对应的电场的情况),那我们还是可以把 E \mathbf{E} E 分解成 x , y , z x, y, z x,y,z 三个分量的和,这三个分量后面跟一个 x , y , z x, y, z x,y,z 方向的单位向量就行了。那么,上面的式子就可以写成这样:

在这里插入图片描述

然后,因为矢量点乘是满足分配律的,所以我们可以把它们按照普通乘法一样展开成四项。而 x , y , z x, y, z x,y,z 是垂直的单位向量,所以 x ⋅ y = y ⋅ x = 0 x \cdot y = y \cdot x = 0 xy=yx=0 x ⋅ x = y ⋅ y = z ⋅ z = 1 x \cdot x = y \cdot y = z \cdot z = 1 xx=yy=zz=1,然后我们最后剩下的就只有这两项了(这一块的推导逻辑跟 “坐标系下的矢量点乘” 那一节一样,觉得有点陌生的可以再返回去看看那一部分):

在这里插入图片描述

这就是电场 E \mathbf{E} E 的散度的最终表达式。其物理意义明确:求解电场 E \mathbf{E} E 的散度,需将矢量函数 E \mathbf{E} E 分解为 x , y , z x, y, z x,y,z 方向上的三个分量函数,分别对各分量函数求偏导数,最后将所得结果求和。

为使读者对该概念形成更直观的认识,以下列举两个示例:

例 1:求函数 y = 2 x + 1 y = 2x + 1 y=2x+1 的导数。

该函数的图像为一条直线(可通过选取若干 x x x 值,代入函数计算对应的 y y y 值,再将这些点绘制于坐标系中验证)。其斜率为 2,即导数为 2。对于一次函数(函数中仅含 x x x 的一次项,不含 x x x 的二次项、三次项等更高次项),其导数等于 x x x 项的系数(如本例中的 2),而常数项(如本例中的 1)对导数无影响

例2:计算电场 E = 2 x + y y \mathbf{E} = 2\mathbf{x} + y\mathbf{y} E=2x+yy 的散度。

首先,我们来分析这个电场 E \mathbf{E} E。在 x x x 方向上( 2 x 2\mathbf{x} 2x),其系数为 2,这意味着电场强度在此方向上是恒定的,始终为 2。然而,在 y y y 方向上( y y y\mathbf{y} yy),其系数为 y y y,这表明随着 y y y 轴方向的延伸,该系数 y y y 将逐渐增大,从而 y y y 方向上的电场强度也随之增强。

因此, E = 2 x + y y \mathbf{E} = 2\mathbf{x} + y\mathbf{y} E=2x+yy 描述了一个在 x x x 轴方向上电场强度不变,而在 y y y 轴方向上电场强度不断增大的电场。为了求得该电场的散度,我们首先需要计算电场的偏导数。那么,如何计算偏导数呢?回忆一下我们是如何引入偏导数概念的:我们固定 y y y 的值,即假设 y y y 为常数,将 y y y 视为一个常数,从而求得对 x x x 的偏导数;同样,将 x x x 视为常数,求函数对 y y y 的偏导数。

在计算函数对 x x x 的偏导数 ∂ E ∂ x \frac{\partial \mathbf{E}}{\partial x} xE 时,应分量计算。对于 E = E x x + E y y \mathbf{E} = E_x \mathbf{x} + E_y \mathbf{y} E=Exx+Eyy,其散度定义为 ∇ ⋅ E = ∂ E x ∂ x + ∂ E y ∂ y \nabla \cdot \mathbf{E} = \frac{\partial E_x}{\partial x} + \frac{\partial E_y}{\partial y} E=xEx+yEy

在本例中, E x = 2 E_x = 2 Ex=2 E y = y E_y = y Ey=y

计算 E x E_x Ex x x x 的偏导数: ∂ E x ∂ x = ∂ ( 2 ) ∂ x = 0 \frac{\partial E_x}{\partial x} = \frac{\partial (2)}{\partial x} = 0 xEx=x(2)=0。(这里无需考虑 y y y 是常数,因为 E x E_x Ex 本身只与 x x x 有关,或更确切地说,与 x x x y y y 都无关,它是一个常数,所以其偏导数为 0。)

计算 E y E_y Ey y y y 的偏导数: ∂ E y ∂ y = ∂ ( y ) ∂ y = 1 \frac{\partial E_y}{\partial y} = \frac{\partial (y)}{\partial y} = 1 yEy=y(y)=1。(这里将 x x x 视为常数是正确的,但 E y E_y Ey 本身只与 y y y 有关,所以直接求导即可。)

因此,电场 E \mathbf{E} E 的散度 ∇ ⋅ E \nabla \cdot \mathbf{E} E 可以表示为这两个偏导数之和: ∇ ⋅ E = ∂ E x ∂ x + ∂ E y ∂ y = 0 + 1 = 1 \nabla \cdot \mathbf{E} = \frac{\partial E_x}{\partial x} + \frac{\partial E_y}{\partial y} = 0 + 1 = 1 E=xEx+yEy=0+1=1,即电场的散度为 1。

尽管这是一个非常简单的电场散度计算例子,但它包含了我们计算偏导数和散度的基本思想。通过这种方法,我们可以轻松地求出电场 E \mathbf{E} E 的散度 ∇ ⋅ E \nabla \cdot \mathbf{E} E

经过上述数学推导,我们现在得到了一个定义明确、计算方便的散度 ∇ ⋅ \nabla \cdot 表达式。然而,你是否还记得我们在开始时提到的散度的定义?我们最初是如何引入散度概念的呢?

我们是从麦克斯韦方程组积分形式引入散度的。高斯电场定律说通过一个闭合曲面的电通量跟这个闭合曲面包含的电荷量成正比,而且这个曲面可以是任意形状。然后我们为了从宏观进入微观,就让这个曲面不停地缩小缩小,当它缩小到无穷小,缩小到只包含了一个点的时候,这时候我们就说通过这个无穷小曲面的通量和体积的比就叫散度(用div表示)。

在这里插入图片描述

也就是说,我们最开始从无穷小曲面的通量定义来的散度和我们上面通过偏导数定义来的散度 ∇ ⋅ \nabla \cdot 指的是同一个东西。即:

在这里插入图片描述

13 为何这两种散度是等价的?

很多人可能觉得难以理解,这两个东西的表达形式和来源都完全不一样,它们怎么会是同一个东西呢?但是它们确实是同一个东西,那我们为什么要弄两套东西出来呢?在最开始我也说了,通过无穷小曲面的通量定义的散度很容易理解,跟麦克斯韦方程组的积分形式的通量也有非常大的联系,但是这种定义不好计算(上面的例 2,你用这种方式去求它的散度试试?),所以我们需要找一种能方便计算、实际可用的方式,这样才出现了 ∇ ⋅ \nabla \cdot 形式的散度。

至于为什么这两种形式是等价的,我给大家提供一个简单的思路。因为这毕竟是面向大众的科普性质的文章,具体的证明过程我就不细说了。真正感兴趣的朋友可以顺着这个思路去完成自己的证明。

证明思路

我们假设有一个边长分别为 Δ x \Delta x Δx Δ y \Delta y Δy Δ z \Delta z Δz 的小长方体,空间中的电场为 E ( x , y , z ) E(x,y,z) E(x,y,z) ,然后假设在这个长方体的正中心有一个点 ( x , y , z ) (x,y,z) (x,y,z),那么这个电场通过这个长方体前面(沿着 x x x 轴正方向)的电场就可以表示为: E x ( x + Δ x / 2 , y , z ) E_x(x+\Delta x/2,y,z) Ex(x+Δx/2,y,z) E x E_x Ex 表示电场在 x x x 方向上的分量(因为我们是考虑长方体上表面的通量,所以只用考虑电场的 x x x 分量),因为中心坐标为 ( x , y , z ) (x,y,z) (x,y,z),那么沿着 x x x 轴移动到表面的坐标自然就是 ( x + Δ x / 2 , y , z ) (x+\Delta x/2,y,z) (x+Δx/2,y,z)。而这个面的面积为 Δ y Δ z \Delta y\Delta z ΔyΔz ,那么通过前面的电通量就可以写成: E x ( x + Δ x / 2 , y , z ) ⋅ Δ y Δ z E_x(x+\Delta x/2,y,z)\cdot\Delta y\Delta z Ex(x+Δx/2,y,z)ΔyΔz

同样的,通过长方体后面(沿着 x x x 轴的负方向)的电通量,就可以写成 E x ( x − Δ x / 2 , y , z ) ⋅ Δ y Δ z E_x(x-\Delta x/2,y,z)\cdot\Delta y\Delta z Ex(xΔx/2,y,z)ΔyΔz 。因为这两个面的方向是相反的(前面后面,一个沿着 x x x 轴正方向,一个沿着负方向),所以,这两个沿着 x x x 轴方向的面的电通量之和 Φ x \Phi_x Φx 就应该是两者相减:
Φ x = E x ( x + Δ x 2 , y , z ) ⋅ Δ y Δ z − E x ( x − Δ x 2 , y , z ) ⋅ Δ y Δ z \Phi_x = E_x(x + \frac{\Delta x}{2}, y, z) \cdot \Delta y \Delta z - E_x(x - \frac{\Delta x}{2}, y, z) \cdot \Delta y \Delta z Φx=Ex(x+2Δx,y,z)ΔyΔzEx(x2Δx,y,z)ΔyΔz

如果我们两边都除以 Δ v \Delta v Δv (其中, Δ v = Δ x Δ y Δ z \Delta v = \Delta x\Delta y\Delta z Δv=ΔxΔyΔz),那么就得到:

Φ x Δ v = E x ( x + Δ x 2 , y , z ) − E x ( x − Δ x 2 , y , z ) Δ x \frac{\Phi_x}{\Delta v} = \frac{E_x(x + \frac{\Delta x}{2}, y, z) - E_x(x - \frac{\Delta x}{2}, y, z)}{\Delta x} ΔvΦx=ΔxEx(x+2Δx,y,z)Ex(x2Δx,y,z)

然后你会发现等式的右边刚好就是偏导数的定义(标准的极限定义)。也就是说,电场通过沿着 x x x 轴的两个面(前后两面)的通量之和就等于电场的 x x x 分量对 x x x 的偏导数:

Φ x Δ v = ∂ E x ∂ x \frac{\Phi_x}{\Delta v} = \frac{\partial E_x}{\partial x} ΔvΦx=xEx

同样的,我们发现电场沿着 y y y 轴的两面(左右两面)和 z z z 轴的两面(上下两面)的电通量之和分别就等于电场的 y y y 分量和 z z z 分量对 y y y z z z 的偏导:

Φ y Δ v = ∂ E y ∂ y , Φ z Δ v = ∂ E z ∂ z \frac{\Phi_y}{\Delta v} = \frac{\partial E_y}{\partial y}, \quad \frac{\Phi_z}{\Delta v} = \frac{\partial E_z}{\partial z} ΔvΦy=yEy,ΔvΦz=zEz

然后我们把这三个式子加起来,左边就是电场通过六个面的通量除以体积,也就是通过这个长方体的通量除以体积,右边就是我们 ∇ ⋅ E \nabla\cdot E E 的形式,这分别就是我们上面两种散度的表示方式,证明完成。

然后我们把这三个式子加起来,左边就是电场通过六个面的通量除以体积,也就是通过这个长方体的通量除以体积,右边就是我们 ∇ ⋅ E \nabla \cdot \mathbf{E} E 的形式,这分别就是我们上面两种散度的表示方式,证明完成

这个证明一时半会没看懂也没关系,感兴趣的可以后面慢慢去琢磨。我只是想通过这种方式让大家明白通过某一方向的两个面的通量这方向的偏导数之间是存在这种对应关系的,这样我们就容易接受无穷小曲面的通量 ∇ ⋅ \nabla \cdot 这两种散度的定义方式了。

这两种散度的定义方式各有所长,比如我们在判断某一点的散度是否为零的时候,我用第一个定义,去看看包含这个点的无穷小曲面的通量是不是为零就行了。如果这一点有电荷,那么这个无穷小曲面的电通量肯定就不为零,它的散度也就不为零;如果这个无穷小曲面没有包含电荷,那这一点的散度一定为 0,这就是高斯电场定律微分方程想要告诉我们的东西。但是,如果你要计算这一点的散度是多少,那还是乖乖的拿起 ∇ ⋅ \nabla \cdot 去计算吧。

14 散度的几何意义

此外,跟梯度一样,散度这个名字也是非常形象的。很多人会跟你说散度表示的是 “散开的程度”,这种说法很容易让初学者误解或者迷惑,比如一个正电荷产生的产生的如下的电场线,它看起来是散开的,所以很多就会认为这里所有的点的散度都是不为零的,都是正的。

图片

但是,根据我们上面分析,散度反映的是无穷小曲面的通量,这直接跟这一点是否有电荷对应。那么,这个图的中心有一个正电荷,那么这点的散度不为零没毛病,但是其他地方呢?其他地方看起来也是散开的,但是其他地方并没有电荷,没有电荷的话,其他点电场的散度就应该为 0(因为这个地方无穷小曲面的通量有进有出,它们刚好抵消了),而不是你看起来的好像是散开的,所以为正。

也就是说,对于一个点电荷产生的电场,只有电荷所在的点的散度不为 0,其他地方的散度都为 0。我们不能根据一个电场看起来是散开的就觉得这里的散度都不为 0,那么,这个散开到底要怎么理解呢?

你可以这么操作:你把电场线都想象成水流,然后拿一个非常轻的圆形橡皮筋放到这里,如果这个橡皮筋的面积变大,我们就说这个点的散度为正,反之为负。如果你把橡皮筋丢在电荷所在处,那么这点所有方向都往外流,那么橡皮筋肯定会被冲大(散度为正);但是在其他地方,橡皮筋会被冲走,但是不会被冲大(散度为 0),因为里外的冲力抵消了。这样,这种散开的模型跟我们无穷小曲面的通量模型就不再冲突了。
图片

15 方程一:高斯电场定律

说了这么多,又是证明不同散度形式(无穷小曲面的通量 ∇ ⋅ \nabla \cdot )的等价性,又是说明不同散度理解方式的同一性无穷小曲面的通量散开的程度),都是为了让大家从更多的维度全方位的理解散度的概念,尽量避开初学者学习散度会遇到的各种坑。理解了这个散度的概念之后,我们再来看麦克斯韦方程组第一个方程 ——高斯电场定律微分形式就非常容易理解了:

∇ ⋅ E = ρ ε 0 \nabla \cdot \mathbf{E} = \frac{\rho}{\varepsilon_0} E=ε0ρ

方程的左边 ∇ ⋅ E \nabla \cdot \mathbf{E} E 表示电场在某一点散度,方程右边表示电荷密度 ρ \rho ρ真空介电常数 ε 0 \varepsilon_0 ε0的比值。为什么右边要用电荷密度 ρ \rho ρ而不是电荷量 Q Q Q呢?因为散度是无穷小曲面的通量体积的比值,所以我们的电量也要除以体积,电量 Q Q Q体积 V V V的比值就是电荷密度 ρ \rho ρ。对比一下它的积分形式:

∮ S E ⋅ d a = Q enc ε 0 \oint_S \mathbf{E} \cdot d\mathbf{a} = \frac{Q_{\text{enc}}}{\varepsilon_0} SEda=ε0Qenc

两边都除以一个体积 V V V,然后曲面缩小到无穷小:左边的通量就变成了电场的散度 ∇ ⋅ E \nabla \cdot \mathbf{E} E,右边的电荷量 Q Q Q就变成了电荷密度 ρ \rho ρ,完美!

麦克斯韦方程组积分形式和微分形式是一一对应的,理解这种对应的关键就是理解散度(和后面的旋度)这两种不同定义方式背后的一致性,它是沟通积分和微分形式的桥梁。理解了它们,我们就能在这两种形式的切换之间如鱼得水,我们就能一看到积分形式就能写出对应的微分形式,反之亦然。

16 方程二:高斯磁场定律

理解了高斯电场定律的微分形式,那么高斯磁场定律的微分形式就能轻松写出来了。因为现在还没有找到磁单极子,磁感线都是闭合的曲线,所以闭合曲面的磁通量一定恒为 0,这就是高斯磁场定律积分形式的思想:

∮ S B ⋅ d a = 0 \oint_S \mathbf{B} \cdot d\mathbf{a} = 0 SBda=0

那么,我们一样把这个曲面缩小到无穷小,通过这个无穷小曲面磁通量就叫磁场的散度,那么方程的左边就变成了磁场的散度,而右边还是 0。也就是说:磁场的散度处处为 0。所以,麦克斯韦方程组第二个方程 ——高斯磁场定律微分形式就是:

∇ ⋅ B = 0 \nabla \cdot \mathbf{B} = 0 B=0

17 旋度

静电和静磁的微分形式我们已经说完了,那么接下来就是磁如何生电法拉第定律了。关于法拉第是如何通过实验一步一步发现法拉第定律的内容,我在[积分篇]里已经详细说了,这里就不再多说。对法拉第定律基本思想积分形式的内容还不太熟悉的请先去看上一篇[积分篇]的内容。

法拉第定律是法拉第对电磁感应现象的一个总结,他发现只要一个曲面的磁通量 B ⋅ a \mathbf{B} \cdot \mathbf{a} Ba)发生了改变,那么就会在曲面的边缘感生出一个旋涡状电场 E \mathbf{E} E出来。这个旋涡状的感生电场我们是用电场的环流来描述的,也就是电场沿着曲面边界进行的线积分

图片

用具体的公式表示就是这样:

在这里插入图片描述

公式左边是电场 E \mathbf{E} E 的环流,用来描述这个被感生出来的电场,而公式的右边是磁通量的变化率,用来表示磁通量变化的快慢。

这个法拉第定律是用积分形式写的,我们现在要得到它的微分形式,怎么办?那当然还是跟我们上面的操作一样:从积分到微分,我把它无限缩小就行了。那么,这里我们把这个非闭合曲面缩小缩小,一直缩小到无穷小,那么我们这里就出现了一个无穷小曲面的环流

还记得我们怎么定义散度的么?散度就是通过无穷小闭合曲面通量和闭合曲面体积的比值,而我们这里出现了一个无穷小非闭合曲面的环流,因为非闭合曲面就没有体积的说法,只有面积。那么,通过无穷小非闭合曲面环流和曲面面积的比值,会不会也有是一个另外什么量的定义呢?

没错,这确实是一个全新的量,而且这个量我们在前面稍微提到了一点,它就是旋度。我们把 ∇ \nabla 算子矢量做类比的时候,说一个矢量有三种乘法:跟标量相乘、点乘和叉乘。那么同样的, ∇ \nabla 算子也有三种作用:作用在标量函数上叫梯度 ∇ z \nabla z z),以点乘的方式作用在矢量函数上被称为散度 ∇ ⋅ z \nabla \cdot \mathbf{z} z),以叉乘的方式作用在矢量函数上被称为旋度 ∇ × z \nabla \times \mathbf{z} ×z)。

也就是说,我们让 ∇ \nabla 算子以叉乘的方式作用在电场 E \mathbf{E} E上,我们就得到了电场 E \mathbf{E} E旋度 ∇ × E \nabla \times \mathbf{E} ×E,而这个旋度的另一种定义就是我们上面说的无穷小非闭合曲面的环流和这个曲面的面积之比。因为旋度的英文单词是curl,所以我们用curl( E \mathbf{E} E)表示电场的旋度。所以,我们就可以写下下面这样的式子:

在这里插入图片描述

跟散度的两种定义方式一样,我们这里的旋度也有 ∇ × \nabla \times ×无穷小曲面的环流两种表述方式。在散度那里,我给大家证明了那两种散度形式等价性,在旋度这里我就不再证明了,感兴趣的朋友可以按照类似的思路去尝试证明一下。

18 矢量的叉乘

因为旋度是 ∇ \nabla 算子叉乘 × \times ×的方式作用在矢量场上,所以这里我们来简单的看一下叉乘。两个矢量 A \mathbf{A} A B \mathbf{B} B点乘被定义为: A ⋅ B = ∣ A ∣ ∣ B ∣ cos ⁡ θ \mathbf{A} \cdot \mathbf{B} = |\mathbf{A}||\mathbf{B}|\cos \theta AB=A∣∣Bcosθ,它们的叉乘则被定义为 ∣ A × B ∣ = ∣ A ∣ ∣ B ∣ sin ⁡ θ |\mathbf{A} \times \mathbf{B}| = |\mathbf{A}||\mathbf{B}|\sin \theta A×B=A∣∣Bsinθ,其中 θ \theta θ 为它们的夹角。单从这样看,它们之间的差别好像很小,只不过一个是乘以余弦 cos ⁡ θ \cos \theta cosθ,另一个是乘以正弦 sin ⁡ θ \sin \theta sinθ

从它们的几何意义来说,点乘表示的是投影,因为 ∣ A ∣ cos ⁡ θ |\mathbf{A}|\cos \theta Acosθ 刚好就是 A \mathbf{A} A B \mathbf{B} B 上的投影,也就是 O C \mathbf{OC} OC 的长度。如下图:

图片

那么叉乘呢?叉乘是 ∣ A ∣ sin ⁡ θ |\mathbf{A}|\sin \theta Asinθ,这是 A C \mathbf{AC} AC 的长度,那么 ∣ A × B ∣ = ∣ A ∣ ∣ B ∣ sin ⁡ θ = ∣ A C ∣ ∣ O B ∣ |\mathbf{A} \times \mathbf{B}| = |\mathbf{A}||\mathbf{B}|\sin \theta = |\mathbf{AC}||\mathbf{OB}| A×B=A∣∣Bsinθ=AC∣∣OB,这是啥?这是面积啊,如果我以 O A \mathbf{OA} OA O B \mathbf{OB} OB 为边长作一个平行四边形,那么 A C \mathbf{AC} AC 就刚好是这个平行四边形的,也就是说,矢量 A \mathbf{A} A B \mathbf{B} B 的叉乘 ∣ A × B ∣ = ∣ A C ∣ ∣ O B ∣ |\mathbf{A} \times \mathbf{B}| = |\mathbf{AC}||\mathbf{OB}| A×B=AC∣∣OB 就代表了平行四边形 O A D B \mathbf{OADB} OADB 的面积

图片

关于矢量的叉乘就说这么多,在前面讲矢量点乘的时候我还详细介绍了点乘的性质坐标运算的方法,那是因为为了自然的引出 ∇ \nabla 算子,不得不讲那些。叉乘也有类似的性质和坐标运算的法则,这个在网上随便一搜或者找一本任意矢量分析的书都能找到。而且,你现在不会熟练的进行叉乘运算,并不会影响你对麦克斯韦方程组微分形式的理解,这里了解一下它的定义和几何意义就行了。

19 方程三:法拉第定律

好,知道了矢量的叉乘,知道了 ∇ × E \nabla \times \mathbf{E} ×E 可以表示电场的旋度,而且知道旋度的定义是:无穷小非闭合曲面的环流和这个曲面的面积之比。那我们再来回过头看一看法拉第定律积分形式

在这里插入图片描述

公式的左边是电场的环流,右边是磁通量的变化率,它告诉我们变化的磁通量会在曲面边界感生出电场。我在[积分篇]里说过,磁通量( B ⋅ a \mathbf{B} \cdot \mathbf{a} Ba)的变化可以有两种方式:**磁场( B \mathbf{B} B的变化和通过曲面面积( S S S)**的变化,我们上面这种方式是把这两种情况都算在内。但是,还有的学者认为只有磁场( B \mathbf{B} B)的变化产生的电场才算法拉第定律,所以法拉第定律还有另外一个版本:

在这里插入图片描述

这个版本的把原来对整个磁通量( B ⋅ d a \mathbf{B} \cdot d\mathbf{a} Bda 的求导变成了只对**磁感应强度 B \mathbf{B} B**的求偏导,这就把磁感线通过曲面面积变化的这种情况给过滤了。

在积分形式里有这样两种区别,但是在微分形式里就没有这种区分了。为什么?你想想我们是怎么从积分变到微分的?我们是让这个曲面不停的缩小缩小,一直缩小到无穷小,这个无穷小的曲面就只能包含一个没有大小的点了,你还让它的面积怎么变?所以我们的微分形式就只用考虑**磁感应强度 B \mathbf{B} B**的变化就行了(对应后面那个法拉第定律)。

我们现在假设把那个曲面缩小到无穷小,方程的左边除以一个面积 Δ S \Delta S ΔS,那就是**电场的旋度 ∇ × E \nabla \times \mathbf{E} ×E**的定义:

在这里插入图片描述

左边除了一个面积 Δ S \Delta S ΔS,那右边也得除以一个面积,右边本来是磁感应强度的变化率 ∂ B ∂ t \frac{\partial \mathbf{B}}{\partial t} tB)和面积的乘积,现在除以一个面积,那么剩下的就是磁感应强度的变化率 ∂ B ∂ t \frac{\partial \mathbf{B}}{\partial t} tB 了。那么,麦克斯韦方程组第三个方程 ——法拉第定律微分形式自然就是这样:

在这里插入图片描述

简洁吧?清爽吧?这样表示之后,法拉第定律微分形式看起来就比积分形式舒服多了,而且它还只有这一种形式。直接从方程上来看,它告诉我们某一点电场的旋度等于磁感应强度的变化率。简单归简单,要理解这种公式,核心还是要理解左边,也就是电场的旋度 ∇ × E \nabla \times \mathbf{E} ×E

20 旋度的几何意义

我们知道旋度的定义是无穷小曲面的环流和面积的比值,但是它既然取了旋度这个名字,那么它跟旋转应该还是有点关系的。我们变化的磁场感生出来的电场也是一个旋涡状的电场。那么,是不是只要看起来像漩涡状的矢量场,它就一定有旋度呢?

图片

这个问题我们在讨论散度的时候也遇到过,很多初学者认为只要看起来发散的东西就是有散度的,然后我们通过分析知道这是不对的。一个点电荷产生静电场,只要在电荷处散度不为零的,在其他地方,虽然看起来是散开的,其实它的散度。如果我们放一个非常轻的橡皮筋在上面,除了电荷所在处,其它地方这个橡皮筋是不会被撑开的(即便会被冲走),所以其他地方的散度都为零。

同样的,在旋度这里,一个变换的磁场会产生一个旋涡状的电场,在旋涡的中心,在磁场变化的这个中心点这里,它的旋度肯定是不为零的。但是,在其它地方呢?从公式上看,其它地方的旋度一定为零,为什么?因为其他地方并没有变化的磁场啊,所以按照法拉第定律微分形式,没有变化的磁场的地方的电场的旋度肯定是 0

散度一样,我们不能仅凭一个感生电场是不是旋转状的来判断这点旋度是否为 0,我们也需要借助一个小道具:小风车。我们把一个小风车放在某一点上,如果这个风车能转起来,就说明这点的旋度不为 0。你只要把风车放在感生电场中心以外的地方,就会发现如果外层的电场线让小风车顺时针转,内层的电场线就会让小风车逆时针转,这两股力刚好抵消了。最终风车不会转,所以旋度为 0。

图片

如果大家能理解静电场除了中心点以外的地方散度处处为零,那么理解感生电场除了中心点以外的地方旋度处处为零就不是什么难事。在非中心点的地方,散度的流入流出两股力量抵消了,旋度顺时针逆时针的两股力量抵消了,为什么刚好他们能抵消呢?本质原因还是因为这两种电场都是随着距离的平方反比减弱。如果它们不遵守平方反比定律,那么你去计算里外的散度和旋度,它们就不再为零。

关于旋度的事情就先说这么多,大家如果理解了旋度,对比法拉第定律的积分方程,要理解它的微分方程是很容易的。我前面花了很大的篇幅给大家讲了矢量的点乘散度,作为类比,理解矢量的叉乘旋度也不是什么难事,它们确实太相似了。

21 方程四:安培 - 麦克斯韦定律

讲完了磁生电的法拉第定律,我们麦克斯韦方程组就只剩最后一个电生磁的安培 - 麦克斯韦定律了。它描述的是电流变化的电场如何产生旋涡状的感生磁场的,因为它电的来源有电流和变化的电场两项,所以它的形式也是最复杂的。方程的积分形式如下(具体过程见[积分篇]):

在这里插入图片描述

左边的磁场的环流,右边是曲面包围的电流(带 enc \text{enc} enc 下标的 I I I)和电场的变化率。它告诉我们,如果我们画一个曲面通过这个曲面的电流和这个曲面里电通量的变化会在曲面的边界感生出一个旋涡状的磁场出来,这个旋涡状的磁场自然是用磁场的环流来描述。

可以想象,当我们用同样的方法把这个曲面缩小到无穷小的时候,如果我们在方程的左右两边都除以这个曲面的面积,那么方程的左边就成了磁场 B \mathbf{B} B 的旋度 ∇ × B \nabla \times \mathbf{B} ×B,右边的两项除以一个面积会变成什么呢?

电通量的变化率除以面积之后就剩下电场的变化率 ∂ E ∂ t \frac{\partial \mathbf{E}}{\partial t} tE,这个跟法拉第定律的磁通量变化率除以面积类似。那么电流(带 enc \text{enc} enc I I I)那一项呢?电流 I I I除以面积得到的东西是什么?这里我们定义了一个新的物理量:电流密度 J \mathbf{J} J。很显然,这个电流密度 J \mathbf{J} J 就是电流除以电流通过的曲面的面积(注意不是体积)。相应的,电流密度的单位是A/m²(安培每平方米)而不是 A/m³。

这样,麦克斯韦方程组第四个方程 ——安培 - 麦克斯韦定律微分形式就自然出来了:

∇ × B = μ 0 J + μ 0 ε 0 ∂ E ∂ t \nabla \times \mathbf{B} = \mu_0 \mathbf{J} + \mu_0 \varepsilon_0 \frac{\partial \mathbf{E}}{\partial t} ×B=μ0J+μ0ε0tE

虽然还是有点长,但是相比积分形式已经是相当简洁了,它告诉我们某一点感生磁场的旋度 ∇ × B \nabla \times \mathbf{B} ×B等于电流密度 J \mathbf{J} J电场变化率 ∂ E ∂ t \frac{\partial \mathbf{E}}{\partial t} tE 两项的叠加。其实它跟积分形式讲的都是一回事,都是在说电流和变化的电场能够产生一个磁场,只不过积分形式是针对一个曲面,而微分形式只是针对一个而已。

22 麦克斯韦方程组

至此,麦克斯韦方程组的四个方程:描述静电高斯电场定律、描述静磁高斯磁场定律、描述磁生电法拉第定律和描述电生磁安培 - 麦克斯韦定律微分形式就都说完了。把它们都写下来就是这样:

在这里插入图片描述

高斯电场定律表明,电场的散度与该点的电荷密度成正比

高斯磁场定律表明,磁场的散度处处为零

法拉第电磁感应定律表明,感生电场的旋度等于磁感应强度的变化率

安培 - 麦克斯韦定律表明,感生磁场的旋度等于电流密度与电场强度变化率之和

这里最引人注目的就是 ∇ \nabla 算子。由点乘叉乘构成的散度 ∇ ⋅ \nabla \cdot 旋度 ∇ × \nabla \times ×麦克斯韦方程组微分形式的核心。这也是为什么我们要从偏导数矢量点乘开始逐步引入 ∇ \nabla 算子的原因。正因如此,微分篇的数学内容比积分篇多得多,也更难理解一些。因此,大家需要多一些耐心。

图片

从思想上来讲,微分形式和积分形式表达的思想是一样的,毕竟它们都是麦克斯韦方程组。它们的差别仅仅在于积分形式是从宏观的角度描述问题,我们面对的宏观上的曲面,所以要用通量环流来描述电场、磁场;而微分形式是从微观的角度来描述问题,这时候曲面缩小都无穷小,我们面对的东西就变成了一个,所以我们使用散度旋度来描述电场、磁场。

这一点是特别要强调的:通量环流是定义在曲面上的,而散度旋度是定义在一个上的。我们可以说通过通过一个曲面的通量或者沿曲面边界的环流,但是当我们在说散度旋度的时候,我们都是在说一个点散度旋度

理解了这些,你再回过头去看看麦克斯韦方程组积分形式

在这里插入图片描述

我们只不过把定义在曲面上的通量环流缩小到了一个点,然后顺势在这个点上用利用通量和环流定义了散度旋度。因为定义散度和旋度分别还除了一个体积面积,所以我们积分方程的右边也都相应的除了一个体积和面积,然后就出现了电荷密度 ρ \rho ρ(电荷 Q Q Q 除以体积 V V V)和电流密度 J \mathbf{J} J(电流 I I I 除以面积 S S S),电通量磁通量那边除以一个体积和面积就剩下电场强度 E \mathbf{E} E 和磁感应强度 B \mathbf{B} B 的变化率,仅此而已。

如果我们从这种角度去看麦克斯韦方程组的积分形式和微分形式,你就会觉得非常的自然和谐。给出积分形式,你一想散度和旋度的定义,就可以立马写出对应的微分形式;给出微分形式,再想一想散度和旋度的定义,也能立刻写出对应的积分形式。当我想从宏观入手的时候,我看到了曲面上的通量环流;当我想从微观入手的时候,我也能立马看到一个点上的散度旋度。积分和微分形式在这里达成了一种和谐的统一。

23 结语

至此,麦克斯韦方程组的 [积分篇][微分篇] 已完整呈现。在这两篇内容中,首先从基础概念入手,引出通量,再以通量为基础,逐步推导出麦克斯韦方程组的积分形式。之后,通过“将曲面收缩至无穷小”的方法,由积分形式进一步推导出对应的微分形式。整个推导过程,始终秉持“通俗且精准”的原则,对于每一个新概念的引入,都进行了充分的前期铺垫,而非突兀地提出。这样做的目的,是为了让更广泛的读者群体能够理解麦克斯韦方程组,尤其是让中学生也能读懂,领略麦克斯韦方程组的精妙之处,进而激发他们对科学的好奇心与热爱,消除他们对“高深”科学知识的畏惧心理:瞧,这般高深的麦克斯韦方程组,年轻的我们同样能够理解并掌握

此外,麦克斯韦方程组蕴含着独特的美感,随着个人物理知识储备的不断丰富,对这种美的感受会愈发深刻。我们更期望大家是因欣赏其美而喜爱这个方程组,而非仅仅因其“重要性”。众所周知,麦克斯韦在建立这套方程组之后,通过方程推导得出了电磁波的存在。当他将相关参数代入计算电磁波的速度时,惊讶地发现,电磁波的速度与实验测量得到的光速高度吻合。基于此,他大胆预言:光本质上是一种电磁波

图片

遗憾的是,英年早逝的麦克斯韦(48 岁离世)未能亲眼见证自己的预言被证实。直到他去世 9 年后,也就是 1888 年,赫兹才首次通过实验证实了“光是一种电磁波”这一结论。

本文主要参考了《电动力学导论》(格里菲斯 著)和《麦克斯韦方程直观》(Daniel Fleisch 著)。


via:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值