熵 (Entropy)
李天岩
|
在我們日常生活中,似乎經常存在看「不確定性」的問題。比方說,天氣預報員常說「明天下雨的可能性是 70%。這是我們習以為常的「不確定性」問題的一個例子。一般不確定性問題所包含「不確定」(uncertainty) 的程度可以用數學來定量地描述嗎?在多數的情況下是可以的。本世紀40年代末,由於信息理論 (information theory) 的需要而首次出現的 Shannon 熵,50年代末以解決遍歷理論 (ergodic theory) 經典問題而嶄露頭角的 Kolmogorov 熵,以及60年代中期,為研究拓樸動力系統 (topological dynamical system) 而產生的拓樸熵 (topological entropy) 等概念,都是關於不確定性的數學度量。它們在現代動力系統和遍歷理論中,扮演看十分重要的角色。在自然科學和社會科學中的應用也日趨廣泛。本文的主旨在於引導盡量多的讀者在這一引人入勝的領域中尋幽訪勝,而不必在艱深的數學語言中躑躅不前。物理、化學家們也許對他們早已熟悉的熱力學熵更覺親切。我們在最後一節也將給古典的 Boltzmann 熵作一番數學的描述。
設想我們有兩枚五分硬幣,一枚硬幣表面光滑,材料均勻,而另一枚硬幣則表面粗糙,奇形怪狀。我們把硬幣上有人頭的那面叫正面,另一面稱反面。然後在一個光滑的桌面上旋轉硬幣,等它停下來後,看是正面或是反面。這是一個不確定性的問題:可能是正面,可能是反面。第一枚硬幣,由於正面和反面的對稱性,正面或反面朝上的機率各為一半。但對第二枚硬幣來說,由於材料磨損,正面和反面不再對稱。可能正面朝上的機率為 70%,反面朝上的機率為 30%。對「究竟會是正面?或會是反面?」這一不確定性問題來說,第一枚硬幣「不確定」的程度顯然比第二枚硬幣要大了許多。若要下賭注的話,我想還是下第二枚硬幣的正面朝上,較為保險,不是嗎?現在假設鑄幣局的先生們別出心裁,把硬幣設計成圖1-1所示的形狀,其上為正,其下為反,則無論我們怎樣旋轉它,最終總是正面朝上。它「不確定」的度量應該為零-其結果在未旋轉前都已確定,那來什麼「不」確定度呢?
有了這些直接的觀察,我們可以在數學上做文章了。假設樣本空間 (Sample space) X 有 n 的基本事件 (events),其基本事件 wi 的概率為 pi, i=1,2,…,n。我們記之為
下面我們來證明一個重要結論:
由定理中(*)式可知,若對某一個 i 有 pi=1,則 因此,我們可以給出如下關於熵的定義,這個定義的熵 (entropy),又稱為 shannon 熵。
在本節之初,我們已知旋轉光滑硬幣時,正面朝上有
這節定義的熵起源於信息理論的研究。是 C. Shannon 在1948年引進的。在此基礎上,蘇聯數學家 A.N. Kolmogorov 在1958年給出了動力系統熵的概念。從而揭開了現代遍歷理論研究的新篇章。 |
熵 (Entropy) (第 2 頁) 李天岩 |
.原載於數學傳播十三卷三期 .作者當時任教於美國密西根州立大學數學系 ‧對外搜尋關鍵字 |
熵 (Entropy) (第 3 頁) 李天岩 |
.原載於數學傳播十三卷三期 .作者當時任教於美國密西根州立大學數學系 ‧對外搜尋關鍵字 |
連續性是自然界的基本屬性之一。數學上連續的概念是由拓樸來刻劃的。拓樸空間 X 中由所有開集生成的 Borel 代數相當於測度空間裡的 假設 X 為一個緊緻 (compact) Hausdorff 空間, 當
![]() 若 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]()
![]() 我們還是用 ![]() ![]() ![]() ![]()
要使上述關於拓樸熵的定義合理,我們必須證明定義3-1中的極限的存在。為此我們求助於下列仍然是初等微積分的結果。
拓樸嫡是由 R. Adler, A. Konhein 及 M. McAndrew 在1965年引進的,它是為了研究關於拓樸共軛不變量應運而生的。拓樸共軛的定義可如下給出。
我們可以證明,拓樸熵是拓樸共軛性的一個不變量。也就是說,兩個拓樸共軛的連續映射有相同的拓樸熵,反之亦然。事實上兩個拓樸共軛的連續映射在本質上給出相同的遍歷性質,因此,拓樸熵數學地刻劃了不同共軛類的拓樸動力系統 (Topological dynamical system) 的性質。 我們已知拓樸空間 X 加上其全體開集張成的 Borel
本節拓樸熵中,空間為緊緻的假設並非必要。 70年代初 Dinaburg 和 Bowen 分別給出了拓樸熵的等價定義。這些定義的優越性在於它們引導了一系列關於拓樸熵和測度熵(Kolmogorov 熵) 之間聯繫結果的證明。Bowen 的定義是對更廣泛的距離空間上一致連續映射族而言的。且導致了 n-環面上自同構拓樸熵公式的幾何證明。可惜,這位在遍歷理論研究中做出突出成就的數學家剛過而立之年就與世長辭了。 |
熵 (Entropy) (第 4 頁) 李天岩 |
.原載於數學傳播十三卷三期 .作者當時任教於美國密西根州立大學數學系 ‧對外搜尋關鍵字 |
熱力學中熵是一個極其重要的概念,最初由 Clausius 引進。後來 L. Boltzmann 在他發表在1866年關於氣體動力學理論的開創性工作中給出了熵的另一形式。這個熵在物理、化學的若干領域裡自始至終扮演著關鍵性的角色。可是 Boltzmann 熵和我們先前定義的 Kolmogorov 熵或拓樸熵並非一致。儘管如此,它們在數學的背景下,仍存在著千絲萬縷的聯繫。在這最後一節,我們將遨遊於 Boltzmann 熵的數學描述。 設
![]() 的非負函數了 f(x) 稱為密度函數,其集合記為 D。易見等式
![]() 定義了 ![]() ![]() ![]()
![]()
![]()
由
即,
![]() 簡化之,我們便有有名的 Gibbs 不等式,
![]() 任給函數 ![]()
![]() 由於 ![]() ![]()
![]() 在有限的樣本空間 (X,p1,…,pn) 中,Shannon 熵在 p1=p2= … =pn=n 時為最大,Boltzmann 熵在概率測度空間裡也有類似的性質。
為了描述一些與Boltzmann熵有關的條件極值問題。我們引進一些概率論常用的術語。設X為一個隨機變量(Random Variable) ,即X為某一固定樣本空間上的可測實函數。 f(x)為這個測度空間的密度函數,則
![]() 稱為 X 的期望值 (Expected Value 或 Expectation)。而數
![]() 則稱為 X 的變異數 (variance)。期望值是關於於隨機變量 X 平均值的一個度量,變異數則表示隨機變量偏離其平均值的程度。下列性質,可以輕易的被驗證:
設有一列獨立隨機變量
![]() 則,
![]()
我們標準化 Sn,即令
![]() 則 ![]() 概率理論中有個非常重要的基本定理:中央極限定理 (central limit theorem)。它大概的意思是說,在漸近狀態下,通常隨機變量 Tn 的概率分佈 (Probability distribution) 是遵循 Gauss 分佈規律的,也就是說,
![]() 其中 P 為樣本空間的概率分佈。 但是,為什麼大家都遵循的是 Gauss 分佈規律,而不是其他的分佈規律呢?事實上,這和熱力學第二定律有異曲同工之妙。熱力學第二定律大致上說,自然界的規律是,一切動態系統都是在向「熵」高的方向發展。從這個角度來看,在 記
類似地,記
上述兩命題,可推廣到下述一般情形。設
![]() 則H(f)在此約束下,最大值的密度函數應為
![]() 其中r為一常數。同樣,若有兩個約束
![]() 和
![]() 則密度函數
![]() 給出了H(f)在這兩個約束下的最大值H(f0),其中r1,r2為兩常數。更一般地,我們有
特別,當 m=1 時,若 g(x) 看成是系統的能量時, f0(x)= z-1 e-rg(x) 恰好就是 Gibbs 典型分怖函數,且 |