[作者]
常用网名: 猪头三
出生日期: 1981.XX.XX
企鹅交流: 643439947
个人网站: 80x86汇编小站
编程生涯: 2001年~至今[共24年]
职业生涯: 22年
开发语言: C/C++、80x86ASM、Object Pascal、Objective-C、C#、R、Python、PHP、Perl、
开发工具: Visual Studio、Delphi、XCode、C++ Builder、Eclipse
技能种类: 逆向 驱动 磁盘 文件 大数据分析
涉及领域: Windows应用软件安全/Windows系统内核安全/Windows系统磁盘数据安全/macOS应用软件安全
项目经历: 股票模型量化/磁盘性能优化/文件系统数据恢复/文件信息采集/敏感文件监测跟踪/网络安全检测
专注研究: 机器学习、股票模型量化、金融分析
[描述]
用 Taylor 定理(带余项的形式)来严格推导
ln
(
1
−
u
)
=
−
u
−
u
2
2
−
u
3
3
−
⋯
≈
−
u
\ln(1 - u) \;=\;-u \;-\;\frac{u^2}{2}\;-\;\frac{u^3}{3}\;-\cdots \;\approx\;-u
ln(1−u)=−u−2u2−3u3−⋯≈−u
重点在于写出"余项"(remainder)的表达式, 并说明它为什么相对第一项很小, 从而可以忽略. 以下分几步来展开.
1. Taylor 定理(拉格朗日余项形式)概述
设 f f f 在 a a a 的某邻域内具有 n + 1 n+1 n+1 阶连续导数, 那么在点 a a a 处对 f ( x ) f(x) f(x) 做 n n n 阶 Taylor 展开, 有:
f ( x ) = P n ( x ) + R n ( x ) f(x) \;=\; P_n(x) \;+\; R_n(x) f(x)=Pn(x)+Rn(x)
其中
-
P n ( x ) P_n(x) Pn(x) 是关于 a a a 点的 n n n 阶 Taylor 多项式:
P n ( x ) = f ( a ) + f ′ ( a ) ( x − a ) + f ′ ′ ( a ) 2 ! ( x − a ) 2 + ⋯ + f ( n ) ( a ) n ! ( x − a ) n P_n(x) \;=\; f(a) \;+\; f'(a)(x-a) \;+\; \frac{f''(a)}{2!}(x-a)^2 \;+\;\cdots+\; \frac{f^{(n)}(a)}{n!}(x-a)^n Pn(x)=f(a)+f′(a)(x−a)+2!f′′(a)(x−a)2+⋯+n!f(n)(a)(x−a)n
-
R n ( x ) R_n(x) Rn(x) 是 Lagrange 格式的余项:
R n ( x ) = f ( n + 1 ) ( ξ ) ( n + 1 ) ! ( x − a ) n + 1 , 对某个 ξ 在 a 与 x 之间. R_n(x) \;=\; \frac{f^{(n+1)}(\xi)}{(n+1)!}\,(x - a)^{\,n+1}, \quad \text{对某个 } \xi \text{ 在 }a\text{ 与 }x\text{ 之间.} Rn(x)=(n+1)!f(n+1)(ξ)(x−a)n+1,对某个 ξ 在 a 与 x 之间.
在本题中, 令
f ( u ) = ln ( 1 − u ) , a = 0 f(u) = \ln(1 - u), \qquad a = 0 f(u)=ln(1−u),a=0
希望展开到一阶(即 n = 1 n=1 n=1), 然后考察余项 R 1 ( u ) R_1(u) R1(u) 的大小.
2. 计算各阶导数, 并写出一阶多项式与余项
对 f ( u ) = ln ( 1 − u ) f(u)=\ln(1 - u) f(u)=ln(1−u), 在 u = 0 u=0 u=0 处计算导数:
-
f ( u ) = ln ( 1 − u ) f(u) = \ln(1 - u) f(u)=ln(1−u).
-
第一阶导数:
f ′ ( u ) = d d u [ ln ( 1 − u ) ] = − 1 1 − u f'(u) = \frac{d}{du}\bigl[\ln(1-u)\bigr] = -\,\frac{1}{1 - u} f′(u)=dud[ln(1−u)]=−1−u1
因此 f ′ ( 0 ) = − 1 1 − 0 = − 1. f'(0) = -\,\frac{1}{1 - 0} = -1. f′(0)=−1−01=−1.
-
第二阶导数:
f ′ ′ ( u ) = d d u [ − 1 1 − u ] = − ( − 1 ) ( 1 − u ) − 2 = − 1 ( 1 − u ) 2 f''(u) = \frac{d}{du}\Bigl[-\,\tfrac{1}{1-u}\Bigr] = -\,\bigl(-1\bigr)\,(1-u)^{-2} = -\,\frac{1}{(1 - u)^2} f′′(u)=dud[−1−u1]=−(−1)(1−u)−2=−(1−u)21
所以 f ′ ′ ( u ) f''(u) f′′(u) 在 u u u 处的取值是 − 1 ( 1 − u ) 2 -\tfrac{1}{(1-u)^2} −(1−u)21, 在后面会用到.
2.1 一阶 Taylor 多项式 P 1 ( u ) P_1(u) P1(u)
以 a = 0 a=0 a=0 展开到一阶:
P 1 ( u ) = f ( 0 ) + f ′ ( 0 ) u = ln ( 1 − 0 ) + ( − 1 ) u = 0 − u = − u P_1(u) \;=\; f(0) \;+\; f'(0)\,u \;=\; \ln(1 - 0) \;+\; \bigl(-1\bigr)\,u \;=\; 0 \;-\; u \;=\; -\,u P1(u)=f(0)+f′(0)u=ln(1−0)+(−1)u=0−u=−u
于是
P 1 ( u ) = − u P_1(u) = -\,u P1(u)=−u
2.2 余项 R 1 ( u ) R_1(u) R1(u)
按 Lagrange 余项公式( n = 1 n=1 n=1 情况), 存在某个 ξ \xi ξ 位于 0 0 0 与 u u u 之间, 使得
R 1 ( u ) = f ′ ′ ( ξ ) 2 ! ( u − 0 ) 2 = f ′ ′ ( ξ ) 2 u 2 R_1(u) \;=\; \frac{f''(\xi)}{2!}\;(u - 0)^2 \;=\; \frac{f''(\xi)}{2}\;u^2 R1(u)=2!f′′(ξ)(u−0)2=2f′′(ξ)u2
因为 f ′ ′ ( u ) = − 1 ( 1 − u ) 2 f''(u) = -\,\dfrac{1}{(1 - u)^2} f′′(u)=−(1−u)21, 所以
f ′ ′ ( ξ ) = − 1 ( 1 − ξ ) 2 , 其中 ξ ∈ ( 0 , u ) f''(\xi) = -\,\frac{1}{\bigl(1 - \xi\bigr)^2}, \quad \text{其中 } \xi \in (0,\,u)\, f′′(ξ)=−(1−ξ)21,其中 ξ∈(0,u)
这样,
R 1 ( u ) = 1 2 [ − 1 ( 1 − ξ ) 2 ] u 2 = − u 2 2 ( 1 − ξ ) 2 , 其中 ξ ∈ ( 0 , u ) R_1(u) \;=\; \frac{1}{2}\,\Bigl[-\,\frac{1}{(1 - \xi)^2}\Bigr]\;u^2 \;=\; -\,\frac{u^2}{2\,\bigl(1 - \xi\bigr)^2}, \quad \text{其中}\;\xi\in(0,u) R1(u)=21[−(1−ξ)21]u2=−2(1−ξ)2u2,其中ξ∈(0,u)
因此完整地写出一阶展开连余项:
ln ( 1 − u ) = P 1 ( u ) + R 1 ( u ) = ( − u ) + ( − u 2 2 ( 1 − ξ ) 2 ) , 0 < ξ < u < 1 \boxed{ \ln\bigl(1 - u\bigr) \;=\; P_1(u) + R_1(u) \;=\; \bigl(-\,u\bigr) \;+\; \Bigl(-\,\frac{u^2}{2(1-\xi)^2}\Bigr), \quad 0 < \xi < u < 1 } ln(1−u)=P1(u)+R1(u)=(−u)+(−2(1−ξ)2u2),0<ξ<u<1
3. 为什么可以近似成 − u -\,u −u
从上式
ln ( 1 − u ) = − u − u 2 2 ( 1 − ξ ) 2 , 0 < ξ < u < 1 \ln(1-u) = -\,u \;-\;\frac{u^2}{2\,(1-\xi)^2}, \quad 0<\xi<u<1 ln(1−u)=−u−2(1−ξ)2u2,0<ξ<u<1
看到余项
R 1 ( u ) = − u 2 2 ( 1 − ξ ) 2 . R_1(u) = -\,\frac{u^2}{2\,(1 - \xi)^2}. R1(u)=−2(1−ξ)2u2.
只要 u \,u u 很小, 就有 0 < ξ < u ≪ 1 0 < \xi < u \ll 1 0<ξ<u≪1, 于是
1 − ξ > 1 − u ≈ 1 , 可以大致认为 ( 1 − ξ ) 2 ≈ 1 1 - \xi \;>\; 1 - u \approx 1, \quad \text{可以大致认为 } (1 - \xi)^2 \approx 1 1−ξ>1−u≈1,可以大致认为 (1−ξ)2≈1
那么
∣ R 1 ( u ) ∣ = u 2 2 ( 1 − ξ ) 2 ≤ u 2 2 ( 1 − u ) 2 |R_1(u)| = \frac{u^2}{2\,(1 - \xi)^2} \;\le\; \frac{u^2}{2\,(1 - u)^2} ∣R1(u)∣=2(1−ξ)2u2≤2(1−u)2u2
在"生日悖论"里, u = k 365 \,u = \tfrac{k}{365} u=365k 且 k < n ≪ 365 k < n\ll 365 k<n≪365, 所以
u = k 365 ≪ 1 , 1 − u ≈ 1 u = \frac{k}{365} \ll 1, \quad 1 - u \approx 1 u=365k≪1,1−u≈1
从而
∣ R 1 ( u ) ∣ ≈ u 2 2 |R_1(u)| \;\approx\; \frac{u^2}{2} ∣R1(u)∣≈2u2
相比于主项 − u \,-u −u, 这个余项大约是
u 2 / 2 u = u 2 ≪ 1 \frac{u^2/2}{\,u\,} \;=\; \frac{u}{2}\ll 1 uu2/2=2u≪1
也就是说, 当 u u u 很小, 比如 u ≈ 0.05 u\approx 0.05 u≈0.05(大约是 18 365 \tfrac{18}{365} 36518 左右), 余项相对于 − u -u −u 只有百分之几的量级, 就可以忽略不计.
因此, 便常常直接写:
ln ( 1 − u ) = − u − u 2 2 ( 1 − ξ ) 2 ⏟ 较小的余项 ≈ − u \ln\bigl(1 - u\bigr) \;=\; -\,u \;-\;\underbrace{\frac{u^2}{2(1-\xi)^2}}_{\text{较小的余项}} \;\approx\; -\,u ln(1−u)=−u−较小的余项 2(1−ξ)2u2≈−u
把余项丢掉, 而不影响整体上的近似精度.
4. 补充:更高阶的完全展开式
如果不只留一阶而想把二阶、三阶等都写出来, 可以把 Taylor 展到第 m m m 阶(典型地 m m m 趋于 ∞ \infty ∞), 就得到
ln ( 1 − u ) = − u − u 2 2 − u 3 3 − ⋯ − u m m + R m ( u ) \ln(1 - u) = -\,u \;-\;\frac{u^2}{2} \;-\;\frac{u^3}{3} \;-\;\cdots \;-\;\frac{u^m}{m} \;+\; R_m(u) ln(1−u)=−u−2u2−3u3−⋯−mum+Rm(u)
其中
R m ( u ) = f ( m + 1 ) ( ξ ) ( m + 1 ) ! u m + 1 , f ( m + 1 ) ( u ) = − ( m ) ! ( 1 − u ) m + 1 , ξ ∈ ( 0 , u ) R_m(u) = \frac{f^{(m+1)}(\xi)}{(m+1)!}\;u^{\,m+1}, \quad f^{(m+1)}(u) = -\,\frac{(m)!}{(1 - u)^{\,m+1}}, \quad \xi\in(0,u) Rm(u)=(m+1)!f(m+1)(ξ)um+1,f(m+1)(u)=−(1−u)m+1(m)!,ξ∈(0,u)
因此
R m ( u ) = − ( m ) ! ( m + 1 ) ! u m + 1 ( 1 − ξ ) m + 1 = − u m + 1 ( m + 1 ) ( 1 − ξ ) m + 1 R_m(u) = -\,\frac{(m)!}{(m+1)!}\,\frac{u^{\,m+1}}{(1-\xi)^{\,m+1}} = -\,\frac{u^{\,m+1}}{(m+1)\,(1-\xi)^{\,m+1}} Rm(u)=−(m+1)!(m)!(1−ξ)m+1um+1=−(m+1)(1−ξ)m+1um+1
当只关心"保留到一阶"的近似, 直接写出:
ln ( 1 − u ) = − u − u 2 2 − u 3 3 − ⋯ ⏟ 全部归入余项 ≈ − u \ln(1 - u) = -\,u \;-\; \underbrace{\frac{u^2}{2}\!-\!\frac{u^3}{3}\!-\cdots}_{\text{全部归入余项}} \;\approx\; -\,u ln(1−u)=−u−全部归入余项 2u2−3u3−⋯≈−u
同样地, 这里的" u 2 2 + u 3 3 + ⋯ \frac{u^2}{2} + \frac{u^3}{3} + \cdots 2u2+3u3+⋯"恰好对应了用 Lagrange 余项控制的那些高阶项之和.
[总结]
- 按 Taylor 定理 带 Lagrange 余项的形式, 令 f ( u ) = ln ( 1 − u ) f(u)=\ln(1 - u) f(u)=ln(1−u), 在 u = 0 u=0 u=0 处做一阶展开, 可得
ln ( 1 − u ) = P 1 ( u ) + R 1 ( u ) = ( − u ) + ( − u 2 2 ( 1 − ξ ) 2 ) , 0 < ξ < u < 1 \begin{aligned} \ln(1 - u) &= P_1(u) + R_1(u) = \bigl(-\,u\bigr) + \Bigl(-\,\frac{u^2}{2(1-\xi)^2}\Bigr), \quad 0<\xi<u<1 \end{aligned} ln(1−u)=P1(u)+R1(u)=(−u)+(−2(1−ξ)2u2),0<ξ<u<1
- 当
u
≪
1
u \ll 1
u≪1 时, 余项
R 1 ( u ) = − u 2 2 ( 1 − ξ ) 2 \displaystyle R_1(u) = -\frac{u^2}{2(1-\xi)^2} R1(u)=−2(1−ξ)2u2
相对于一阶主项 − u -u −u 来说是更高阶 “ O ( u 2 ) O(u^2) O(u2)” 的小量, 可以忽略. - 因此在实际应用(比如生日悖论中
u
=
k
/
365
u = k/365
u=k/365, 且
k
k
k 比较小时)就直接近似:
ln ( 1 − u ) ≈ − u \displaystyle \ln(1-u)\approx -\,u ln(1−u)≈−u
这样就按照 f ( x ) = P n ( x ) + R n ( x ) f(x)=P_n(x)+R_n(x) f(x)=Pn(x)+Rn(x) 给出了完整的余项形式, 并说明了为什么可以只取 − u -u −u 而忽略其它高阶项.希望这个推导能让你更清楚地理解为何 ln ( 1 − u ) \ln(1-u) ln(1−u) 能"直接约等于" − u -u −u.

被折叠的 条评论
为什么被折叠?



