一、简要介绍
扩展欧几里得算法(ExGcd)是基于传统欧几里得算法的实现,主要用于计算不定方程 ax+by=gcd(a,b) (a,b∈Z)ax+by=\gcd(a,b)\text{ }(a,b\in\mathbb{Z})ax+by=gcd(a,b) (a,b∈Z) 的一组特殊整数解。类似于传统的欧几里得算法计算 gcd(a,b)\gcd(a,b)gcd(a,b) 时将 gcd(a,b)\gcd(a,b)gcd(a,b) 转化为 gcd(b,amod b)gcd(b,a\mod b)gcd(b,amodb) ,扩展欧几里得算法通过类似的系数辗转相除法求出 x,yx,yx,y 的一组解。
如果我们不使用扩展欧几里得算法计算 ax+by=gcd(a,b)ax+by=\gcd(a,b)ax+by=gcd(a,b) 这样一组不等式,则我们需要使用如下方法:
ax+by=gcd(a,b)ax+by=\gcd(a,b)ax+by=gcd(a,b)
移项,得 ax=gcd(a,b)−byax=\gcd(a,b)-byax=gcd(a,b)−by
系数化为 111 ,得 x=gcd(a,b)−byax=\large{\frac{\gcd(a,b)-by}{a}}x=agcd(a,b)−by
由于在上面的方程中 yyy 未知,所以我们需要枚举每个可能的 yyy 值来搜索 xxx 的值。因此,若搜索范围为 [l,r][l,r][l,r] ,上面的算法时间复杂度将会达到 O(r−l)O(r-l)O(r−l) 。
但是,如果我们使用扩展欧几里得算法求解,我们将会很快得到 x,yx,yx,y 的值,总体的时间复杂度为 O(log(r−l))O(\log(r-l))O(log(r−l)) 。下面,我们将会围绕 ExGcd 算法,介绍其使用前提,算法原理和相应的证明过程。
在本文中,所有 a ∣ ba\text{ }|\text{ }ba ∣ b 的算式均表示 aaa 整除 bbb ,即 bmod a=0b\mod a=0bmoda=0 。
二、扩展欧几里得算法的使用前提
该不定方程组为 ax+by=gcd(a,b) (a,b∈Z)ax+by=\gcd(a,b)\text{ }(a,b\in\mathbb{Z})ax+by=gcd(a,b) (a,b∈Z) 的形式。
其实,这个条件也适用于判断一个形如 ax+by=sax+by=sax+by=s 的方程是否有解。只需判断 smod gcd(a,b)s\mod\gcd(a,b)smodgcd(a,b) 是否等于 000 ,是则有解,否则无解。证明如下:
∵a ∣ gcd(a,b), b ∣ gcd(a,b)\because a\text{ }|\text{ }gcd(a,b),\text{ }b\text{ }|\text{ }gcd(a,b)∵a ∣ gcd(a,b), b ∣ gcd(a,b) (最大公约数的定义),
又 ∵x,y∈Z\because x,y\in\mathbb{Z}∵x,y∈Z ,
∴ax ∣ gcd(a,b),by ∣ gcd(a,b)\therefore ax\text{ }|\text{ }\gcd(a,b),by\text{ }|\text{ }\gcd(a,b)∴ax ∣ gcd(a,b),by ∣ gcd(a,b) ,
∴ax+by ∣ gcd(a,b)\therefore ax+by\text{ }|\text{ }\gcd(a,b)∴ax+by ∣ gcd(a,b) 。
∵s=ax+by\because s=ax+by∵s=ax+by ,
∴gcd(a,b) ∣ s\therefore \gcd(a,b)\text{ }|\text{ }s∴gcd(a,b) ∣ s ,
∴smod gcd(a,b)=0\therefore s\mod\gcd(a,b)=0∴smodgcd(a,b)=0 (模运算的性质)。
因此,我们可以得到,只要方程 ax+by=sax+by=sax+by=s 有解, sss 一定满足 smod gcd(a,b)=0s\mod\gcd(a,b)=0smodgcd(a,b)=0 。
也就是,扩展欧几里得算法对于所有有解的方程 ax+by=sax+by=sax+by=s 均能得出一组特殊解。
三、扩展欧几里得的算法过程和证明以及代码演示
本部分的主要目标是求解方程 ax+by=G (1)ax+by=G\text{ (1)}ax+by=G (1) 的值。令 G=gcd(a,b)G=\gcd(a,b)G=gcd(a,b) 。
假设我们已经求得一组解 x′,y′x',y'x′,y′ ,使得 bx′+(amod b)y′=G (2)bx'+(a\mod b)y'=G\text{ (2)}bx′+(amodb)y′=G (2) ,类似于 gcd(a,b)=gcd(b,amod b)\gcd(a,b)=\gcd(b,a\mod b)gcd(a,b)=gcd(b,amodb) ,则我们可以联立 (1)(2)\text{(1)(2)}(1)(2) ,得到如下的方程组:
{ax+by=G(1)bx′+(amod b)y′=G(2)
\begin{cases}
ax+by=G &\text{(1)}\\
bx'+(a\mod b)y'=G &\text{(2)}
\end{cases}
{ax+by=Gbx′+(amodb)y′=G(1)(2)
由于 GGG 已知,我们可以得到方程
ax+by=bx′+(amod b)y′ax+by=bx'+(a\mod b)y'ax+by=bx′+(amodb)y′
∵amod b=a−b⌊ab⌋\because a\mod b=a-b\lfloor\frac{a}{b}\rfloor∵amodb=a−b⌊ba⌋ ,
∴\therefore∴ 原方程可以化为
ax+by=bx′+(a−b⌊ab⌋)y′ax+by=bx'+(a-b\lfloor\frac{a}{b}\rfloor)y'ax+by=bx′+(a−b⌊ba⌋)y′
去括号,得
ax+by=bx′+ay′−by′⌊ab⌋ax+by=bx'+ay'-by'\lfloor\frac{a}{b}\rfloorax+by=bx′+ay′−by′⌊ba⌋
对于 bbb 合并同类项,得到
ax+by=ay′+b(x′−b⌊ab⌋)ax+by=ay'+b(x'-b\lfloor\frac{a}{b}\rfloor)ax+by=ay′+b(x′−b⌊ba⌋)
由此,我们可以得到方程的一组解:
{x=y′y=x′−b⌊ab⌋
\begin{cases}
x=y' \\
y=x'-b\lfloor\frac{a}{b}\rfloor
\end{cases}
{x=y′y=x′−b⌊ba⌋
代入,得到
ax+by=ay′+b(x′−b⌊ab⌋)⇒ax+by=ax+by′
ax+by=ay'+b(x'-b\lfloor\frac{a}{b}\rfloor) \\
\rArr ax+by=ax+by'
ax+by=ay′+b(x′−b⌊ba⌋)⇒ax+by=ax+by′
∴\therefore∴ 上述解是原方程的一组解。
循环往复,将系数替换再次求解,直到得到 an=G, bn=0a_n=G,\text{ }b_n=0an=G, bn=0 ,再将数据层层带回,得到 x,yx,yx,y 的一组解。
由此,我们可以得到扩展欧几里得算法的代码实现:
int x, y, xx, yy;
void ExGcd(int a, int b)
{
if (b == 0) // 当 b = 0 时,到达递归出口,记录边界解,返回值,层层代入
{
x = 1;
y = 0;
return;
}
ExGcd(b, a % b); // 求解方程 bx' + (a mod b)y' = gcd(a,b)
xx = x, yy = y; // 备份原来的 x' 和 y'
// 代入上面的解
x = yy;
y = xx - b * (a / b);
// 为了节省空间,此处也可以仅备份 x' 的值,因为 y' 的值会立刻赋值给 x 并且 y' 的值与 y 的值无关
}
// x, y 即为答案
三、实例应用和分析
原题链接:洛谷 P1052\text{P1052}P1052 同余方程
使用 ExGcd 的方法:
题目要求我们求以下方程组的解:
ax≡1 (mod b)ax≡1\text{ }(\text{mod } b)ax≡1 (mod b)
设有一个整数 y<0y < 0y<0 ,且满足
ax=−by+1ax=-by+1ax=−by+1
则通过移项可以得到,
ax+by=1ax+by=1ax+by=1
通过上面的证明,我们可以得知 gcd(a,b)=1\gcd(a,b)=1gcd(a,b)=1
∴ax+by=gcd(a,b)\therefore ax+by=\gcd(a,b)∴ax+by=gcd(a,b) ,可以使用 ExGcd 算法求解。
本题需要解决的另外一个问题是如何求得最小的解。我们可以通过下面的方式:
设 p∈Zp \in\mathbb{Z}p∈Z ,则
ax+by+pab−pab=1ax+by+pab-pab=1ax+by+pab−pab=1
转化,可得
a(x+pb)+b(y−pa)=1a(x+pb)+b(y-pa)=1a(x+pb)+b(y−pa)=1
通过调整 kkk 的值,可以确定 xxx 是最小的正整数解。
然而,此题不需要考虑这种情况也可以直接通过。
代码如下,注意由于 2≤a,b≤2×1092 \le a,b \le 2\times 10^92≤a,b≤2×109 ,所以要开 long long
。
#include <bits/stdc++.h>
using namespace std;
long long a, b, x, y, xx, yy;
void ExGcd(long long a, long long b)
{
if (b == 0)
{
x = 1;
y = 0;
return ;
}
ExGcd(b, a % b);
xx = x, yy = y;
x = yy;
y = xx - (a / b) * yy;
}
int main()
{
cin >> a >> b;
ExGcd(a, b);
x = (x % b + b) % b;
cout << x << endl;
return 0;
}