题目描述
求 aa 乘 对 pp 取模的值,其中 。
算法分析
【算法一】快速乘
仿照矩阵快速幂,b=c0×20+c1×21+...+ck×2kb=c0×20+c1×21+...+ck×2k,将 a×ba×b 拆成 a×c0×20+a×c1×21+...+a×ck×2ka×c0×20+a×c1×21+...+a×ck×2k,分步取模即可,时间复杂度 O(log2b)O(log2b)。
【算法二】利用 a×bmodp=a×b−⌊a×bp⌋×pa×bmodp=a×b−⌊a×bp⌋×p
使用 long double
储存 ⌊a×bp⌋⌊a×bp⌋ 的值,因为 long double
的有效精度为 18~1918~19 位,精度不满足的时候会自动舍去低位(类比科学计数法),保留了较高的位,再除以 pp 就能保证精度在我们要求的范围内。
然后利用整数运算自动舍去高位,保留低位,而 与 ⌊a×bp⌋×p⌊a×bp⌋×p 的差在低位的范围之内,所以可以用 long long int
保存,注意自动舍去低位后 a×ba×b 的值可能小于 ⌊a×bp⌋×p⌊a×bp⌋×p,因此还需要对结果进行一些额外的处理。
代码实现
【算法一】
#include <cstdio>
typedef unsigned long long int ll;
ll p;
ll mul(ll a,ll b) {
ll ans=0;
while(b) {
if(b&1) ans=(ans+a)%p;
a=(a+a)%p;b>>=1;
}
return ans%p;
}
int main() {
ll a,b;
scanf("%lld%lld%lld",&a,&b,&p);
printf("%lld\n",mul(a,b));
return 0;
}
【算法二】
#include <cstdio>
typedef long long int ll;
ll mul(ll a,ll b,ll p) {
a%=p;b%=p;
ll c=(long double)a*b/p;
ll ans=a*b-c*p;
if(ans<0) ans+=p;
else if(ans>=p) ans-=p;
return ans;
}
int main() {
ll a,b,p;
scanf("%lld%lld%lld",&a,&b,&p);
printf("%lld\n",mul(a,b,p));
return 0;
}