HDU 4914 Linear recursive sequence(矩阵乘法递推的优化)

本文深入探讨了X姐论文中关于矩阵乘法递推优化的方法,并提供了实际的C++代码实现,旨在提高计算效率。主要内容包括复数运算、快速傅里叶变换(FFT)算法以及模运算优化等关键技术。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题解见X姐的论文 矩阵乘法递推的优化,只是mark一下。。


#include 
#include 
#include 
#include 
using namespace std;
typedef __int64 ll;
const double pi = acos(-1.0);
const int N = 10000+5;
const double eps = 1e-6;
const int MOD = 119;

struct Complex {
        double x,y;
        Complex(double _x=0,double _y=0)
                        :x(_x),y(_y) {}
        Complex operator + (const Complex& tt)const { return Complex(x+tt.x,y+tt.y); }
        Complex operator - (const Complex& tt)const { return Complex(x-tt.x,y-tt.y); }
        Complex operator * (const Complex& tt)const { return Complex(x*tt.x-y*tt.y,x*tt.y+y*tt.x); }
};
void FFT(Complex *a, int n, int rev) {
        // n是大于等于相乘的两个数组长度的2的幂次
        // 从0开始表示长度,对a进行操作
        // rev==1进行DFT,==-1进行IDFT
        for (int i = 1,j = 0; i < n; ++ i) {
                for (int k = n>>1; k > (j^=k); k >>= 1);
                if (i= MOD)    x -= MOD;
}

void mul(int *tmp1, int *tmp2, int maxn) {
    //for(int i = 0;i < q; i++)   printf("%d ", tmp1[i]); puts("");
    //for(int i = 0;i < q; i++)   printf("%d ", tmp2[i]); puts("");
    for(int i = 0;i < maxn; i++) {
        a1[i].x = a1[i].y = a2[i].x = a2[i].y = 0;
        if(i < q)   {
            a1[i].x = 1.0*tmp1[i];
            a2[i].x = 1.0*tmp2[i];
        }
    }
    FFT(a1, maxn, 1); FFT(a2, maxn, 1);
    for(int i = 0;i < maxn; i++)    a1[i] = a1[i]*a2[i];
    FFT(a1, maxn, -1);
    for(int i = 0;i < maxn; i++)    Fuck[i] = (ll)(a1[i].x+eps)%MOD;
    for(int i = q*2-2;i >= q; i--) {
        if(Fuck[i]) {
            Fuck[i-q] = (Fuck[i-q] + Fuck[i]*b)%MOD;
            Fuck[i-p] = (Fuck[i-p] + Fuck[i]*a)%MOD;
        }
    }
    //printf("q = %d\n", q);
    for(int i = 0;i < q; i++) {
        tmp1[i] = (int)Fuck[i];
    }
}

int ans[N], tmp[N], f[N];

int solve() {
    a %= MOD; b %= MOD;
    f[0] = 1;
    for(int i = 1;i < q; i++) {
        if(i-p < 0) f[i] = a+b;
        else if(i < q)  f[i] = (a*f[i-p]+b)%MOD;
    }
    if(n < q) {
        return f[n];
    }
    int maxn = 1;
    while(maxn <= (q-1)*2)  maxn <<= 1;
    for(int i = 0;i < q; i++)    ans[i] = tmp[i] = 0;
    ans[0] = 1; tmp[1] = 1;
    int fuck = n;
    while(n) {
        if(n&1) {
            mul(ans, tmp, maxn);
        }
        mul(tmp, tmp, maxn);
        n >>= 1;
    }
    int ret = 0;
    for(int i = 0;i < q; i++) {
        Add(ret, ans[i]*f[i]%MOD);
    }
    n = fuck;
    return ret;
}

int main() {
    while(input()) {
        printf("%d\n", solve());
    }
    return 0;
}

### HDU 2544 题目分析 HDU 2544 是关于最短路径的经典问题,可以通过多种方法解决,其中包括基于邻接矩阵的 Floyd-Warshall 算法。以下是针对该问题的具体解答。 --- #### 基于邻接矩阵的 Floyd-Warshall 实现 Floyd-Warshall 算法是一种动态规划算法,适用于计算任意两点之间的最短路径。它的时间复杂度为 \( O(V^3) \),其中 \( V \) 表示节点的数量。对于本题中的数据规模 (\( N \leq 100 \)),此算法完全适用。 下面是具体的实现方式: ```cpp #include <iostream> #include <algorithm> using namespace std; const int INF = 0x3f3f3f3f; int dist[105][105]; int n, m; void floyd() { for (int k = 1; k <= n; ++k) { // 中间节点 for (int i = 1; i <= n; ++i) { // 起始节点 for (int j = 1; j <= n; ++j) { // 结束节点 if (dist[i][k] != INF && dist[k][j] != INF) { dist[i][j] = min(dist[i][j], dist[i][k] + dist[k][j]); } } } } } int main() { while (cin >> n >> m && (n || m)) { // 初始化邻接矩阵 for (int i = 1; i <= n; ++i) { for (int j = 1; j <= n; ++j) { if (i == j) dist[i][j] = 0; else dist[i][j] = INF; } } // 输入边的信息并更新邻接矩阵 for (int i = 0; i < m; ++i) { int u, v, w; cin >> u >> v >> w; dist[u][v] = min(dist[u][v], w); dist[v][u] = min(dist[v][u], w); // 如果是有向图,则去掉这一行 } // 执行 Floyd-Warshall 算法 floyd(); // 输出起点到终点的最短距离 cout << (dist[1][n] >= INF ? -1 : dist[1][n]) << endl; } return 0; } ``` --- #### 关键点解析 1. **邻接矩阵初始化** 使用二维数组 `dist` 存储每一对节点间的最小距离。初始状态下,设所有节点对的距离为无穷大 (`INF`),而同一节点自身的距离为零[^4]。 2. **输入处理** 对于每条边 `(u, v)` 和权重 `w`,将其存储至邻接矩阵中,并取较小值以防止重边的影响[^4]。 3. **核心逻辑** Floyd-Warshall 的核心在于三重循环:依次尝试通过中间节点优化其他两节点间的距离关系。具体而言,若从节点 \( i \) 到 \( j \) 可经由 \( k \) 达成更优解,则更新对应位置的值[^4]。 4. **边界条件** 若最终得到的结果仍为无穷大(即无法连通),则返回 `-1`;否则输出实际距离[^4]。 --- #### 性能评估 由于题目限定 \( N \leq 100 \),因此 \( O(N^3) \) 的时间复杂度完全可以接受。此外,空间需求也较低,适合此类场景下的应用。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值