EOJ1810 稀疏矩阵三元组转化

本文介绍了稀疏矩阵的概念及其实现转置的三种方法,包括复杂度k+klogk的排序法、复杂度n*k的逐列扫描法以及复杂度n+k的快速转置法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

稀疏矩阵定义:

稀疏矩阵的原理是将矩阵中的非零元素用一个三元组来表示,然后保存在数组中,而那些零元素就不保存,从而达到压缩的目的。三元组(i, j, k)表示第i行第j列的值是k。所以一个矩阵就可以用一个数组来表示了,数组的每一个元素就是一个三元组,并且排列的顺序是,行号递增,如果行号相等,则列号递增。

如何实现稀疏矩阵的转置:

矩阵的转置就是将i行j列的元素放到j行i列。对于三元组我们要将(i, j, k)转变成(j, i, k)。有三种方法可以实现转置。

假如一个m行n列的矩阵,转化成三元组存储以后有k个三元组。

第一种:复杂度k+klogk。将稀疏矩阵的每一个三元组(i, j, x)变成(j, i, x),然后再按照行号递增,如果行号相等,则列号递增的顺序qsort一次。

int cmp(const void*a, const void*b)
{
    int *aa = (int*)a, *bb = (int*)b;
    if (aa[0] != bb[0])
        return aa[0] - bb[0];
    return aa[1] - bb[1];
}

void mat_transpose(int a[][3])//将原稀疏矩阵转置
{
    for (int i=0; i<k; i++)
        swap(a[i][0], a[i][1]);
    qsort(a, k, sizeof(a[0]), cmp);
}

第二种:复杂度n*k。将原来的稀疏矩阵三元组扫描一遍,找出所有列号为1的(在转置之后的矩阵中行号为1),放到转置之后的矩阵里面,第二次再扫描一遍,找出所有列号2的(转置之后行号是2),放到转置之后的矩阵里面。重复n遍就行了。

void mat_transpose(int a[][3], int b[][3])//将a转置放在b中
{
    int len = 0;
    for (int r=0; r<n; r++)
    {
        for (int i=0; i<k; i++)
        {
            if (a[i][1] == r)
            {
                b[len][0] = a[i][1];
                b[len][1] = a[i][0];
                b[len++][2] = a[i][2];
            }
        }
    }
}

第三种:复杂度n+k。首先计算出转置之后的矩阵每一行有多少个元素(其实也就是计算转置前每一列有多少个元素)。然后再根据这个结果我们就可以得到,转置之后在稀疏矩阵三元组数组中第i行的开始位置。假如我们现在知道了转置之后矩阵第一行有2个元素,第二行有3个元素,第3行有四个元素。那么我们就可以知道,第一行开始的位置是1,第二行开始的位置是3,第三行开始的位置是6,第四行开始的位置是10。然后我们开始扫描转置前的三元组数组,假如现在扫描到了一个三元组(3, 2 ,1), 因为他的列号是2,所以转置之后在第二行,根据我们刚才计算的答案,它在数组中的位置应该是3,所以就把(2, 3, 1)放到三的位置,同时一定要记得把第二行开始的位置加1,因为刚才的位置已经被放上东西了。这样一来就构造完成了。

void fast_mat_transpose(int a[][3], int b[][3])//将a转置放在b中
{
    int x[1005], y[1005];//x[i]表示转置之后的矩阵第i行有多少元素,y[i]表示转置之后第i行的开始位置  
    memset(x, 0, sizeof(x));
    for (int i=0; i<k; i++)
        x[a[i][1]]++;
    y[0] = 0;
    for (int i=1; i<n; i++)
        y[i] = y[i - 1] + x[i - 1];
    for (int i=0; i<k; i++)
    {
        int &j = y[a[i][1]];
        b[j][0] = a[i][1];
        b[j][1] = a[i][0];
        b[j][2] = a[i][2];
        j++;
    }
}


### 关于EOJ DNA排序问题的解题思路 在处理EOJ中的DNA排序问题时,主要挑战在于如何高效地完成字符串数组的排序以及去重操作。由于题目涉及两个测试点可能因时间复杂度较高而超时,因此需要优化算法设计。 #### 数据结构的选择 为了降低时间复杂度并提高效率,可以引入`std::map`或者`unordered_map`来辅助实现去重功能[^1]。这些数据结构能够快速判断某项是否存在集合中,并支持高效的插入和查找操作。具体来说: - 使用 `std::set` 可以自动去除重复元素并对结果进行升序排列; - 如果还需要自定义比较逻辑,则可以选择基于哈希表的数据结构如 `unordered_set` 配合手动排序。 #### 排序策略 对于给定的一组DNA序列(通常表示为长度固定的字符串),按照字典顺序对其进行排序是一个常见需求。C++标准库提供了非常方便的方法来进行此类任务——即利用 `sort()` 函数配合合适的比较器函数对象或 lambda 表达式来指定所需的排序规则。 下面展示了一个简单的例子用于说明如何读取输入、执行必要的预处理步骤(包括但不限于删除冗余条目),最后输出经过整理的结果列表: ```cpp #include <bits/stdc++.h> using namespace std; int main(){ set<string> uniqueDNAs; string line, dna; while(getline(cin,line)){ stringstream ss(line); while(ss>>dna){ uniqueDNAs.insert(dna); // 自动过滤掉重复项 } } vector<string> sortedUnique(uniqueDNAs.begin(),uniqueDNAs.end()); sort(sortedUnique.begin(),sortedUnique.end()); for(auto it=sortedUnique.cbegin();it!=sortedUnique.cend();++it){ cout<<*it; if(next(it)!=sortedUnique.cend())cout<<" "; } } ``` 上述程序片段实现了基本的功能模块:从标准输入流逐行解析得到各个独立的DNA片段;借助 STL 容器特性轻松达成无重复记录维护目的;最终依据字母大小关系重新安排各成员位置后再统一打印出来[^3]。 #### 学习延伸至自然语言处理领域 值得注意的是,在计算机科学特别是机器学习方向上,“上下文”概念同样重要。例如 Word2Vec 这样的技术就是通过考察周围词语环境来捕捉特定词汇的意义特征[^2]。尽管两者应用场景差异显著,但从原理层面看均体现了对局部模式挖掘的关注。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值