L2-3 清点代码库(补题记录)

该博客讲述了在面试中遇到的一个问题,即如何在含有几亿行代码的阿里代码库中找出重复的功能模块。问题被简化为判断模块的输出是否相同,并给出了输入输出格式和解题思路。博主最初使用set和map处理,但在理解题目要求和优化比较方式后,最终使用了map<vector<int>, int>和自定义排序的vector<node>结构实现了AC代码。

L2-3 清点代码库(补题记录)

在这里插入图片描述
上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。

输入格式
输入在一行中给出2个整数,依次为N(<=104)和M(<=102),对应功能模块的个数和系统测试输入的个数。
随后N行,每行给出一个功能模块的M个对应输出,数字间以空格分离。

输出格式
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
注:所谓数列{A1,…AM}比{B1,…,BM}大,是指存在1<=i<M,使得A1 = B1, …, Ai = Bi成立,且Ai+1 > Bi+1

输入样例

7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74

输出样例

4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35

解题思路
21年的天梯赛,这道题是一个“简单题”,通过题目易知只需要将所给序列去重排序后就能AC了。我刚开始的思路是,去重用set,统计个数用mp<string, int>。比赛时我就是将序列当作字符串进行统计,当时没理解数量相同时按序列大小递增输出是啥意思,再加上对map不熟练,只得17分。下来补题时才明白了序列大小是啥意思,起初比较序列大小时是将字符串转化成数组再来比较,发现会超时,后来通过看别人AC代码才发现竟然可以用vector直接比较序列大小(比较规则是从前往后遍历每一个元素,返回第一个不相等的元素的比较结果),啊这(我直接一个拖鞋甩出题人脸上),这不明摆着欺负我们这些小白嘛。好了AC思路:用map<vector, int>存模块数量,然后将模块和数量用结构体来存并装入一个vector中,这里用结构体数组的话会超时,重载排序规则。最后输出。
(代码包含的知识还有很多没懂,先呈上)

AC代码

#include <bits/stdc++.h>

using namespace std;
const int N = 1e4+9;
map<vector<int>, int>mp;//存模块和数量<
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值