L2-039 清点代码库 (25 分)

题目

L2-039 清点代码库 (25 分)
上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”

这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。

输入格式:
输入在第一行中给出 2 个正整数,依次为 N(≤10^​4),
和 M(≤10​^2),对应功能模块的个数和系列测试输入的个数。

随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。

输出格式:
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。

注:所谓数列 { A​1 , …, AM} 比 { B​1, …, B​M} 大,是指存在 1≤i<M,使得 A1=B1,…,A​i=B​i 成立,且 A​i+1>B​i+1 。

输入样例

7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74

输出样例

4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35

思路

这这道题主要难点在于如何存数据,如果按照常规使用数组存数据操作会比较麻烦,这里我们采用了vector容器来存最初的目的是因为本题中需要用到序列的排序,但是直接使用vector比较运算符会超时,所以后来改为了遍历判断。

数据存储

用vector数组来存储输入的所有整数数据,用map<vector< int >, int>来统计数据出现的次数,待全部输入完,将数据以及统计信息存入定义好的结构体中,并进行排序输出。

代码

#include<iostream>
#include<algorithm>
#include<vector>
#include<set>
#include<map>
#include<string>

using namespace std;
map<vector<int>, int> mp;
set<vector<int> > st;
int n, m;
typedef struct node{
	int num;
	vector<int> v;
}node;
node a[10005];
vector<int> v[10005];
bool cmp(node x, node y){
	if(x.num == y.num){
		for(int i=0; i < x.v.size(); i++){
            //这一块卡时间
			if(x.v[i] < y.v[i]){
				return 1;
			}
			if(x.v[i] > y.v[i]){
				return 0;
			}
		}
		return x.v < y.v;
	}else{
		return x.num > y.num;
	}
}
int main(){
	cin>>n>>m;
	for(int i=0; i < n; i++){
		for(int j=0; j < m; j++){
			int x;
			cin>>x;
			v[i].push_back(x);
		}
		mp[v[i]]++;
	}
	int k=0;
	for(int i=0; i < n; i++){
		if(mp[v[i]] && !st.count(v[i])){
			st.insert(v[i]);
			a[k].num = mp[v[i]];
			a[k].v = v[i];
			k++;
		}
	}
	cout<<k<<endl;
	sort(a, a+k, cmp);
	for(int i=0; i < k; i++){
		cout<<a[i].num;
		for(int j=0; j < a[i].v.size(); j++){
			cout<<" "<<a[i].v[j];
		}
		cout<<endl;
	}
	return 0;
}
上一篇:AI TALK | 云原生时代的微服务架构与关键技术


下一篇:L1-039 古风排版 (20 分)—团体程序设计天梯赛