[PAT乙级]1080 MOOC期终成绩 (思路+精简代码)

1080 MOOC期终成绩

对于在中国大学MOOC(http://www.icourse163.org/ )学习“数据结构”课程的学生,想要获得一张合格证书,必须首先获得不少于200分的在线编程作业分,然后总评获得不少于60分(满分100)。总评成绩的计算公式为 G=(G​mid−term​​ ×40%+G​final​​ ×60%),如果 G​mid−term​​ >G​final​​ ;否则总评 G 就是 G​final​​ 。这里 G​mid−term​​ 和 G​final​​ 分别为学生的期中和期末成绩。

现在的问题是,每次考试都产生一张独立的成绩单。本题就请你编写程序,把不同的成绩单合为一张。

输入格式:
输入在第一行给出3个整数,分别是 P(做了在线编程作业的学生数)、M(参加了期中考试的学生数)、N(参加了期末考试的学生数)。每个数都不超过10000。

接下来有三块输入。第一块包含 P 个在线编程成绩 G​p​​ ;第二块包含 M 个期中考试成绩 G​mid−term​​ ;第三块包含 N 个期末考试成绩 G​final​​ 。每个成绩占一行,格式为:学生学号 分数。其中学生学号为不超过20个字符的英文字母和数字;分数是非负整数(编程总分最高为900分,期中和期末的最高分为100分)。

输出格式:
打印出获得合格证书的学生名单。每个学生占一行,格式为:

学生学号 G​p​​ G​mid−term​​ G​final​​ G

如果有的成绩不存在(例如某人没参加期中考试),则在相应的位置输出“−1”。输出顺序为按照总评分数(四舍五入精确到整数)递减。若有并列,则按学号递增。题目保证学号没有重复,且至少存在1个合格的学生。

输入样例:

6 6 7
01234 880
a1903 199
ydjh2 200
wehu8 300
dx86w 220
missing 400
ydhfu77 99
wehu8 55
ydjh2 98
dx86w 88
a1903 86
01234 39
ydhfu77 88
a1903 66
01234 58
wehu8 84
ydjh2 82
missing 99
dx86w 81

输出样例:

missing 400 -1 99 99
ydjh2 200 98 82 88
dx86w 220 88 81 84
wehu8 300 55 84 84

思路:稍微有些复杂的排序题,需要使用 Hash(散列) 来快速配对学号与结构体数组。
依旧直接给出生成哈希值 i d id id 的算法 i d = ( i d ∗ 8 + N a m e [ j ] − 48 ) % 10007 id = (id * 8 + Name[j] - 48) \% 10007 id=(id∗8+Name[j]−48)%10007
存在哈希冲突的可能性,即不同学号计算所得的哈希值相同。若冲突,则可进行线性探测
本题中,在记录编程分时,每个学号都要对应唯一的位置(编程分低于200不记录),当冲突时,通过将哈希值每次+17,探测下一位置是否被占用来解决。若没被占用,则该位置可分配给它。
而在记录后续分数时,若冲突,每次都要比较输入的学号是否与当前哈希值对应学号一致,若不一致,进行线性探测。若最后探测到了空位置,说明该学号的编程分不足200,不予记录。

能否从根本上解决哈希冲突呢?可以的,因为本题最大数据量在2万到3万左右。通过修改哈希值生成算法,使散列数据在更大范围內均匀分布,可以很大程度上避免冲突产生,因为冲突产生的原因主要在于“位置不够”和“过于集中”。
给出本题生成无冲突哈希值 i d id id 的算法 i d = ( i d ∗ 10 + N a m e [ j ] − 48 ) % 70007 id = (id * 10 + Name[j] - 48) \% 70007 id=(id∗10+Name[j]−48)%70007

代码1(有哈希冲突)

#include <stdio.h>
#include <string.h>
#include <algorithm>
struct student {
	char name[21] = { 0 };
	int Gp = 0, Gm = -1, Gf = 0, G = 0;
}s[10001];
bool cmp(student a, student b) { return a.G != b.G ? a.G > b.G : strcmp(a.name, b.name) < 0; }
int main() {
	int P, M, N, mark, id = 0, valid = 0, hash[20000] = { 0 };
	char Name[21] = { 0 };
	scanf("%d %d %d", &P, &M, &N);
	for (int i = 0, k = 1; i < P; i++, k++, id = 0) {	//编程分
		scanf("%s %d", Name, &mark);
		if (mark >= 200) {
			for (int j = 0; Name[j]; j++) id = (id * 8 + Name[j] - 48) % 10007;	//生成hash值
			while (hash[id]) id += 17;  //冲突则线性探测
			hash[id] = k;   //k对应在s[]中的位置(从1开始按顺序放置)
			strcpy(s[k].name, Name);
			s[k].Gp = mark;
		}
	}
	for (int i = 0; i < M; i++, id = 0) {	//期中分
		scanf("%s %d", Name, &mark);
		for (int j = 0; Name[j]; j++) id = (id * 8 + Name[j] - 48) % 10007;
		while (s[hash[id]].Gp && strcmp(Name, s[hash[id]].name) != 0) id += 17;  //冲突则线性探测
		if (s[hash[id]].Gp) s[hash[id]].Gm = mark;
	}
	for (int i = 0; i < N; i++, id = 0) {	//期末分
		scanf("%s %d", Name, &mark);
		for (int j = 0; Name[j]; j++) id = (id * 8 + Name[j] - 48) % 10007;
		while (s[hash[id]].Gp && strcmp(Name, s[hash[id]].name) != 0) id += 17;
		if (s[hash[id]].Gp) {
			s[hash[id]].Gf = mark;
			s[hash[id]].G = (s[hash[id]].Gm > mark ? 0.4 * s[hash[id]].Gm + 0.6 * mark + 0.5 : s[hash[id]].Gf);
			s[hash[id]].G < 60 ? s[hash[id]].G = 0 : valid++;	//若不低于60,记录合格,否则清除总分,排序靠后
		}
	}
	std::sort(s + 1, s + P + 1, cmp);	//数据不多,直接按最大数据量排序
	for (int i = 1; i < valid + 1; i++) printf("%s %d %d %d %d\n", s[i].name, s[i].Gp, s[i].Gm, s[i].Gf, s[i].G);
	return 0;
}

代码2(无哈希冲突)

#include <stdio.h>
#include <string.h>
#include <algorithm>
struct student {
	char name[21] = { 0 };
	int Gp = 0, Gm = -1, Gf = 0, G = 0;
}s[10001];
bool cmp(student a, student b) { return a.G != b.G ? a.G > b.G : strcmp(a.name, b.name) < 0; }
int main() {
	int P, M, N, mark, id = 0, valid = 0, hash[70010] = { 0 };
	char Name[21] = { 0 };
	scanf("%d %d %d", &P, &M, &N);
	for (int i = 0, k = 1; i < P; i++, k++, id = 0) {	//编程分
		scanf("%s %d", Name, &mark);
		if (mark >= 200) {
			for (int j = 0; Name[j]; j++) id = (id * 10 + Name[j] - 48) % 70007;	//生成hash值
			hash[id] = k;   //k对应在s[]中的位置(从1开始按顺序放置)
			strcpy(s[k].name, Name);
			s[k].Gp = mark;
		}
	}
	for (int i = 0; i < M; i++, id = 0) {	//期中分
		scanf("%s %d", Name, &mark);
		for (int j = 0; Name[j]; j++) id = (id * 10 + Name[j] - 48) % 70007;
		if (s[hash[id]].Gp) s[hash[id]].Gm = mark;
	}
	for (int i = 0; i < N; i++, id = 0) {	//期末分
		scanf("%s %d", Name, &mark);
		for (int j = 0; Name[j]; j++) id = (id * 10 + Name[j] - 48) % 70007;
		if (s[hash[id]].Gp) {
			s[hash[id]].Gf = mark;
			s[hash[id]].G = (s[hash[id]].Gm > mark ? 0.4 * s[hash[id]].Gm + 0.6 * mark + 0.5 : s[hash[id]].Gf);
			s[hash[id]].G < 60 ? s[hash[id]].G = 0 : valid++;	//若高于60,有效数据增加,否则清除总分,排序靠后
		}
	}
	std::sort(s + 1, s + P + 1, cmp);	//数据不多,直接按最大数据量排序
	for (int i = 1; i < valid + 1; i++) printf("%s %d %d %d %d\n", s[i].name, s[i].Gp, s[i].Gm, s[i].Gf, s[i].G);
	return 0;
}

备注:C++下用map实现更为便捷,此处不再给出代码,只对三种做法效率进行比较,可以看到差距不大。
[PAT乙级]1080 MOOC期终成绩 (思路+精简代码)

上一篇:算法-BFS


下一篇:python中递归调用