数据结构---KMP模式匹配病毒感染人的DNA检测

数据结构—KMP模式匹配病毒感染人的DNA检测

原理:参考趣学数据结构

代码:

#include<stdio.h>
#include<stdlib.h>
#define N 100
int next[N];
void getNext(char *T, int *next, int m) {//求解当前字符前面的最大公共前缀和后缀
	int j = 1, k = 0;
	next[j] = 0;//从1开始计算
	while (j <= m) {
		if (k == 0 || T[k] == T[j]) {//从下标0开始计算
			++j;
			++k;
			next[j] = k;
			/*if (T[k] == T[j]) {//改进的更新next数组的方法,减少不必要的回退
				next[j] = next[k];//没比较的可能
			}
			else {//也就是只有不相等的时候才有比较的可能
				next[j]=k;//与当前k位置的字符比较
			}*/
		}
		else {
			k = next[k];//回退查找前面的最大公共前缀和后缀
		}
	}
	printf("next数组值:");
	for (int i = 1; i <= m; i++) {
		printf("%d ", next[i]);
	}
	printf("\n");
}
int KMP(char * S, char* T, int pos, int n, int m) {//KMP算法进行模式匹配
	int i = pos, j = 1;
	while (i <= n && j <= m) {
		if (j == 0 || S[i] == T[j]) {
			i++;
			j++;
		}
		else {
			j = next[j];//根据最大公共前缀和后缀计算的next数组,j回退而i不回退
		}
	}
	if (j = m + 1) {//返回查找成功子串的初始位置
		printf("查找成功子串的初始位置为:%d\n", i - j);
		return i - j;
	}
	printf("查找子串失败!\n");
	return -1;
}
void haveAffectionV(char *S,char* T,int n,int m) {//检查人的DNA是否被病毒的变种感染
	char TT[10];//存储病毒的变种 m个变种,不采用二倍线性扩展变种,使用循环取余变种
	for (int i = 0; i <= m-1; i++) {//移动的步数
		for (int j = 1; j <= m; j++) {
			if (i + j <= m) {
				TT[j] = T[i + j];
			}
			else {//对循环重新开始的数取%(m+1)再加1对应下标的字符
				TT[j] = T[(i + j) % (m + 1)+1];
			}
		}
		for (int k = 1; k <= n; k++) {//遍历主串
			printf("%c", S[k]);
		}
		printf("\n");
		for (int k = 1; k <= m; k++) {//遍历子串
			printf("%c", TT[k]);
		}
		printf("\n");
		KMP(S, TT, 1, n, m);//模式匹配
		printf("\n");
	}
}
int main() {
	char S[18] = "-adecadecadcbadcb";
	char T[10] = "-adecadcb";//'\0'字符串结束的标识
	getNext(T, next, 8);//计算next数组(最大公共前缀和后缀长度)
	printf("\n");
	haveAffectionV(S, T, 16, 8);
	system("pause");
	return 0;
}

测试截图:

数据结构---KMP模式匹配病毒感染人的DNA检测

时间复杂度O(m x (m+n)),空间复杂度O(m)

如果存在什么问题!欢迎批评指正!谢谢!

上一篇:深入理解Linux系统调用


下一篇:【545】OpenCV 相关函数说明