本次讲课讲全面介绍字符串以及如何使用字符串解决具体问题。
一、什么是字符串
1.如何存储字符串
平时我们使用的变量有很多,int代表整型变量,double代表浮点型变量,char代表字符型变量,那么对于一个字符串例如“Hello World!”应该如何存储并操作呢。
在C语言里,我们可以char数组进行存储,例如:
1 char str1[] = "Hello World!"; 2 char* str2 = "Hello World!"; 3 char str3[20] = "Hello World!";
对str1、2、3进行输出都为“Hello World!”,这三种方式构造一个字符串的区别有哪些?我们输出他们的空间长度(注意是占用的空间长度而不是字符串长度)。
1 int len1 = sizeof(str1)/sizeof(char); 2 int len2 = sizeof(str2)/sizeof(char); 3 int len3 = sizeof(str3)/sizeof(char); 4 printf("%d\n%d\n%d\n",len1,len2,len3);
结果为:13
4
20
(此处应对上诉结果进行解释说明 ==)
既然字符串可以存储在一个字符数组里面,那么如何对字符串进行操作想必也就非常清楚了。需要注意的是,对于计算机可以字符和一个整型变量没有任何区别,它们都是数据,所以对整型变量可以做的操作都可以对一个字符进行同样的操作。
2.ASCII编码
众所周知字符在C/C++里面是以ASCII码的形式存储在计算机中,既然字符串是存储在字符数组里面的,其实也就是多个字符的一个有序集合。它也遵守和字符同样的的规则,例如'A'的ASCII码为65,如果我们进行下列语句
1 char ch = 'A'; 2 if(ch == 'A'){ 3 ch = ch + 5; 4 } 5 else { 6 ch = ch - 1; 7 }
那么这里ch的值应该变成多少了呢?此时的ch又代表哪个字符呢?
3.std::string
是不是没见过这是什么东西,它其实就是character string(字符串),这是一个C++的语句,意思就是调用std(标准命名空间)里面的string类,可能你也已经猜到了string是用来干什么的,是的它可以直接定义一个字符串变量,并且能够直接对串进行操作。
什么意思呢?我们既然已经能够用字符数组存储字符串了,为什么还需要多个string呢,因为我们前面说了字符串数组相当于一个字符的有序集合,归根到底还都是单个字符,而字符串变量string才是真正的字符串,它可以直接对串操作,例如下列语句:
std::string str = "Hello"; str += " World"; str += "!";
如果仅仅只是这样,那么string并不显得强大,事实上string支持下面的功能
但是值得注意的是,string是c++语言的东西,在c语言中并不能使用,而且string只能通过cin流进行读入操作,同样可以使用下标对string字符串进行每一位的访问以及操作。
C++也还有很多C语言没有的容器,通过这些容器对做题有很大帮助,而且这些容器对于一个ACMer来说是必须要掌握的,详情请戳:
STL容器(Stack, Queue, List, Vector, Deque, Priority_Queue, Map, Pair, Set, Multiset, Multimap)
二、字符串操作
1.空格、换行符
我们知道使用scanf("%s",s);读入一个字符串遇到空格和换行符自动跳出,但是对于一个字符串不可能都没有空格以及换行呀,如果是需要读入一个句子那该怎么办呢,对于C语言,我提供了下列几种方法供参考
1 //方法一——判断是否为空格选择继续读入还是跳出 2 char s[100],ch; 3 scanf("%s",s); 4 ch = getchar(); 5 while(ch == ' '){ 6 int len = strlen(s); 7 s[len] = ' '; 8 scanf("%s",s+len+1); 9 ch = getchar(); 10 } 11 12 //方法二——利用格式符%[]设置结束符 13 char s[100]; 14 scanf("%[^\n]",s); 15 16 17 //方法三——利用不安全的gets进行读入 18 char s[100]; 19 gets(s);
三种方法都可以进行读入以换行符为结束符带有空格的字符串,但是我推荐最好使用第一种,为什么?
(此处应对上述进行解释说明)
在C++语言中,想要读入这样的串,我也同样提供几种方法供参考
1 //方法一——使用cin流对字符串进行读入 2 char s[100]; 3 cin.getline(s,100); 4 5 //方法二——使用getline进行string类读入 6 string s; 7 getline(cin,s);
下面以一个例题为例,对字符串的具体操作进行讲解
题目链接:http://120.78.128.11/Problem.jsp?pid=1716
下面我贴出C语言和C++语言的代码
C语言:
1 #include <stdio.h> 2 #include <string.h> 3 char s1[10005],s2[105]; 4 5 void read(char *s){ 6 int ch; 7 scanf("%s",s); 8 ch = getchar(); 9 while(ch == ' '){ 10 int len = strlen(s); 11 s[len] = ' '; 12 scanf("%s",s+len+1); 13 ch = getchar(); 14 } 15 } 16 17 int main(){ 18 int t; 19 scanf("%d",&t); 20 while(t--){ 21 read(s1),read(s2);//读入字符串 22 int len1 = strlen(s1),len2 = strlen(s2); 23 int flag = -1,i,j; 24 for(i = 0; i < len1; i++){ 25 if(s1[i] == s2[0]){ 26 for(j = 0; j < len2; j++){ 27 if(j == len2-1 && s1[i+j] == s2[j]) 28 flag = i+1; 29 if(s1[i+j] != s2[j]) 30 break; 31 } 32 } 33 } 34 printf("%d\n",flag); 35 } 36 return 0; 37 }
C++语言:
1 #include <bits/stdc++.h> 2 using namespace std; 3 4 string s1,s2; 5 6 int main(){ 7 int t; 8 cin>>t; 9 cin.get(); 10 while(t--){ 11 getline(cin,s1),getline(cin,s2); 12 int pos = s1.find(s2); 13 cout << (pos==-1?-1:pos+1) << endl; 14 } 15 return 0; 16 }
这也是为什么要用C++的原因,C++内置函数以及操作实在是太强大了,两个C中较为冗长的函数在C++中都只要用一句便实现了。
另一个例题:http://120.78.128.11/Problem.jsp?pid=1924
C语言代码:
1 #include <stdio.h> 2 #include <string.h> 3 char s[1000005]; 4 5 void read(char *s){ 6 int ch; 7 scanf("%s",s); 8 ch = getchar(); 9 while(ch == ' '){ 10 int len = strlen(s); 11 s[len] = ' '; 12 scanf("%s",s+len+1); 13 ch = getchar(); 14 } 15 } 16 17 int main(){ 18 int t,i; 19 scanf("%d",&t); 20 while(t--){ 21 read(s); 22 int len = strlen(s); 23 for(i = 0; i < len; i++){ 24 if(i == 0){ 25 putchar(s[i]-32); 26 } 27 if(s[i] == ' '){ 28 putchar(s[i+1]-32); 29 } 30 } 31 puts(""); 32 } 33 return 0; 34 }
C++代码:
1 #include <bits/stdc++.h> 2 using namespace std; 3 4 string s; 5 6 int main(){ 7 int t; 8 cin>>t; 9 cin.get(); 10 while(t--){ 11 getline(cin,s); 12 int len = s.size(); 13 cout << char(s[0]-32); 14 for(int i = 1; i < len; i++){ 15 if(s[i] == ' ') 16 cout << char(s[i+1]-32); 17 } 18 cout << endl; 19 } 20 return 0; 21 }
2.字符串比较
我们知道可以通过一位一位的模拟进行字符串比较,但要是两个字符串都很长怎么办,我们容易得出暴力方法进行匹配的时间复杂度为O(n*m),n和m就是两个字符串的长度,通过一些算法我们可以进行匹配优化,例如我们可以利用KMP算法在O(n+m)的时间复杂度内进行匹配。
下面是KMP的算法讲解