字符串函数中的求长度、查找、分割和错误报告函数(strlen,strstr,strtok,strerror)

文章目录

一、strlen - 求字符串长度

1.如何使用

size_t strlen( const char *string );

strlen函数是一个用于求字符串长度的库函数。它的参数是被求长度的字符串的起始地址,返回值是一个无符号整型。
注意:

  • 参数指向的字符串要以’\0’结束。
  • strlen返回的是在字符串中’\0’之前出现的字符个数(不包含’\0’)。
  • 注意函数的返回值为size_t,是无符号的(易错)。

举个例子,比如我们要求字符串"abcdef"的长度。

#include<stdio.h>
#include<string.h>
int main()
{
	char arr[] = "abcdef";
	size_t ret = strlen(arr);
	return 0;
}

数组arr的数组名就是该数组的起始地址,我们定义一个size_t型的变量ret便能接收函数的返回值,结果是6。

2.模拟实现(三种方式)

方式一:计数器的方式
我们定义一个变量为count,如果传入的指针指向的内容不是’\0’,那么count++,同时指针后移一位,循环往复,直到找到’\0’时返回count即可。

size_t my_strlen1(const char* str)
{
	size_t count = 0;//计数器
	while (*str)
	{
		count++;
		str++;
	}
	return count;
}

方式二:递归的方式
我们一进入函数体就判断传入指针指向的内容是否为’\0’,如果是就返回0,不是就返回1+my_strlen2(str+1),如此进行下去,直到递归到内层时找到’\0’,这时再一步步将值返回回来即可。

size_t my_strlen2(const char* str)
{
	if (*str == '\0')
		return 0;
	else
		return 1 + my_strlen2(str + 1);
}

方式三:指针-指针的方式
进入函数体时,我们事先定义一个指针变量将传入的指针保存下来,然后将传入的指针向后移,直到遇到’\0’时,我们返回当前指针与保存的指针的差值即可。(指针与指针的差的绝对值是两个指针之间的元素个数)

size_t my_strlen3(const char* str)
{
	const char* p = str;//保存起始位置
	while (*str != '\0')
		str++;
	return str - p;
}

二、strstr - 字符串查找

1.如何使用

char *strstr( const char *string, const char *strCharSet );

strstr函数可以在一个字符串(字符串1)中查找另一个字符串(字符串2),如果字符串2存在于该字符串1中,那么就返回被字符串2在字符串1中第一次出现的起始位置,如果在字符串1中找不到字符串2,那么就返回空指针(NULL)。它的第一个参数是字符串1的起始位置,第二个参数是字符串2的起始位置。
注意:

  • 若字符串2为空字符串,则返回字符串1的起始位置。

举个例子,比如我们在字符串"abcdefbcd"中查找字符串"bcd"。

#include<stdio.h>
#include<string.h>
int main()
{
	char arr1[] = "abcdefbcd";
	char arr2[] = "bcd";
	char* ret = strstr(arr1, arr2);//在arr1中查找arr2字符串第一次出现的位置
	if (ret != NULL)
		printf("%s\n", ret);
	else
		printf("找不到\n");
	return 0;
}

注意:strstr函数的返回值是字符串"bcd"在字符串"abcdefbcd"中第一次出现的位置的起始位置,而不是出现几次就返回几个起始位置。

2.模拟实现

strstr函数的模拟实现相对复杂,在实现过程中我们需要设置3个指针变量来辅助实现函数功能。
cp指针: 记录每次开始匹配时的起始位置,当从该位置开始匹配时就找到了目标字符串,便于返回目标字符串出现的起始位置;当从该位置开始没有匹配成功时,则从cp++处开始下一次的匹配。
p1和p2指针: 通过判断p1和p2指针解引用后是否相等来判断每个字符是否匹配成功,若成功,则指针后移比较下一对字符;若失败,p1指针返回cp指针处,p2指针返回待查找字符串的起始位置。

例如,在字符串"abbbcdef"中查找字符串"bbc":
刚刚开始时3个指针的指向如图所示:
字符串函数中的求长度、查找、分割和错误报告函数(strlen,strstr,strtok,strerror)
若p1与p2匹配不成功,则cp指针后移,接着将cp指针赋值给p1指针:
字符串函数中的求长度、查找、分割和错误报告函数(strlen,strstr,strtok,strerror)
此时,p1与p2匹配成功,那么cp指针不动,p1和p2指针后移继续比较:
字符串函数中的求长度、查找、分割和错误报告函数(strlen,strstr,strtok,strerror)
当p1与p2匹配不成功时,cp指针后移一位,p1返回cp位置,p2返回待查找字符串起始位置:
字符串函数中的求长度、查找、分割和错误报告函数(strlen,strstr,strtok,strerror)
从此位置开始下一轮的比较:
字符串函数中的求长度、查找、分割和错误报告函数(strlen,strstr,strtok,strerror)
直到当p2指向的内容为\0时,便说明待查找字符串中的字符已经被找完,也说明了从当前cp位置开始匹配能够找到目标字符串,所以此时返回指针cp即可。

char* my_strstr(const char* str1, const char* str2)
{
	assert(str1 != NULL);//断言,当str1为空指针报错
	assert(str2 != NULL);//断言,当str2为空指针报错
	const char* cp = str1;//记录开始匹配时的起始位置
	if (*str2 == '\0')//要查找的字符串为空字符串
		return (char*)str1;
	while (*cp)
	{
		const char* p1 = cp;
		const char* p2 = str2;
		while ((*p1!='\0') && (*p2!='\0') && (*p1 == *p2))
		{
			p1++;
			p2++;
		}
		if (*p2 == '\0')//目标字符串已被查找完
			return (char*)cp;
		cp++;
	}
	return NULL;//找不到目标字符串
}

三、strtok - 字符串分割

char *strtok( char *strToken, const char *strDelimit );

strtok函数能通过给定的一系列字符将一个字符串分割成许多子字符串的函数。它的第一个参数是需要被分割的字符串的首地址;第二个参数是一个字符串的首地址,该字符串是用作分隔符的字符集合。返回值是查找到的标记的首地址。
注意:

  • strtok函数找到strToken中的一个标记时,会将其用 \0结尾并返回这个标记的首地址。
  • strtok函数会改变strToken函数,所以在使用strtok函数切分的字符串都是临时拷贝的内容并且可修改。
  • strtok函数的第一个参数不为NULL时,函数将找到strToken中的第一个标记,并保存它在字符串中的位置。
  • strtok函数的第一个参数为NULL时,函数将从同一个字符串中被保存的位置开始查找它的下一个标记。
  • 若字符串中不存在更多的标记,则返回NULL指针。

举个例子,比如我们要将字符串"2957055542@qq.com"以"@“字符和”."字符分割开。

#include<stdio.h>
#include<string.h>
int main()
{
	char arr1[] = "2957055542@qq.com";//待分割字符串
	char arr2[] = "@.";//分隔符的字符集合
	char arr3[20] = { 0 };
	strcpy(arr3, arr1);//将数据拷贝一份使用,防止原数据被修改
	char* token = strtok(arr3, arr2);//第一次传参需传入待分割字符串首地址
	while (token != NULL)//说明还未分割完
	{
		printf("%s\n", token);
		token = strtok(NULL, arr2);//对同一个字符串进行分割,第二次及以后的第一个参数为NULL
	}
	return 0;
}

字符串函数中的求长度、查找、分割和错误报告函数(strlen,strstr,strtok,strerror)
注意:当strtok函数找到第一个标记时,将其后的’@‘字符改为’\0’并返回第一个标记的首地址,所以我们以返回的地址为首地址开始打印字符串的时候就只会打印出2957055542,第二次再对该字符串调用strtok函数时将从’@'字符后面开始寻找下一个标记。

四、strerror、perror - 错误报告函数

1.strerror

char *strerror( int errnum );

strerror函数可以把错误码转换为对应的错误信息,返回错误信息对应字符串的起始地址。

2.perror

void perror( const char *string );

perror函数可以打印一个错误信息,无返回值。

我们需要知道,库函数在使用的时候如果发生错误,都会有对应的错误码,而这些错误码都会被存放在errno这个全局变量中,如果要使用这个全局变量,我们需要引其对应的头文件:#include<errno.h>

举个例子:
注:fopen函数的功能是打开一个文件,当其执行成功时会返回打开文件的首地址,执行失败时会返回一个空指针(NULL)。

#include<stdio.h>
#include<string.h>
#include<errno.h>
int main()
{
	FILE* pf = fopen("test.txt", "r");//打开test.txt文件阅读
	if (pf == NULL)
	{
		printf("%s\n", strerror(errno));
		perror("fopen");
	}
	return 0;
}

字符串函数中的求长度、查找、分割和错误报告函数(strlen,strstr,strtok,strerror)
当我们要打开一个不存在的文件(test.txt)来阅读的时候,显然fopen函数会执行失败,于是pf指针接收的便是空指针(NULL)。
strerror: 只负责将错误码转换为对应的错误信息,不打印。
perror: 直接打印错误信息,并且我们可以自己加上注释来明确错误来源于哪个库函数。

上一篇:使用 FutureProvider 简化个人主页异步请求的状态管理


下一篇:C语言strtok()函数:字符串分割