有关 sizeof和strlen的总结

先看看sizeof()

一、sizeof的概念

sizeof是C语言的一种单目操作符,如C语言的其他操作符++、--等。它并不是函数。sizeof操作符以字节形式给出了其操作数的存储大小。操作数可以是一个表达式或括在括号内的类型名。操作数的存储大小由操作数的类型决定。其实可以简单的理解sizeof是征对"类型"的。

二、sizeof的使用方法 

1、用于数据类型 
 sizeof使用形式:sizeof(type)  数据类型必须用括号括住。如sizeof(int)。

sizeof作用范围内,也就是()里面的内容也不能被编译,而是被替换成类型

2、用于变量 

sizeof使用形式:sizeof(var_name)或sizeof var_name 

变量名可以不用括号括住。如sizeof (var_name),sizeof var_name等都是正确形式。带括号的用法更普遍,大多数程序员采用这种形式。 

注意:sizeof操作符不能用于函数类型,不完全类型或位字段。不完全类型指具有未知存储大小的数据类型,如未知存储大小的数组类型、未知内容的结构或联合类型、void类型等。 

三、sizeof的结果

sizeof操作符的结果类型是size_t,它在头文件中typedef为unsigned int类型。该类型保证能容纳实现所建立的最大对象的字节大小。

1、若操作数具有类型char、unsigned char或signed char,其结果等于1。因为 ANSI C正式规定字符类型为1字节。

2、int、unsigned int 、short int(short)、unsigned short 、long int(long) 、unsigned long 、float、double、long double类型的sizeof 在ANSI C中没有具体规定,大小依赖于实现,一般可能分别为2、2、2、2、4、4、4、8、10。

3、当操作数是指针时,sizeof依赖于编译器。例如Microsoft C/C++7.0中,near类指针字节数为2,far、huge类指针字节数为4。一般Unix的指针字节数为4。

4、当操作数具有数组类型时,其结果是数组的总字节数,特别要注意字符串数组,如:

Char str[]=“123456” sizeof(str)=7。

5、联合类型操作数的sizeof是其最大字节成员的字节数。结构类型操作数的sizeof是这种类型对象的总字节数,包括任何垫补在内。让我们看如下结构: struct {char b; double x;} a; 

在某些机器上sizeof(a)=16,而一般sizeof(char)+ sizeof(double)=9。这是因为编译器在考虑对齐问题时,在结构中插入空位以控制各成员对象的地址对齐。

6、如果操作数是函数中的数组形参或函数类型的形参,sizeof给出其指针的大小。

即:int func(char p[100])

{ sizeof(p) = 4; }

C/C++中不能传数组,只能传指针,所以任何数组都会隐式转成指针形式进行操作,所以"类型"还是指针。

7.sizeof是运算符 当编译器编译时 会自动运算这个变量的大小的 并使用它的大小代替sizeof的值如

int len = sizeof(int);编译时 编译器计算出int的大小 大小为4 所以把上面这句变成

int len = 4

四、sizeof与其他操作符的关系

sizeof的优先级为2级,比/、%等3级运算符优先级高。它可以与其他操作符一起组成表达式。如i*sizeof(int);其中i为int类型变量。

五、sizeof的主要用途

1、sizeof操作符的一个主要用途是与存储分配和I/O系统那样的例程进行通信。例如:  
  void *malloc(size_t size),  
  size_t fread(void * ptr,size_t size,size_t nmemb,FILE * stream)。  
  2、sizeof的另一个的主要用途是计算数组中元素的个数。例如:  
  void *memset(void *s,int c,sizeof(s))。

3.在动态分配一对象时,可以让系统知道要分配多少内存。

如:int *p=(int *)malloc(sizeof(int)*10);

4.由于操作数的字节数在实现时可能出现变化,建议在涉及到操作数字节大小时用sizeof来代替常量计算。

5.如果操作数是函数中的数组形参或函数类型的形参,sizeof给出其指针的大小。

下面我们来看看strlen()

一、strlen是函数

strlen只能用char*做参数,且必须是以''\0''结尾的。Strlen将返回它的长度,不包括‘\0’。

二、由几个例子说开去。

第一个例子:
char* ss = "0123456789";
sizeof(ss) 结果 4 ===>ss是指向字符串常量的字符指针
sizeof(*ss) 结果 1 ===>*ss是第一个字符

char ss[] = "0123456789";
sizeof(ss) 结果 11 ===>ss是数组,计算到\0位置,因此是10+1
sizeof(*ss) 结果 1 ===>*ss是第一个字符

char ss[100] = "0123456789";
sizeof(ss) 结果是100 ===> ss表示在内存中的大小 100×1
strlen(ss) 结果是10 ===> strlen是个函数内部实现是用一个循环计算到\0为止之前

int ss[100] = "0123456789";
sizeof(ss) 结果 400 ===>ss表示再内存中的大小 100×4
strlen(ss) 错误 ===>strlen的参数只能是char* 且必须是以''\0''结尾的

第二个例子:
class X{
int i;
int j;
char k;
};

X x;
cout<<sizeof(X)<<endl; 结果 12 ===>内存补齐
cout<<sizeof(x)<<endl; 结果 12 同上
(详细可见另篇文章:由朗讯的一道笔试题想到的!)

列出几个重要的区别:

1.sizeof是算符,strlen是函数。

2.sizeof可以用类型做参数,strlen只能用char*做参数,且必须是以''\0''结尾的。sizeof还可以用函数做参数,比如: short f();printf("%d\n", sizeof(f()));输出的结果是sizeof(short),即2。

3.strlen计算的是字符串的长度,sizeof计算的是变量使用的内存大小,不受里面存储的内容改变

4.strlen的结果要在运行的时候才能计算出来,是用来计算字符串的长度,不是类型占内存的大小。

5.sizeof后如果是类型必须加括弧,如果是变量名可以不加括弧。这是因为sizeof是个操作符不是个函数。

6.当适用了于一个结构类型时或变量, sizeof 返回实际的大小, 当适用一静态地空间数组, sizeof 归还全部数组的尺寸。 sizeof 操作符不能返回动态地被分派了的数组或外部的数组的尺寸 。

6.数组作为参数传给函数时传的是指针而不是数组,传递的是数组的首地址,如:

fun(char [8])
fun(char [])
都等价于 fun(char *) 
在C++里参数传递数组永远都是传递指向数组首元素的指针,编译器不知道数组的大小
如果想在函数内知道数组的大小, 需要这样做:
进入函数后用memcpy拷贝出来,长度由另一个形参传进去 
fun(unsiged char *p1, int len)
{
  unsigned char* buf = new unsigned char[len+1]
  memcpy(buf, p1, len);
}

我们能常在用到 sizeof 和 strlen 的时候,通常是计算字符串数组的长度

1.sizeof操作符的结果类型是size_t,它在头文件中typedef为unsigned int类型。 
该类型保证能容纳实现所建立的最大对象的字节大小。

2.sizeof是算符,strlen是函数。

3.sizeof可以用类型做参数,strlen只能用char*做参数,且必须是以''\0''结尾的。 
sizeof还可以用函数做参数,比如: 
short f(); 
printf("%d\n", sizeof(f())); 
输出的结果是sizeof(short),即2。

4.数组做sizeof的参数不退化,传递给strlen就退化为指针了。

5.大部分编译程序 在编译的时候就把sizeof计算过了 是类型或是变量的长度这就是sizeof(x)可以用来定义数组维数的原因 
char str[20]="0123456789"; 
int a=strlen(str); //a=10; 
int b=sizeof(str); //而b=20;

6.strlen的结果要在运行的时候才能计算出来,时用来计算字符串的长度,不是类型占内存的大小。

7.sizeof后如果是类型必须加括弧,如果是变量名可以不加括弧。这是因为sizeof是个操作符不是个函数。

8.当适用了于一个结构类型时或变量, sizeof 返回实际的大小, 
当适用一静态地空间数组, sizeof 归还全部数组的尺寸。 
sizeof 操作符不能返回动态地被分派了的数组或外部的数组的尺寸

9.数组作为参数传给函数时传的是指针而不是数组,传递的是数组的首地址, 
如: 
fun(char [8]) 
fun(char []) 
都等价于 fun(char *) 
在C++里参数传递数组永远都是传递指向数组首元素的指针,编译器不知道数组的大小 
如果想在函数内知道数组的大小, 需要这样做: 
进入函数后用memcpy拷贝出来,长度由另一个形参传进去 
fun(unsiged char *p1, int len) 

unsigned char* buf = new unsigned char[len+1] 
memcpy(buf, p1, len); 
}

我们能常在用到 sizeof 和 strlen 的时候,通常是计算字符串数组的长度

好了看了上面的讲解和例题,我们来测试几个题:

1. 如下程序的输出是什么?(在intel x86(32-bit) platform.)
#include <stdio.h>
#include<stdlib.h>
#include<string.h>
int main( )
{
    char str[10];
    char *p;
   memset(str,0x00,sizeof(str));
    p = (char *)malloc(100);
    printf("%d\n",sizeof(p));
    printf("%d\n",sizeof('p'));
    printf("%d\n",strlen(str));
    exit(0);
}

答:4/1/0, 如果不加memset(),第三行就会打出15(随机数),请问这是为什么?

memset函数是初始化分配的内存空间,使用0、0x00都是0即’\0',不同系统当分配一块内存时,这块内存中的内容是未知的,系统只是根据申请者的要求为其化一块内存并不管他原先的内容是什么(有的系统清零),所以你的是随即数15。

2.你能够正确的说出它们的sizeof和strlen的大小吗?

#include <stdio.h>
#include<stdlib.h>
#include<string.h>

int main( )

{

char *str1="absde";
       char str2[]="absde";
       char str3[8]={'a',};
       char str4[8]={'a','b','s','e','f','g','h','j'};

printf("sizeof(str1)=%d\n",sizeof(str1));
    printf("sizeof(str2)=%d\n",sizeof(str2));
    printf("sizeof(str3)=%d\n",sizeof(str3));
    printf("sizeof(str4)=%d\n",sizeof(str4));

printf("strlen(str1)=%d\n",strlen(str1));
     printf("strlen(str2)=%d\n",strlen(str2));
    printf("strlen(str3)=%d\n",strlen(str3));
    printf("strlen(str4)=%d\n",strlen(str4));

exit(0);

}

答:sizeof是计算括号中变量的类型所占的储存空间(不考虑内容);strlen是计算变量值为起点的内存地址到第一个'\0'的距离,以字节为单位,字符串尾部为'\0',0=='\0'(不包括’\0’)正确答案是:4、6、8、8;5、5、1、9;

strlen(str1)=5;
sizeof(str2)=6;
strlen(str2)=5;
sizeof(str3)=8;
strlen(str3)=1;
sizeof(str4)=8;
strlen(str4)=13;
strlen(*str1) 出错
passing arg1 of 'strlen' makes pointer from integer without a cast.

sizeof是计算括号中变量的类型所占的储存空间。
strlen(str4)有可能为不小于8的其他数字,取决于内存中的数据,因为 strlen是计算变量值为起点的内存地址到第一个'%content%'的距离,以字节为单位,字符串尾部
为'%content%',0=='%content%'.

3.这个例子可以说明一些问题:

char str[20]="0123456789";
int a=strlen(str); //a=10; >>>> strlen 计算字符串的长度,以结束符 0x00 为字符串结束。
int b=sizeof(str); //而b=20; >>>> sizeof 计算的则是分配的数组 str[20] 所占的内存空间的大小,不受里面存储的内容改变。

上面是对静态数组处理的结果,如果是对指针,结果就不一样了

char* ss = "0123456789";
sizeof(ss) 结果 4 ===>ss是指向字符串常量的字符指针,sizeof 获得的是一个指针的之所占的空间,应该是长整型的,所以是4
sizeof(*ss) 结果 1 ===>*ss是第一个字符 其实就是获得了字符串的第一位'0' 所占的内存空间,是char类型的,占了 1 位

strlen(ss)= 10 ===> 如果要获得这个字符串的长度,则一定要使用 strlen

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/cxyol/archive/2006/01/08/573524.aspx

=============================================================================

字符数组,字符指针,Sizeof总结

1.编译器都会为字符串自动添加一个0作为结束符,如在代码中写 "abc",那么编译器帮你存储的是"abc\0"

2."abc"是常量吗?答案是有时是,有时不是。

不是常量的情况:"abc"作为字符数组初始值的时候就不是,如char str[] = "abc";

因为定义的是一个字符数组,所以就相当于定义了一些空间来存放"abc",而又因为字符数组就是把字符一个一个地存放的,所以编译器把这个语句解析为char str[3] = {'a','b','c'};

又 根据上面的总结1,所以 char str[] = "abc";的最终结果是 char str[4] = {'a','b','c','\0'};做一下扩展,如果char str[] = "abc";是在函数内部写的话,那么这里 的"abc\0"因为不是常量,所以应该被放在栈上。

是常量的情况: 把"abc"赋给一个字符指针变量时,如char* ptr = "abc";

因为定义的是一个普通指针,并没有定义空间来存放"abc",所以编译器得帮我们找地方来放"abc",显然,把这里的"abc"当成常量并把它放到程序 的常量区是编译器 最合适的选择。所以尽管ptr的类型不是const char*,并且ptr[0] = 'x';也能编译 通过,但是执行ptr[0] = 'x';就会发生运行时异常,因为这个语句试图去修改程序 常量区中的东西。

记得哪本书中曾经说过char* ptr = "abc";这种写法原来在c++标准中是不允许的, 但是因为这种写法在c中实在是太多了,为了兼容c,不允许也得允许。虽然允许, 但是建议的写法应该是const char* ptr = "abc";这样如果后面写ptr[0] = 'x'的话编译器就不会让它编译通过,也就避免了上面说的运行时异常。

又扩展一下,如果char* ptr = "abc";写在函数体内,那么虽然这里的"abc\0"被放在常量区中,但是ptr本身只是一个普通的指针变量,所以ptr是被放在栈上的, 只不过是它所指向的东西被放在常量区罢了。

3.数组的类型是由该数组所存放的东西的类型以及数组本身的大小决定的。 如char s1[3]和char s2[4],s1的类型就是char[3],s2的类型就是char[4], 也就是说尽管s1和s2都是字符数组,但两者的类型却是不同的。

4.字符串常量的类型可以理解为相应字符常量数组的类型, 如"abcdef"的类型就可以看成是const char[7]

5.sizeof是用来求类型的字节数的。如int a;那么无论sizeof(int)或者是sizeof(a)都 是等于4,因为sizeof(a)其实就是sizeof(type of a)

6.对于函数参数列表中的以数组类型书写的形式参数,编译器把其解释为普通 的指针类型,如对于void func(char sa[100],int ia[20],char *p) 则sa的类型为char*,ia的类型为int*,p的类型为char*

7.根据上面的总结,来实战一下:

对于char str[] = "abcdef";就有sizeof(str) == 7,因为str的类型是char[7], 也有sizeof("abcdef") == 7,因为"abcdef"的类型是const char[7]。

对于char *ptr = "abcdef";就有sizeof(ptr) == 4,因为ptr的类型是char*。

对于char str2[10] = "abcdef";就有sizeof(str2) == 10,因为str2的类型是char[10]。

对于void func(char sa[100],int ia[20],char *p); 就有sizeof(sa) == sizeof(ia) == sizeof(p) == 4, 因为sa的类型是char*,ia的类型是int*,p的类型是char*。

===============================================================================

int f1(){return 0;};
double f2(){return 0;}
void f3(){} 
cout<<sizeof(f1())<<endl; // f1()返回值为int,因此被认为是int
cout<<sizeof(f2())<<endl; // f2()返回值为double,因此被认为是double
cout<<sizeof(f3())<<endl; // 错误!无法对void类型使用sizeof
cout<<sizeof(f1)<<endl; // 错误!无法对函数指针使用sizeof 
cout<<sizeof*f2<<endl; // *f2,和f2()等价,因为可以看作object,所以括号不是必要的。被认为是double

不管是什么类型的指针,大小都是4的,因为指针就是32位的物理地址

int *d = new int[10]; 
cout<<sizeof(d)<<endl; // 4

d是我们常说的动态数组,但是他实质上还是一个指针,所以sizeof(d)的值是4。再考虑下面的问题:

double* (*a)[3][6];
cout<<sizeof(a)<<endl; // 4
cout<<sizeof(*a)<<endl; // 72
cout<<sizeof(**a)<<endl; // 24
cout<<sizeof(***a)<<endl; // 4
cout<<sizeof(****a)<<endl; // 8

  a是一个很奇怪的定义,他表示一个指向 double*[3][6]类型数组的指针。既然是指针,所以sizeof(a)就是4。

  既然a是执行double*[3][6]类型的指针,*a就表示一个double*[3][6]的多维数组类型,因此sizeof(*a)=3*6*sizeof(double*)=72。同样的,**a表示一个double*[6]类型的数组,所以sizeof(**a)=6*sizeof(double*)=24。***a就表示其中的一个元素,也就是double*了,所以sizeof(***a)=4。至于****a,就是一个double了,所以sizeof(****a)=sizeof(double)=8。

上一篇:字符串赋值方式理解 sizeof 和strlen的一些区别


下一篇:C++_系列自学课程_第_7_课_数组_《C++ Primer 第四版》