@清晰掉 Sizeof与字符串

Sizeof与字符串

1.以字符串形式出现的,编译器都会为该字符串自动添加一个0作为结束符

如在代码中写
  "abc",那么编译器帮你存储的是"abc/0"

2."abc"是常量吗?答案是有时是,有时不是。

不是常量的情况:"abc"作为字符数组初始值的时候就不是,如

                 char str[] = "abc";

因为定义的是一个字符数组,所以就相当于定义了一些空间来存放"abc",而又因为字符数组就是把字符一个一个地存放的,所以编译器把这个语句解析为
            char str[3] = {'a','b','c'};
    又根据上面的总结1,所以char str[] = "abc";的最终结果是
            char str[4] = {'a','b','c','/0'};
         做一下扩展,如果char str[] = "abc";是在函数内部写的话,那么这里 的"abc/0"因为不是常量,所以应该被放在栈上。

是常量的情况:  把"abc"赋给一个字符指针变量时,如
                  char* ptr = "abc";

因为定义的是一个普通指针,并没有定义空间来存放"abc",所以编译器得帮我们 找地方来放"abc",显然,把这里的"abc"当成常量并把它放到程序的常量区是编译器最合适的选择。所以尽管ptr的类型不是const char*,并且ptr[0] = 'x';也能编译通过,但是执行ptr[0] = 'x';就会发生运行时异常,因为这个语句试图去修改程序常量区中的东西。

记得哪本书中曾经说过char* ptr = "abc";这种写法原来在c++标准中是不允许的,但是因为这种写法在c中实在是太多了,为了兼容c,不允许也得允许。虽然允许,但是建议的写法应该是const char* ptr = "abc";这样如果后面写ptr[0] = 'x'的话编译器就不会让它编译通过,也就避免了上面说的运行时异常。

又扩展一下,如果char* ptr = "abc";写在函数体内,那么虽然这里的"abc/0"被放在常量区中,但是ptr本身只是一个普通的指针变量,所以ptr是被放在栈上的, 只不过是它所指向的东西被放在常量区罢了。

3.数组的类型是由该数组所存放的东西的类型以及数组本身的大小决定的。

如char s1[3]和char s2[4],s1的类型就是char[3],s2的类型就是char[4],也就是说尽管s1和s2都是字符数组,但两者的类型却是不同的。

4.字符串常量的类型可以理解为相应字符常量数组的类型,
     如"abcdef"的类型就可以看成是const char[7]

5.sizeof是用来求类型的字节数的。

如int a;那么无论sizeof(int)或者是sizeof(a)都是等于4,因为sizeof(a)其实就是sizeof(type of a)

6.对于函数参数列表中的以数组类型书写的形式参数,编译器把其解释为普通的指针类型

如对于void func(char sa[100],int ia[20],char *p)  则sa的类型为char*,ia的类型为int*,p的类型为char*

7.根据上面的总结,来实战一下:

对于char str[] = "abcdef";就有sizeof(str) == 7,因为str的类型是char[7],
  也有sizeof("abcdef") == 7,因为"abcdef"的类型是const char[7]。
  对于char *ptr = "abcdef";就有sizeof(ptr) == 4,因为ptr的类型是char*。
  对于char str2[10] = "abcdef";就有sizeof(str2) == 10,因为str2的类型是char[10]。
  对于void func(char sa[100],int ia[20],char *p);
  就有sizeof(sa) == sizeof(ia) == sizeof(p) == 4,
  因为sa的类型是char*,ia的类型是int*,p的类型是char*。

接下来通过分析实例来区分sizeof与strlen

 

例1:
char* ss = "0123456789";
sizeof(ss) 结果 4 ===》ss是指向字符串常量的字符指针
sizeof(*ss) 结果 1 ===》*ss是第一个字符,字符占1个字节

char ss[] = "0123456789";
sizeof(ss) 结果 11 ===》ss是数组,计算到/0位置,因此是10+1
sizeof(*ss) 结果 1 ===》*ss是第一个字符

char ss[100] = "0123456789";
sizeof(ss) 结果是100 ===》ss表示在内存中的大小 100×1
strlen(ss) 结果是10 ===》strlen是个函数内部实现是用一个循环计算到/0为止之前

int ss[100] = "0123456789";
sizeof(ss) 结果 400 ===》ss表示再内存中的大小 100×4,32位机种int整形数据占4个字节
strlen(ss) 错误 ===》strlen的参数只能是char* 且必须是以''/0''结尾的

char q[]="abc";
char p[]="a/n";
sizeof(q),sizeof(p),strlen(q),strlen(p);
结果是 4 3 3 2

例2:
class X
{
int i;
int j;
char k;
};
X x;
cout<第三个例子:char szPath[MAX_PATH]
  如果在函数内这样定义,那么sizeof(szPath)将会是MAX_PATH,但是将szPath作为虚参声明时(void fun(char szPath[MAX_PATH])),sizeof(szPath)却会是4(指针大小)

深入理解Sizeof与strlen的本质

简单的讲,sizeof  是求变量或类型的存储长度。而strlen  是统计字符串中字符的个数,不包括终止符‘/0’。sizeof 是求得实体(就是"()"里面包含的变量或者类型字)的字节单位长度。按照类型来判断;strlen 是求得字符的长度,累加搜索,直到 /0截至为止。

 sizeof(xxx)是个保留字,用来求分配给xxx的内存空间大小的,举例来说sizeof(int)就是求分配给int型变量的内存大小。strlen(const char*)这是个字符串相关函数,其中,参数必须是个字符指针(指向字符串的指针)或字符串,而返回值就是这个指针指向的字符串的长度,字符串结束必须以'/0'为标记,但'/0'不计入字符串长度。

Sizeof与strlen的区别及联系

 

1.sizeof操作符的结果类型是size_t,它在头文件中typedef为unsigned int类型。
        该类型保证能容纳实现所建立的最大对象的字节大小。

2.sizeof是算符,strlen是函数。

 

3.sizeof可以用类型做参数,strlen只能用char*做参数,且必须是以''/0''结尾的。

 

4.数组做sizeof的参数不退化,传递给strlen就退化为指针了。

 

5.大部分编译程序在编译的时候就把sizeof计算过了是类型或是变量的长度这就是sizeof(x)可以用来定义数组维数的原因

char str[20]="0123456789";//str是编译期大小已经固定的数组
int a=strlen(str); //a=10;//strlen()在运行起确定
int b=sizeof(str); //而b=20;//sizeof()在编译期确定

6.strlen的结果要在运行的时候才能计算出来,是用来计算字符串的实际长度,不是类型占内存的大小。

 

7.sizeof后如果是类型必须加括弧,如果是变量名可以不加括弧。这是因为sizeof是个操作符不是个函数。

char c;
sizeof c;//变量名可以不加括弧

8.当适用了于一个结构类型时或变量, sizeof 返回实际的大小,当适用一静态地空间数组, sizeof 归还全部数组的尺寸。

sizeof 操作符不能返回动态地被分派了的数组或外部的数组的尺寸

9.数组作为参数传给函数时传的是指针而不是数组,传递的是数组的首地址,
如:
    fun(char [8])
    fun(char [])
    都等价于 fun(char *)
    在C++里参数传递数组永远都是传递指向数组首元素的指针,编译器不知道数组的大小

如果想在函数内知道数组的大小, 需要这样做:
     进入函数后用memcpy拷贝出来,长度由另一个形参传进去

  1. <span style="font-size:12px;">fun(unsiged char *p1, int len)
  2. {
  3. unsigned char* buf = new unsigned char[len+1]
  4. memcpy(buf, p1, len);
  5. }</span>

10.计算结构变量的大小就必须讨论数据对齐问题。

为了CPU存取的速度最快(这同CPU取数操作有关,详细的介绍可以参考一些计算机原理方面的书),C++在处理数据时经常把结构变量中的成员的大小按照4或8的倍数计算,这就叫数据对齐(data alignment)。

这样做可能会浪费一些内存,但理论上速度快了。当然这样的设置会在读写一些别的应用程序生成的数据文件或交换数据时带来不便。MS VC++中的对齐设定,有时候sizeof得到的与实际不等。一般在VC++中加上#pragma pack(n)的设定即可.或者如果要按字节存储,而不进行数据对齐,可以在Options对话框中修改Advanced compiler页中的Data alignment为按字节对齐。

11.sizeof操作符不能用于函数类型,不完全类型或位字段。

不完全类型指具有未知存储大小的数据类型,如未知存储大小的数组类型、未知内容的结构或联合类型、void类型等。如sizeof(max)若此时变量max定义为int max(),sizeof(char_v) 若此时char_v定义为char char_v [MAX]且MAX未知,sizeof(void)都不是正确形式。

我们能常在用到 sizeof 和 strlen 的时候,通常是计算字符串数组的长度
     看了上面的详细解释,发现两者的使用还是有区别的,从这个例子可以看得很清楚:

char str[11]="0123456789";//注意这里str大小因该大于等于11,应考虑'/0'在内,否则编译器会报错
     int a=strlen(str); //a=10; >>>> strlen 计算字符串的长度,以结束符 0x00 为字符串结束。
     int b=sizeof(str); //而b=11; >>>> sizeof 计算的则是分配的数组 str[11] 所占的内存空间的大小,不受里面存储的内容改变。

上面是对静态数组处理的结果,如果是对指针,结果就不一样了

char* ss = "0123456789";
     sizeof(ss) 结果 4 ===》ss是指向字符串常量的字符指针,sizeof 获得的是一个指针的之所占的空间,应该是长整型的,所以是4
     sizeof(*ss) 结果 1 ===》*ss是第一个字符 其实就是获得了字符串的第一位'0' 所占的内存空间,是char类型的,占了 1 位

strlen(ss)= 10 >>>> 如果要获得这个字符串的长度,则一定要使用 strlen

另外,下面的方法可以用于确定该静态数组可以容纳元素的个数:
     int a[3]={1,2,3};
     cout << sizeof a/sizeof ( typeid( a[0] ).name() );

个人补充实例:

对于字符串数组 char SS[7]="abcdef",其后自动添加'/0'表示结束符,该字符串数组在内存中占用单元是以单个字符存取的,因此又可以表示为 char SS[7]={'a','b','c','d','e','f','/0'}

结果:sizeof(ss)=7   strlen(ss[])=6

  小结:

Sizeof计算分配的字符串数组/数据类型/函数所占的内存空间的大小,不受里面存储的内容实际大小而改变;strlen计算字符串的长度,以结束符0x00('/0')为字符串结束。

 

例如:char ss3[100]="0123456789"

int a=sizeof(ss3) a值为100,实际ss3数组中只有‘0’,‘1’,‘2’,‘3’,‘4’,‘5’,‘6’,‘7’,‘8’,‘9’,‘/0’共10个字符串,因此ss[10]='/0'

int b=strlen(ss3[]) b值为10,这里不计入字符串结束标志'/0'

sizeof使用场合:

1.sizeof操作符的一个主要用途是与存储分配和I/O系统那样的例程进行通信。例如:    

void *malloc(size_t size), 

size_t fread(void * ptr,size_t size,size_t nmemb,FILE * stream)。

2.用它可以看看一类型的对象在内存中所占的单元字节。 void * memset(void * s,int c,sizeof(s))

3.在动态分配一对象时,可以让系统知道要分配多少内存。
      4.便于一些类型的扩充,在windows中就有很多结构内型就有一个专用的字段是用来放该类型的字节大小。
      5.由于操作数的字节数在实现时可能出现变化,建议在涉及到操作数字节大小时用sizeof来代替常量计算。
      6.如果操作数是函数中的数组形参或函数类型的形参,sizeof给出其指针的大小。

其他内容参见:C语言中sizeof与strlen区别http://www.cnblogs.com/fervour/archive/2009/12/19/1627889.html

上一篇:[原创]PostgreSQL Plus Advanced Server批量创建分区表写入亿级别数据实例


下一篇:hbase常用运维命令