C51的内存分配不同于一般的PC,内存空间有限,采用覆盖和共享技术。在Keil编译器中,经过编译后,会形成一个M51文件,在其内部可以详细的看到内存的分配情况。
C51内存常见的两个误区:
A、变量超过128字节后必须用COMPACT模式。其实,只要不超过256字节,都可以用SMALL模式
B、内部RAM,128字节以上的是SFR用,不给程序用。其实,由于C51寻址的不同,高128字节也可以用来存储变量,虽与SFR地址相同,但寻址的方式不同。
下面通过几个程序来看内存的分配。
******************************************************************************* //程序1: #include <reg51.h> void main(){} Program Size: data= code= TYPE BASE LENGTH RELOCATION SEGMENT NAME ----------------------------------------------------- * * * * * * * D A T A M E M O R Y * * * * * * * REG 0000H 0008H ABSOLUTE "REG BANK 0" IDATA 0008H 0001H UNIT ?STACK *******************************************************************************
从上面可以看到,即使程序内部无任何变量和函数,data也会为9.0。这9个字节内存分别为R0-R8和一个堆栈指针(C51的堆栈是“grow up”,即使堆栈中没有内容,也会有一个栈底指针)。data区中由于R0-R8占有8个存储空间,因此data区最大为120字节(栈在所有的变量空间之后),如果超过120个字节则由idata显式的指定为间接寻址。对于整个内部256字节的RAM,在极端的情况下,最大的变量为247字节。
当定义全局变量时
******************************************************************************* //程序2: #include<reg51.h> #define uint unsigned int #define uchar unsigned char uchar a; uint b; void main(){} Program Size: data= code= TYPE BASE LENGTH RELOCATION SEGMENT NAME ----------------------------------------------------- * * * * * * * D A T A M E M O R Y * * * * * * * REG 0000H 0008H ABSOLUTE "REG BANK 0" DATA 0008H 0003H UNIT ?DT?MAIN IDATA 000BH 0001H UNIT ?STACK * * * * * * * C O D E M E M O R Y * * * * * * * CODE 0000H 0003H ABSOLUTE CODE 0003H 000CH UNIT ?C_C51STARTUP CODE 000FH 0001H UNIT ?PR?MAIN?MAIN *******************************************************************************
存在全局变量时,根据全局变量的类型分配相应的存储空间。
看下面的程序
***************************************************************** //程序3: #include<reg51.h> #define uint unsigned int #define uchar unsigned char uchar a; uint b; uint sum(uint c) { uint d; d = c; return d; } void main() {} Program Size: data= code= TYPE BASE LENGTH RELOCATION SEGMENT NAME ----------------------------------------------------- * * * * * * * D A T A M E M O R Y * * * * * * * REG 0000H 0008H ABSOLUTE "REG BANK 0" DATA 0008H 0003H UNIT ?DT?MAIN IDATA 000BH 0001H UNIT ?STACK * * * * * * * C O D E M E M O R Y * * * * * * * CODE 0000H 0003H ABSOLUTE CODE 0003H 000CH UNIT ?C_C51STARTUP CODE 000FH 000CH UNIT ?PR?MAIN?MAIN CODE 001BH 0001H UNIT ?PR?_SUM?MAIN ********************************************************************
与上面的程序想比较,发现内存并没有任何的变化。
看下面的程序
*************************************************************************** //程序4: #include<reg51.h> #define uint unsigned int #define uchar unsigned char uchar a; uint b; uint sum(uint c) { uint d; d = c; return d; } void main() { b = sum(); } Program Size: data= code= TYPE BASE LENGTH RELOCATION SEGMENT NAME ----------------------------------------------------- * * * * * * * D A T A M E M O R Y * * * * * * * REG 0000H 0008H ABSOLUTE "REG BANK 0" DATA 0008H 0003H UNIT ?DT?MAIN IDATA 000BH 0001H UNIT ?STACK * * * * * * * C O D E M E M O R Y * * * * * * * CODE 0000H 0003H ABSOLUTE CODE 0003H 000CH UNIT ?C_C51STARTUP CODE 000FH 000CH UNIT ?PR?MAIN?MAIN CODE 001BH 0001H UNIT ?PR?_SUM?MAIN ****************************************************************************
这与上面的内存使用相同,在这个程序中通过反汇编,查看编译后的汇编程序可以发现,参数的传递通过通用寄存器完成,没有占用新的内存。编译器将其优化的通用寄存器(寄存器一般传递3个参数,超过3个参数时,多余的参数通过分配空间地址的方式来访问。但是分配的内存空间包含了寄存器传递的3个参数在内的所有参数的空间。详见《Parameter And Local Variable 》和《Parameter and Register》)和栈中(程序7),但是如果参数或局部变量过多,则情况就完全不同(程序6)。
再看下面的程序
******************************************************************* //程序5 #include<reg51.h> #define uint unsigned int #define uchar unsigned char uchar a; uint b; uint sum(uint c) { uint d; } void main() {} Program Size: data= code= TYPE BASE LENGTH RELOCATION SEGMENT NAME ----------------------------------------------------- * * * * * * * D A T A M E M O R Y * * * * * * * REG 0000H 0008H ABSOLUTE "REG BANK 0" DATA 0008H 0004H UNIT ?DT?_SUM?MAIN DATA 000CH 0003H UNIT ?DT?MAIN IDATA 000FH 0001H UNIT ?STACK * * * * * * * C O D E M E M O R Y * * * * * * * CODE 0000H 0003H ABSOLUTE CODE 0003H 000CH UNIT ?C_C51STARTUP CODE 000FH 0005H UNIT ?PR?_SUM?MAIN CODE 0014H 0001H UNIT ?PR?MAIN?MAIN ******************************************************************
同样的程序,内部RAM的使用情况又发生了变化。函数未被调用,且参数与局部变量都没有使用。
源文件经过编译后形成obj文件,各个obj文件就是一个模块,每个模块中都含有代码段和数据段,也就是,代码在ROM占有多少CODE空间,数据在RAM里占用多少空间等信息。
obj(lib)文件然后经过l51.exe(bl51.exe),就是说把可执行代码模块根据连接定位参数地址上连接在一起();数据段也连接在一起,在ram空间中分配.对ram空间的分配中就有一个连接过程"覆盖分析".调用一个c函数,就会为这个函数所使用的ram空间进行分配(一些局部变量),这个函数返回时再回收分配给他的ram空间,根据函数互相之间的调用前后关系,编译器就可以时实的知道ram空间的使用情况(其中就存在一个函数重入的问题),作为连接时ram空间分配的参数. 如果源文件中的函数(模块)从来没有被任何函数显示的调用(所谓非显示调用就是这段代码,连接器目前还不知道这段代码什么时候会被调用或是否会被调用),连接时就会为它分配永远有效的ram空间(就象全局变量),不会被回收。
(http://blog.sina.com.cn/s/blog_74ee88b80100pqed.html)
******************************************************************* //程序6 #include<reg51.h> #define uint unsigned int #define uchar unsigned char uchar a; uint b; uint sum2(uint e,uint f,uint g,uint j) { uint i; i = e+f+g+j; return i; } void main() { b = sum2(,,,); } Program Size: data= code= TYPE BASE LENGTH RELOCATION SEGMENT NAME ----------------------------------------------------- * * * * * * * D A T A M E M O R Y * * * * * * * REG 0000H 0008H ABSOLUTE "REG BANK 0" DATA 0008H 0008H UNIT _DATA_GROUP_ DATA 0010H 0003H UNIT ?DT?MAIN IDATA 0013H 0001H UNIT ?STACK **************************************************************
在上面的程序中如果将sum2中的j去掉,那么data = 12.0。
通过程序5和6可以看到,两个程序的M51文件中的蓝色部分的segement name的名称有很大的区别。_DATA_GROUP_是一个OVERALY GROUPS(覆盖组)。它是链接器产生的可覆盖的一个数据段。而上面的程序5中的?DT?_SUM?MAIN,则是一个函数段。
在Keil中对OVERALY GROUPS的解释为:
When performing overlay analysis, the linker creates groups of segments that are overlaid. The group name indicates the memory type of the variables that it includes.
Group Name |
Segment |
Memory |
Description |
_BIT_GROUP_ |
?BI? |
All |
Variables and arguments of type bit. |
_DATA_GROUP_ |
?DT? |
Variables and arguments other than bit. |
|
_PDATA_GROUP_ |
?PD? |
Variables and arguments other than bit. |
|
_XDATA_GROUP_ |
?XD? |
Variables and arguments other than bit. |
When the linker overlays function data memory and creates a group, that groups appears in the linker map file's memory map section.
START STOP LENGTH ALIGN RELOC MEMORY CLASS SEGMENT NAME
======================================================================
* * * * * * * * * * * D A T A M E M O R Y * * * * * * * * * * * * *
000000H 000007H 000008H --- AT.. DATA "REG BANK 0"
000008H 00001AH 000013H BYTE UNIT DATA _DATA_GROUP_
00001BH 00001BH 000001H BYTE UNIT IDATA ?STACK
Groups are created based on the memory model of the function (which specifies the memory class where parameters and variables are stored) and on any variables defined with a specific memory space.
在keil生成的M51函数中有OVERLAY MAP OF MODULE,对程序中函数调用的覆盖有详细的说明。
//程序7 #define LEN 120 data uchar tt1[LEN]; idata uchar tt2[]; void main() { uchar i,j; ; i < LEN; ++i ) { j = i; tt1[j] = 0x55; } }
变量i和j通过编译器的优化占用了通用寄存器,R0-8[8]+tt1[120]+tt2[127]+SP[1]共256字节;
而如果将程序7中j=i删掉。上面声明了uchar j,但是下面没有应用,因此编译器不知道该如何处理j,就让其占用了一个RAM空间不再存在通用寄存器中,出现了内存溢出。(有的编译器会将不用的变量自动删除)
由于data区的存取速度快,变量尽量的放在该区,但是由于idata可以访问整个256字节的RAM,如果data区变量较少,idata型的变量也会占有data区,减少了可直接访问的存储空间,因此在变量定义的时候尽量将idata型的变量定义在data型变量后。
uchar c1; idata uchar c2; uchar c3;
变量 c2 肯定会以间接寻址,但它有可能落在 data 区域,就浪费了一个可直接寻址的空间。
变量的优化
(1) 将访问频率高的变量放在data区
(2) 提高内存的复用率。尽可能的利用局部变量,由于局部变量的存取速度快。在程序7中可以看到,i和j没有占用内存,子程序中使用内存数量不大的变量尽量定义为局部变量。
(3) 对于指针数组的定义,尽量指明存储类型。尽量使用无符号类型变量。8051不支持有符号数计算,需要通过其他的库来处理,大大降低了运行的速度,增加了内存的利用。
(4) 避免出现内存空洞。在M51中可以很清楚的看到内存的分配情况,如果全局变量和局部变量的分配不合理,有时会出现下面的情况:
0010H 0012H *** GAP ***
表示从0010开始有0012H个字节未利用。造成这种情况的原因是局变量太多、多个子程序中的局部变量数目差异太大、使用了寄存器切换但未充分利用
(5)避免出现未使用的变量或者函数。