linux下s3c2440重定位(4)连接脚本的学习_拷贝代码和链接脚本的改进

转载地址 https://blog.csdn.net/thisway_diy/article/details/79397

本节内容重点是感觉start.s文件中的拷贝特性以及清除bss段出现的bug修复

前面重定位时,需要ldrb命令从的Nor Flash读取1字节数据,再用strb命令将1字节数据写到SDRAM里面。

cpy:
    ldrb r4, [r1] /*首先从flash读出一个字节*/ 
    strb r4, [r2] /*让后把数据写到SDRAM*/
    add r1, r1, #1
    add r2, r2, #1
    cmp r2, r3
    bne cpy

JZ2440上的Nor Flash是16位,SDRAM是32位。 
假设现在需要复制16byte数据, 
     采用ldrb命令每次只能加载1byte,因此CPU需要发出16次命令,内存控制器每次收到命令后,访问硬件Nor Flash,因此需要访问硬件16次; 
同理,访问SDRAM时,CPU需要执行strb 16次,内存控制器每次收到命令后,访问硬件SDRAM,也要16次,这样总共访问32次。
      现在对其进行改进,使用ldr从Nor Flash中读,ldr命令每次加载4字节数据,因此CPU只需执行4次,但由于Nor Flash是16位的,内存控制器每次收到CPU命令后,需要拆分成两次访问,因此需要访问硬件8次; 
使用str写SDRAM,CPU只需执行4次,内存控制器每次收到命令后,直接硬件访问32位的SDRAM,因此这里只需要4次,这样总共访问只需要12次。 
在整个操作中,花费时间最长的就是硬件访问,改进后代码,减少了硬件访问的次数,极大的提高了效率。
linux下s3c2440重定位(4)连接脚本的学习_拷贝代码和链接脚本的改进

根据上面原理修改代码,修改start.S:

cpy:
    ldr r4, [r1]
    str r4, [r2]
    add r1, r1, #4 //r1加4
    add r2, r2, #4 //r2加4
    cmp r2, r3 //如果r2 =< r3继续拷贝
    ble cpy

/* 清除BSS段 */ 
    ldr r1, =bss_start
    ldr r2, =bss_end
    mov r3, #0
clean:
    str r3, [r1]
    add r1, r1, #4
    cmp r1, r2 //如果r1 =< r2则继续拷贝
    ble clean

    bl main

然后编译烧写,发现启动后没有输出字符。修改主程序,尝试以整数格式输出字符,发现输出的数从0开始,应该是 
全局变量被破坏了。

屏蔽掉start.S里面的清理命令,测试是否是清除bss段是清除了全局变量。

clean:
    //str r3, [r1] //注释掉此句话,str不仅把bss段清除,把全局变量这些也清除了
    add r1, r1, #4
    cmp r1, r2
    ble clean

    bl main

屏蔽后,正常输出,锁定了问题大致位置。查看反汇编文件,原来是没有向4取整。 
修改链接脚本让bss段,使用ALIGN(4)向4取整。

SECTIONS {
   .text   0  : { *(.text) }
   .rodata  : { *(.rodata) }
   .data 0x30000000 : AT(0x700) 
   { 
      data_load_addr = LOADADDR(.data);
      . = ALIGN(4);
      data_start = . ;
      *(.data) 
      data_end = . ;
   }

   . = ALIGN(4);//让当前地址向4对齐
   bss_start = .;
   .bss  : { *(.bss) *(.COMMON) }
   bss_end = .;
}

现在重新编译烧写,测试结果正常。 
再次查看反汇编文件,发现现在bss段以4字节对齐,清理bss段也是正常的。

Disassembly of section .bss:

30000004 <g_A>:
30000004:   00000000    andeq   r0, r0, r0

30000008 <g_B>:
30000008:   00000000    andeq   r0, r0, r0
Disassembly of section .comment:

同样的问题也会出在代码重定位这里,如何保证data段起始地址也是向4对齐呢? 
也是使用ALIGN(4)向4取整。

SECTIONS
{
    . = 0x30000000;

    . = ALIGN(4);
    .text      :
    {
      *(.text)
    }

    . = ALIGN(4);
    .rodata : { *(.rodata) }

    . = ALIGN(4);
    .data : { *(.data) }

    . = ALIGN(4);
    __bss_start = .;
    .bss : { *(.bss) *(.COMMON) }
    _end = .;
}

Uboot是裸机的集大成者,可以参考uboot链接脚本也是类似的。

上一篇:linux上使用J-Link调试S3C2440裸机代码


下一篇:websocket python实现原理