SAM4E单片机之旅——23、在AS6(GCC)中使用FPU

浮点单元(Floating Point Unit,FPU),是用于处理浮点数运算的单元。

为使用FPU,除了需要启用FPU外,还需要对编译器进行设置,以使其针对浮点运算生成特殊的指令。虽然在Atmel Studio 6中,开发板使用的工程模板中默认就完成了这两部分工作,但这次仍然对设置的方法进行介绍,同时简单测试一下FPU的效率。

一、 编译器设置

AS6.1 SP2中,使用的编译器为arm-none-eabi-gcc.exe,版本为4.7.3。其中“none”表示没有指定操作系统,“eabi”表示使用的二进制文件接口是eabi。

  1. 在ARM GCC中,可以使用-mfloat-abi选项设置浮点数的ABI:

    • soft: 调用软浮点库对浮点运算进行支持。在GCC中采用常用的指令来模拟浮点运算。

    • softfp: 使用FPU进行浮点数运算。但是在函数调用时,仍然使用通用的寄存器传递浮点数参数。这需要额外的类型转换的开销。

    • hard: 使用FPU进行浮点数运算。而且在函数调用时,使用FPU的寄存器传递浮点数参数。

    AS6.1使用的编译器,默认情况下即使用soft选项。而为了使用FPU,这里将使用softfp选项。

  2. 使用-mfpu选项设置FPU硬件的类型。

    SAM4E搭载了Cortex-M4F FPU,它实现了FPv4-SP版本(SP表示单精度)的浮点数扩展。另外,它也搭载了32个32位的单精度寄存器,而这些寄存器也可以被当作16个64位的双精度寄存器以进行load,store和move操作。

    所以需要将-mfpu赋值为fpv4-sp-d16。其中d16表示有16个64位寄存器。

  3. AS6中的设置。

    在解决方案管理器中,右键点击工程,进入属性页面。然后选中“Toolchain”选项卡,再选择“ARM/GUN C Complier”下的“Miscellaneous”选项,就可以看到自定义的编译器的选项了。

    可以看到,默认情况下已经追加了“-mfloat-abi=softfp -mfpu=vfpv4”的选项了。vfpv4默认表示vfpv4-D32,表示实现了完全的FPV4的版本,且配有32个64位寄存器。很明显,这是一个不怎么正确的设置,所以需要更改-mfloat-abi=softfp -mfpu= fpv4-sp-d16

    SAM4E单片机之旅——23、在AS6(GCC)中使用FPU

    注意,Release版本的配置中也需要进行修改

二、 启用FPU

开发板重置时,FPU是禁止访问的。但是AS6中使用的startup文件会根据编译器设置启用FPU。

  1. 启用FPU的方法

    向FPU的CPACR寄存器的CP10和CP11字段写入0b11即可开放FPU的完全访问权限。另外,在特权模式下才能读写该寄存器。

    在CMSIS中该寄存器的地址被定义成了保留地址。但是在fpu.h 中提供了相应的API:

    #include <fpu.h> // 会和sam.h的宏定义冲突,使用board.h即可
    fpu_enable();

    fpu_enable() 的实现如下:

    /** CPACR寄存器 */
    #define ADDR_CPACR 0xE000ED88
    #define REG_CPACR (*((volatile uint32_t *)ADDR_CPACR)) /** 保存CPU当前中断的状态,并屏蔽之 */
    irqflags_t flags;
    flags = cpu_irq_save(); /** 修改CPACR寄存器*/
    REG_CPACR |= (0xFu << 20); __DSB(); /** 等待寄存器修改完成*/
    __ISB(); /** 清空处理器流水线 */ /** 根据设置决定是否重新启用中断 */
    cpu_irq_restore(flags);
  2. AS6中已经完成的工作

    开发板使用的AS6的工程模板中,程序的入口函数是Reset_Handler()

    • 该函数在调用main() 函数之前,会执行以下代码:

      #if __FPU_USED
      fpu_enable();
      #endif
    • __FPU_USED在以下代码中定义:

      //...
      /* 判断使用的编译器是否为GCC */
      #elif defined ( __GNUC__ )
      /* 判断是否启用浮点运算,且运算不是用软件实现的 */
      #if defined (__VFP_FP__) && !defined(__SOFTFP__)
      /* 判断目标平台是否有FPU */
      #if (__FPU_PRESENT == 1)
      #define __FPU_USED 1
      #else
      //...
    • __FPU_PRESENT sam4e16e.h 中定义:

      /**< SAM4E16E does provide a FPU */
      #define __FPU_PRESENT 1

    所以,只需要设置好了编译器的参数,就可以自动启用FPU了。

    PS:__GNUC__ 在GCC编译器预定义的宏,__VFP_FP__ 在GCC启用浮点运算时预定义,__SOFTFP__ 是使用软模拟浮点运算时预定义。GCC可以使用“-dM –E”参数打印出预定义的宏。

三、 测试

在第一次示例教程中,我们使用了空循环来进行延时,来完成LED的闪烁工作。在这里,我们将这个空循环的循环体修改为对一个浮点数的运算。然后观察在是否使用硬件FPU时,LED闪烁的频率的差别。

将延时函数修改如下:

void Delay(int num)
{
volatile float f = 1.0f;
for (volatile int i = 0; i < 1024 * 64 * num; ++i )
f *= 1.1f;
}

然后分别使用“-mfloat-abi=softfp ”和“-mfloat-abi=soft ”选项编译并执行程序,观察LED闪烁的频率。

上一篇:Python随笔--爬虫(下载妹子图片)


下一篇:STM32启动文件详细解析(V3.5.0) 以:startup_stm32f10x_hd.s为例