产品型号: B-PCIE-K7F5XILINX的Kintex-7系列FPGA处理器
B-PCIE-K7F5是一款基于PCI Express总线架构的高性能FPGA算法加速卡,该板卡采用Xilinx的高性能28nm 7系列FPGA作为运算节点。Xilinx的28nm 7系列FPGA通过对资源、接口以及时钟的优化,在高性能计算(High Performance Computing)上表现出卓越的性能。Kintex-7系列FPGA具有优化的GTX高速收发器,最高支持12.5Gbps线速率,具有百万门级的逻辑资源,尤其适合于大规模逻辑运算。
B-PCIE-K7F5算法加速卡具有5片高性能FPGA处理节点,其中1片Kintex-7系列高容量高性能FPGA(具体型号为:XC7K420T-2FFG901I)作为主FPGA,其余4片Kintex-7系列低容量FPGA(具体型号为:XC7K325T-2FFG676I)作为从FPGA,主从处理节点之间全部采用高速串行通信进行数据交互。
主FPGA主要完成与各个处理节点之间的数据交换、对各个处理节点进行任务分配、资源调度、数据分发等。此外主FPGA还将完成高速串行接口GTX(SFP+万兆光纤接口)扩展、高性能PCIE DMA控制器等功能。
从FPGA主要完成主FPGA分解的算法模块,4个高容量运算节点进行并行运算,各个节点之间通过高速GTX串行接口进行数据交互。
板卡具有高带宽大容量动态缓存,其中各个处理节点均载有两组大容量DDR3 SDRAM缓存单元,用于完成处理复杂逻辑与算法时的数据缓存,适合于乒乓操作。其中每片FPGA的高性能BANK(HP)外挂4片4Gb 16位DDR3 SDRAM颗粒,通过Fly-by拓扑结构构成一组64位的DDR3缓存单元,最高可工作在800MHz时钟频率,其中数据速率可以达到1600M*64bps,DDR3 SDRAM效率可以达到90%以上。每片FPGA的宽范围BANK(HR)外挂2片4Gb 16位DDR3 SDRAM,可独立工作在高达400MHz的时钟频率下,其中数据速率可以达到800M*32bps。
硬件指标
- 标准PCI Express全高全长卡,适合于普通服务器、工作站;
- 符合PCI Express Gen2.0规范,x8模式,理论带宽高达4GByte/s;
- 板载5片Kintex-7系列FPGA处理器: 主FPGA:1片Kintex-7系列 FPGA(XC7K420T-2FFG901I),可与XC7K355T-2FFG901I兼容。 从FPGA:4片Kintex-7系列FPGA(XC7K325T-2FFG676I),可与XC7K410T-2FFG676I、XC7K160T-2FFG676I兼容。
- 每两个从处理节点之间都通过x4的高速串行总线进行互联(支持各种高速串行协议,如RapidIO、Aurora等)。
- 主处理节点与从处理节点之间通过x4的高速串行总线进行互联(支持各种高速串行协议,如RapidIO、Aurora等);
- 板载4路SFP+光纤通道,用于高速串行接口的扩展,最大支持10Gbps/lane线速率,理论传输带宽可达4Gbyte/s。光纤通道串行接口支持各种通信协议,例如RapidIO、Aurora64b/66b以及万兆网络等;
- 每片FPGA均挂载2组DDR3 SDRAM内存,其中HR BANK挂2片4Gb DDR3颗粒,组成32位内存总线,可工作在400MHz时钟频率;HP BANK挂4片4Gb DDR3颗粒,组成64位内存总线,可工作在800MHz时钟频率;两组DDR3可进行乒乓操作。
- 板载高精度有源晶振,温度稳定性高达±0.28ppm,老化率±1ppm;
- 板卡具有1路外时钟输入;
- 板卡具有2个独立的低偏斜、高精度全局时钟网络: 全局时钟网络1: 100MHz LVDS差分时钟网络,用于PCIE接口; 全局时钟网络2: 156.25MHz LVDS差分时钟网络,用于SRIO通信参考时钟;
- 板载8位拨码开关,可通过拨码开关选择板卡的工作模式;
- 具有调试指示灯;
- 板载1片FRAM,用于存储少量参数信息;
- 板载1片32MByte BPI Nor Flash,用于主FPGA的加载;
- 板载4片SPI Flash用于从FPGA的加载。
- 支持Chipscope在线调试加载;
- 支持菊花链式JTAG调试接口;
功能特性
- 从FPGA(XC7K325T)处理性能:
-
- FPGA采用Xilinx的Kintex-7系列(XC7K325T);
- 逻辑资源:50,950个Slices、326,080个逻辑单元;
- 存储器资源:最大4000Kb分布式RAM,445kb块RAM;
- 时钟资源:具有10个CMTs;
- IO资源:最大支持400个单端IO,最大支持192个差分IO;
- 具有1个PCIE Endpoint,支持gen2;
- 具有16个Gbits收发器,最大支持12.5Gbps。
- 主FPGA(XC7K420T)处理性能:
-
- FPGA采用Xilinx的Kintex-7系列(XC7K420T);
- 逻辑资源:65,150个Slices、416,960个逻辑单元;
- 存储器资源:最大5938Kb分布式RAM,835kb块RAM;
- 时钟资源:具有8个CMTs;
- IO资源:最大支持300个单端IO,最大支持144个差分IO;
- 具有1个PCIE Endpoint,支持gen2;
- 具有32个低功耗GTX Transceivers,最大支持12.5Gbps。
- 互联性能:
-
- 4个从FPGA: 两两之间通过x4 SRIO互联,支持SRIO gen2@5Gbps/lane,理论带宽可以到达20Gbps。 两两之间通过x16的IO相连,用于传输低速的控制与配置信号。
- 主FPGA与4个从FPGA: 通过x4 SRIO互联,支持SRIO gen2@5Gbps/lane,理论带宽可以到达20Gbps。 主FPGA与各个从FPGA之间有x4的IO相连,用于传输低速的控制信号。
- 存储性能:
- FPGA的HP BANK: 每一个FPGA的HP BANK支持4Gb 64位 DDR3 SDRAM,可独立工作在800M的时钟频率下,数据速率为1600x64bit,运行效率高达90%;
- FPGA的HR BANK: 每一个FPGA的HR BANK支持4Gb 32位DDR3 SDRAM,可独立工作在400MHz时钟频率下,数据速率为800Mx32bit,运行效率高达90%;
接口特性
- 标准PCIE全高全长卡;
- 板卡具有4路SFP+光纤通道,LC接口,支持10G光模块;
- PCIe金手指:x8 金手指,适用于x8、x16机箱;
- 板卡具有1路外时钟输入,通过SMA连接器输入。
软件支持
- FPGA软件支持:
-
- PCIE DMA链路控制;
- FPGA之间的SRIO通信;
- 板卡与板卡之间的10G光纤接口通信。
- 其他软件支持:
- 定制算法与逻辑;
- 定制PC机驱动与演示程序。
- 支持win7 64位/32位操作系统,支持Linux操作系统。
应用场景
- 高性能计算;
- 服务器硬件加速;
- 算法验证平台。
物理特征
物理与电气特征 | |
板卡尺寸 |
106.65*352.19mm |
板卡供电 |
2A max@12VDC(±5%) |
散热方式 |
风冷散热 |
工作环境 | |
工作温度 |
-40°~+85°C(工业级) |
存储温度 |
-55°~+125°C |
工作湿度 |
5%~95%,非凝结 |
可靠性指标 | |
使用寿命 |
>10年 |
MTTR |
<20分钟 |
MTBF |
10,000,000小时 |
质量标准 |
优势(对比DINIGROUP公司的DNK7_F5PCIE)
对比项目 |
DNK7_F5PCIE |
B-PCIE-K7F5 |
结论 |
处理性能 |
5片K7系列FPGA,1片Virtex-6系列FPGA |
5片Kintex-7系列FPGA |
更优化的结构 |
逻辑资源 |
410K + 325K*4 |
420K + 325K*4 |
优于 |
高速串行收发器 |
主 FPGA:16个GTX |
主FPGA:32个GTX |
优于 |
互联方式 |
互联方式:46位并行总线 |
互联方式:串行SRIO x4 |
优于 |
接口类型 |
4个千兆以太网口 |
2个千兆网口+2个万兆光口 |
|
GTX扩展 |
无 |
4路高速万兆光纤,更易于与系统内其它板卡互联 |
优于 |
PCIE接口 |
支持PCIE gen1 x4,最高支持2.5Gbps线速率 |
支持PCIe gen2 x8,最高支持5Gbps线速率,总数据带宽:4GByte |
等同 |
B-PCIE-K7F5与DINI公司的DNK7_F5PCIE比较最大特色在于:
(1)采用高容量高性能的420T FPGA,简化了PCIE设计,增加了GTX数量,使得系统互联更方便。省去了Virtex-6 FPGA作为PCIE桥片。
(2)互联方式均采用RapidIO高速串行互联,简化了设计,提高了性能。
全文转自: