CUDA npp运动检测模块性能测试

测试环境:

Cpu:       Intel(R)Core(TM)i7-4790 CPU @3.6GHZ

GPU:        NVIDIA GeForce GTX960 *2

操作系统:   Windows 7 专业版 64位操作系统

内存:        安装内存(RAM)      16.0GB

显存:        4g*2

       测试指标

   测试项目

单帧耗mean500P

 GPU占用率

显存占用

UnitM

Cpu占用率

内存占用

UnitM

1080p

1 路

9.23ms

98% / 0%

237 / 0

0%

263

1080p

2 路

9.05ms

98% / 98%

237 / 237

0-1%

528

1080p

4 路

18ms

99% / 99%

389 / 389

0-1%

528

1080p

8 路

35.5ms

99% / 99%

702 / 702

0-1%

529

1080p

16路

72.5ms

99% / 99%

1325 / 1325

0-1%

520

1080p

24路

109.5ms

99% / 99%

2339 /2339

0-1%

522

720p

1 路

4.27ms

96% / 0%

153/0

0%

263

720p

2 路

4.2ms

96% / 96%

153/153

0%

528

720p

4 路

8ms

99%/99%

225/225

0-1%

515

720p

8 路

16ms

99%/99%

370/370

0-1%

519

720p

16路

32ms

99%/99%

661/661

0-1%

520

720p

32路

65ms

99%/99%

1243/1243

0-1%

523

4cif

1 路

2.1ms

90%-90%

121 / 0

0-1%

341

4cif

2 路

2ms

91% / 91%

121 / 121

0-1%

518

4cif

4 路

3.5ms

99% / 99%

162 / 162

0-1%

519

4cif

8 路

7ms

99% / 99%

244 / 244

0-1%

519

4cif

16路

14ms

99% / 99%

408 / 408

0-1%

521

4cif

32路

28.5ms

96% / 96%

737 / 737

0-1%

524

4cif

64路

102ms

55% / 55%

1394 / 1394

0-1%

529

注: 1. 上述测试的每一路对应主机程序的一个线程。

2. 上述的所有测试不考虑主机和内存之间的数据拷贝,单纯的测试GPU的计算能力

所以cpu基本处于空闲状态。

分析:1. 随着主机线程数目的增多,线程之间的调度时间延时会导致GPU占用率下降

2. 比较此前测试的GTX760显卡, GTX960的计算能力略弱,但多线程能力稍强。

上一篇:【BZOJ-4590】自动刷题机 二分 + 判定


下一篇:Exception in thread "main" org.apache.poi.poifs.filesystem.OfficeXmlFileException