作为一个程序员,追求程序的运行速度是正常的行为不过。
那么 GPU、CPU、内存、文件流、磁盘,速度到底相差多少?今天整理了一下。
1、GPU 在进行通用运算时,和 CPU 是一个数量级的。在进行重复劳动时,效率是 CPU 的几百倍了。
GPU,相当与 Windows 中的批处理。
执行一次动作没有什么速度优势。当你执行1000次、100000次,效率就体现出来了。
用 GPU 解码一张 JPEG 图片,和 CPU 相比,根本没有优势。
但如果你是解码 1000 张 JPEG 图片,效率就可观了。(CUDA SDK 中有示例,可自行测试)
这也是 GPU 存在的意义。
GPU 主要针对重复劳动,而 CPU 针对所有劳动。
所以 GPU 多用在 AI、游戏中。都是重复劳动的那种。
二者没有替代关系。但竞争关系是有的。
Intel 给 CPU 添加 AVX256/AVX512/AVX1024/AVX2048......指令,用于并行计算。
Nvidia 给 GPU 添加通用计算寄存器,用于通用计算。
2、CPU 的运算速度是内存存取速度的 250 倍左右。当然不是一概而论。
程序员在编程时,所谓的常量表优化,就是内存的存取了。
内存的存取极限就是你程序的运行极限了。
所以,当还需要进一步优化时,内存就不行了。只能依靠 CPU 的 SIMD 指令了。
当然你的算法也很关键。即能使用 SIMD 指令,又能多核并行,这样的算法速度肯定是宇宙无敌的了。
3、内存速度是文件流速度的 1.5 倍左右。
文件流是操作系统使用了虚拟内存的技术,解决磁盘效率低下而发明的。
速度上和内存相差不大。但毕竟使用的还是磁盘。
在代码优化时,可以多使用文件流的方式,毕竟接近内存速度了。
在处理大文件时,比较好用。因为你不可能将几个G的文件一并放进内存里。
4、磁盘速度:
HDD read:0200MB/S write:0150MB/S
SATA read:0550MB/S write:0500MB/S
SSD(PCIE4) read:3500MB/S write:3000MB/S (三星 970 evo plus)
SSD(PCIE5) read:7000MB/S write:6000MB/S (没有实测结果,根据报导推测)
大家在使用 Windows 时,都有体会。
复制文件时眼巴巴地看着那个数字。奇慢无比,无法忍受。又不得不忍着。
内存 DDR4 的读写速度是:50000MB/S(50GB/S) 左右。是 SSD5 的 7 倍,是 SSD4 的 15 倍。是 SATA 的 100 倍了。
换硬盘吧。哈哈哈。当然对于程序员代码效率并没有多少作用。
固态硬盘取代内存,看来还需要一段时间。
总结:
1、对于程序员而言,尽量不要频繁使用磁盘,将数据尽量一次性从磁盘取出,放进内存中。
最优的情况是在程序运行过程中,不使用磁盘。结束时,才使用磁盘。
2、如果不能一次性将数据放进内存,那么就使用文件流的方式。毕竟速度接近内存。
3、当你的程序跑在内存较小的机器上时,流方式,是你无法避免的选择。
4、CPU 指令固然重要,但你的算法更重要。优化算法才是你该干的事。