转载请注明出处为KlayGE游戏引擎,本文的永久链接为http://www.klayge.org/?p=2610

网上看到的GPU比较,都是桌面和桌面比,移动和移动比。很多人对此没有概念,总觉得移动的CPU/GPU在性能上也能比肩桌面CPU/GPU。那么就让我们来看看把各家的顶级GPU放在一起比硬指标,是什么样的结果吧。资料来自wikipedia和厂商自家宣传。

计算单元对比

Model Fab (nm) Core Clock rate API
Core (MHz) Memory (MHz)
NVIDIA GeForce GTX Titan 28 2688 836-993 6008 D3D 11.0, OpenGL 4.4, CUDA 5.5, OpenCL 1.2
NVIDIA Quadro K6000 28 2880 901.5 6008 D3D 11.0, OpenGL 4.4, CUDA 5.5, OpenCL 1.2
AMD Fusion APU 8670D 32 384 844-950 1066 D3D 11.0, OpenGL 4.3, OpenCL 1.2
AMD Radeon HD 8970 28 2048 1000-1050 6000 D3D 11.1, OpenGL 4.3, OpenCL 1.2
AMD Radeon Sky 700 28 1792 900 5500 D3D 11.1, OpenGL 4.2, OpenCL 1.2
Intel Iris Pro Graphics 5200 22 160 400-1300 1600 D3D 11.1, OpenGL 4.0, OpenCL 1.2
Intel Xeon Phi 7120P 22 244 1238-1333 5500 OpenMP, OpenCL, MKL
Qualcomm Adreno 330 (S800) 28 128 450 800 D3D 9.3, OpenGL ES 3.0
PowerVR SGX554 MP4 (A6X) 32 128 300 533 OpenGL ES 2.0, OpenCL 1.1
NVIDIA Tegra 4 28 72 672 1866 OpenGL ES 2.0
ARM Mali-T604 MP4 (Exynos 5 Dual) 32 64 533 800 D3D 9.1, OpenGL ES 3.0, OpenCL 1.1
Vivante GC4000(K3V2) 40 32 680 ??? D3D 9.3, OpenGL ES 3.0, OpenGL 3.0, OpenCL 1.2

计算单元上,因为没有太多电源的压力,桌面系统的频率和core数量都有非常明显的优势。从制造工艺上也可以看出,Intel领先其他厂商至少一代,桌面大多能领先移动一代。

内存对比

Model Memory Configuration
Bandwidth (GB/s) Bus width (bit)
NVIDIA GeForce GTX Titan 288 384
NVIDIA Quadro K6000 288 384
AMD Fusion APU 8670D 29.9 128
AMD Radeon HD 8970 288 384
AMD Radeon Sky 700 264 384
Intel Iris Pro Graphics 5200 25.6 128
Intel Xeon Phi 7120P 352 512
Qualcomm Adreno 330 (S800) 12.8 32
PowerVR SGX554 MP4 (A6X) 17 32
NVIDIA Tegra 4 29.8 32
ARM Mali-T604 MP4 (Exynos 5 Dual) 12.8 32
Vivante GC4000(K3V2) ??? 32

内存带宽上,桌面有着压倒性的优势。

性能和功耗对比

Model GFLOPS TDP GFLOPS/W
Float Double Float Double
NVIDIA GeForce GTX Titan 4500 1300 250 18.0 5.2
NVIDIA Quadro K6000 5196 1732 225 23.1 7.7
AMD Fusion APU 8670D 648.2 0 100 (SoC) 6.5 0
AMD Radeon HD 8970 4300 1075 250 17.2 4.3
AMD Radeon Sky 700 3225.6 806.4 225 14.3 3.6
Intel Iris Pro Graphics 5200 832 0 28 (SoC) 29.7 0
Intel Xeon Phi 7120P 2416 1208 300 8.1 4.0
Qualcomm Adreno 330 (S800) 129.6 0 3 43.2 0
PowerVR SGX554 MP4 (A6X) 76.8 0 4 (SoC) 19.2 0
NVIDIA Tegra 4 96.8 0 4 (SoC) 24.2 0
ARM Mali-T604 MP4 (Exynos 5 Dual) 68 0 4 (SoC) 17.0 0
Vivante GC4000(K3V2) 43.5 0 4 (SoC) 10.9 0

从这张表可以明显看出,桌面顶级GPU比移动顶级GPU的GFlops领先了几十倍甚至上百倍。如果要比GFlops/W,也没落后多少。考虑到Tile-based的硬件,渲染一个pixel需要的能量比传统架构要高很多,所以其实渲染同样结果的话,桌面的平均能耗比都能打败移动的。尤其是Intel Iris Pro Graphics 5200,相当抢眼。而对手的AMD Fusion APU 8670D则悲剧地成为能耗比最差的。

另外,表里面也混进去了奇怪的东西,Intel Xeon Phi 7120P。这其实不是GPU,是个有61核、244硬件线程的协处理器。天河2号就用的这个。它的性能功耗比不高,远比不上GPU。但因为是x86的核,能直接使用传统的多线程库,也比GPU更容易达到GFlops峰值。

未来

在几个月之内,AMD的Jaguar和Intel的Bay Trail都会推出。其中Tablets版本有望做到3-5W的TDP,比在更高的性能。移动方面,NV也已经有下一代移动GPU的原形,2W的功耗、接近1TFlops的性能。