转载请注明出处为KlayGE游戏引擎,本文的永久链接为http://www.klayge.org/?p=2610
网上看到的GPU比较,都是桌面和桌面比,移动和移动比。很多人对此没有概念,总觉得移动的CPU/GPU在性能上也能比肩桌面CPU/GPU。那么就让我们来看看把各家的顶级GPU放在一起比硬指标,是什么样的结果吧。资料来自wikipedia和厂商自家宣传。
计算单元对比
Model | Fab (nm) | Core | Clock rate | API | |
---|---|---|---|---|---|
Core (MHz) | Memory (MHz) | ||||
NVIDIA GeForce GTX Titan | 28 | 2688 | 836-993 | 6008 | D3D 11.0, OpenGL 4.4, CUDA 5.5, OpenCL 1.2 |
NVIDIA Quadro K6000 | 28 | 2880 | 901.5 | 6008 | D3D 11.0, OpenGL 4.4, CUDA 5.5, OpenCL 1.2 |
AMD Fusion APU 8670D | 32 | 384 | 844-950 | 1066 | D3D 11.0, OpenGL 4.3, OpenCL 1.2 |
AMD Radeon HD 8970 | 28 | 2048 | 1000-1050 | 6000 | D3D 11.1, OpenGL 4.3, OpenCL 1.2 |
AMD Radeon Sky 700 | 28 | 1792 | 900 | 5500 | D3D 11.1, OpenGL 4.2, OpenCL 1.2 |
Intel Iris Pro Graphics 5200 | 22 | 160 | 400-1300 | 1600 | D3D 11.1, OpenGL 4.0, OpenCL 1.2 |
Intel Xeon Phi 7120P | 22 | 244 | 1238-1333 | 5500 | OpenMP, OpenCL, MKL |
Qualcomm Adreno 330 (S800) | 28 | 128 | 450 | 800 | D3D 9.3, OpenGL ES 3.0 |
PowerVR SGX554 MP4 (A6X) | 32 | 128 | 300 | 533 | OpenGL ES 2.0, OpenCL 1.1 |
NVIDIA Tegra 4 | 28 | 72 | 672 | 1866 | OpenGL ES 2.0 |
ARM Mali-T604 MP4 (Exynos 5 Dual) | 32 | 64 | 533 | 800 | D3D 9.1, OpenGL ES 3.0, OpenCL 1.1 |
Vivante GC4000(K3V2) | 40 | 32 | 680 | ??? | D3D 9.3, OpenGL ES 3.0, OpenGL 3.0, OpenCL 1.2 |
计算单元上,因为没有太多电源的压力,桌面系统的频率和core数量都有非常明显的优势。从制造工艺上也可以看出,Intel领先其他厂商至少一代,桌面大多能领先移动一代。
内存对比
Model | Memory Configuration | |
---|---|---|
Bandwidth (GB/s) | Bus width (bit) | |
NVIDIA GeForce GTX Titan | 288 | 384 |
NVIDIA Quadro K6000 | 288 | 384 |
AMD Fusion APU 8670D | 29.9 | 128 |
AMD Radeon HD 8970 | 288 | 384 |
AMD Radeon Sky 700 | 264 | 384 |
Intel Iris Pro Graphics 5200 | 25.6 | 128 |
Intel Xeon Phi 7120P | 352 | 512 |
Qualcomm Adreno 330 (S800) | 12.8 | 32 |
PowerVR SGX554 MP4 (A6X) | 17 | 32 |
NVIDIA Tegra 4 | 29.8 | 32 |
ARM Mali-T604 MP4 (Exynos 5 Dual) | 12.8 | 32 |
Vivante GC4000(K3V2) | ??? | 32 |
内存带宽上,桌面有着压倒性的优势。
性能和功耗对比
Model | GFLOPS | TDP | GFLOPS/W | ||
---|---|---|---|---|---|
Float | Double | Float | Double | ||
NVIDIA GeForce GTX Titan | 4500 | 1300 | 250 | 18.0 | 5.2 |
NVIDIA Quadro K6000 | 5196 | 1732 | 225 | 23.1 | 7.7 |
AMD Fusion APU 8670D | 648.2 | 0 | 100 (SoC) | 6.5 | 0 |
AMD Radeon HD 8970 | 4300 | 1075 | 250 | 17.2 | 4.3 |
AMD Radeon Sky 700 | 3225.6 | 806.4 | 225 | 14.3 | 3.6 |
Intel Iris Pro Graphics 5200 | 832 | 0 | 28 (SoC) | 29.7 | 0 |
Intel Xeon Phi 7120P | 2416 | 1208 | 300 | 8.1 | 4.0 |
Qualcomm Adreno 330 (S800) | 129.6 | 0 | 3 | 43.2 | 0 |
PowerVR SGX554 MP4 (A6X) | 76.8 | 0 | 4 (SoC) | 19.2 | 0 |
NVIDIA Tegra 4 | 96.8 | 0 | 4 (SoC) | 24.2 | 0 |
ARM Mali-T604 MP4 (Exynos 5 Dual) | 68 | 0 | 4 (SoC) | 17.0 | 0 |
Vivante GC4000(K3V2) | 43.5 | 0 | 4 (SoC) | 10.9 | 0 |
从这张表可以明显看出,桌面顶级GPU比移动顶级GPU的GFlops领先了几十倍甚至上百倍。如果要比GFlops/W,也没落后多少。考虑到Tile-based的硬件,渲染一个pixel需要的能量比传统架构要高很多,所以其实渲染同样结果的话,桌面的平均能耗比都能打败移动的。尤其是Intel Iris Pro Graphics 5200,相当抢眼。而对手的AMD Fusion APU 8670D则悲剧地成为能耗比最差的。
另外,表里面也混进去了奇怪的东西,Intel Xeon Phi 7120P。这其实不是GPU,是个有61核、244硬件线程的协处理器。天河2号就用的这个。它的性能功耗比不高,远比不上GPU。但因为是x86的核,能直接使用传统的多线程库,也比GPU更容易达到GFlops峰值。
未来
在几个月之内,AMD的Jaguar和Intel的Bay Trail都会推出。其中Tablets版本有望做到3-5W的TDP,比在更高的性能。移动方面,NV也已经有下一代移动GPU的原形,2W的功耗、接近1TFlops的性能。
Comments