2年前,D3D11显卡刚出来没多久的时候,我曾经做过一个《NV GTX480对ATI HD5870:另一个视角》,用DX SDK的D3D11例子来对当时巅峰的显卡进行各个单项的性能评测。时过境迁,现在NV GTX680已经上市,硬指标对比如下表所示。
GTX 680
GTX 580
制程(nm)
28
40
晶体管数量(Million)
3540
3000
Die大小(mm^2)
294
520
显存(MB)
2048
1536
SM数量
8
16
核心配比
1536:128:32
512:64:48
核心频率(MHz)
1006-1058
772
shader频率(MHz)
N/A
1544
显存频率(MHz)
6008
4008
像素填充率(GP/s)
32.2
37.06
纹理填充率(GT/s)
128.8
49.41
...
上周的帖子刚提到NVIDIA宣布了CUDA 4,昨天就收到NV的邮件说CUDA 4.0 RC可以下载了。developer注册用户可以从http://developer.nvidia.com/object/cuda_4_0_RC_downloads.html找到。
本来不打算说什么,碰巧在某网站看到了一篇所谓的“新特性解析”,典型的一个不懂技术的小编装懂地写软文。所以我不得不在这里拨乱反正,以免国内读者受其误导。
CUDA 4.0的更新主要集中在三方面
简化并行程序的移植
加速多GPU编程
更好的工具链支持
简化并行程序移植
在CUDA(其实还有AMD的stream)出来之前,并行程序移植GPU只能直接用shader,限制诸多,代码不灵活,基本算重写,而不是移植。有了CUDA之后,情况有所好转。在CUDA 4.0下, ...
来自http://news.mydrivers.com/1/183/183598.htm
AMD今天终于在CES 2011开幕之际正式发布了筹备多年的Fusion APU融合加速处理器,也宣告了融合时代的正式带来。
AMD Fusion APU分为两大系列,现在面世的是基于山猫(Bobcat)处理器架构、DX11 GPU图形核心的低功耗版本,最多两个处理器核心,采用台积电40nm工艺制造。AMD称,山猫是其2003年以来的首个全新x86内核,专为低功耗便携 式设备而设计。
AMD Fusion APU首套平台代号“Brazos”,又称“2011低功耗平台”,芯片组统一采用单芯片设计的Hudson-M1,处理器包括两个子系列:
- Zatcate E系列:E-350 1.6GHz双核心、E-240 1.5GHz单核心,热设计功耗18W,面向主流笔记本、一体机、小型台式 ...
From http://developer.nvidia.com/object/gpu-ai-board-games.html
This technology preview is a snapshot of some internal research we have been working on and talking about at various conferences for the past couple years. The level of interest in GPU-accelerated AI has continued to grow, so we are making this (unsupported) snapshot available for developers who would like to experiment with the technology.
The software provided in this technology preview supports GPU accelerated game tree search of both the pruning and backtracking styles. While this technology primaril ...
自从NVIDIA的GTX480推出以来,网上能见到不少对比评测。但大家一般都是用3DMark之类大型的评测方法,得到的结果比较笼统。我在这里打算评测的方法是用DX SDK Feb2010的sample,对GPU的不同模块分开评测。这样的结果对于图形相关人员更有意义。
我的评测打算分三轮进行,分别评测传统图形流水线,DirectCompute和Tessellation的性能。测试的机器是两台Dell T5400 Workstation(Xeon E5440 4-core,4GB内存),分别装一块GTX480和一块HD5870。两块显卡都是公版配置。操作系统是Win7 64bit,使用传统界面以消除Areo界面的PS开销。显卡驱动分别是Forceware 197.41和Catalyst 10.3。
第一轮 传统图形流水线
第一论测试的是两块显卡在游戏常见 ...