Skip to content

Archive

Category: GPU
[zh] 在WinXP下,即使GPU支持D3D10+,也只能用D3D9的API。但实际上各个厂商都对D3D9做了一些扩展,把部分D3D10+的特性暴露给了D3D9 API。以下是一些特殊的纹理格式,通过FOURCC的方式来使用。通过CheckDeviceFormat可以检测是否支持该格式,在CreateTexture的时候传入即可。下表的源头是各厂商的GPU文档,经过Unity的Aras整理而来: Usage列:DS=DepthStencil,RT=RenderTarget;Resource列:tex=texture,surf=surface。越绿表示越多硬件支持。 [/zh] [en] In WinXP, even a GPU supports D3D10+ can only uses D3D9 API. Actually, most GPU vendors have their extensions, some D3D10+'s features are exposed to D3D9 AP ...
上个月的一篇帖子提到了ATI OpenGL驱动的一些陷阱,随着ATI驱动每个月的新版本不断发布,这些问题是否得到改善呢? glBlitFramebufferEXT 情况一样,没有任何变化,还是没法用:(。 glClearBuffer* WTF,没有任何变化,还是没法用。 glBeginConditionalRender 已经改进!如果glBeginConditionalRender和glEndConditionalRender完全严格地配对使用,就能正常工作,不会造成恐怖的死锁。如果一旦不小心没有遵循配对使用的规则,照死锁不误。NVIDIA的驱动上不配对也没发生任何错误,虽然确实不该那么用。 新发现的问题 在改进海洋渲染的过程中,displacement texture从ABGR16f改成了ABGR8,结果在ATI OpenGL的情况下一片平坦。经过其他测试后的结 ...
From http://developer.nvidia.com/object/gpu-ai-board-games.html This technology preview is a snapshot of some internal research we have been working on and talking about at various conferences for the past couple years. The level of interest in GPU-accelerated AI has continued to grow, so we are making this (unsupported) snapshot available for developers who would like to experiment with the technology. The software provided in this technology preview supports GPU accelerated game tree search of both the pruning and backtracking styles. While this technology primaril ...
多年前NVIDIA就发布了3D Vision技术,能提供多种立体渲染的效果。随着2009年的电影阿凡达所带来的世界性3D狂潮,你是否也想在自己的程序中加入立体渲染呢? 3D Vision的原理 根据http://developer.nvidia.com/object/3d_stereo_dev.html,3D Vision的原理如下: 在驱动内部,所有3D场景都渲染两次——一次用左眼,一次用右眼。驱动会自动“在线”修改典型的3D游戏vertex shader,所以在执行期可以产生正确的图像。 注意加粗的几个词所透露出来的信息。首先,你的每一个Draw call都被驱动变成了两个Draw call;其次,立体化的过程是自动的,无法自由控制;第三,它只能处理典型的vertex shader,而不是任意的vertex shader,比如sky box的vert ...
新的和改进的CUDA库 在Fermi架构的GPU上,CUBLAS中所有类型的矩阵乘法(包括带转置的)性能提升50%至300% 在Fermi架构的GPU上,CUFFT针对基数为3、5、7的转换大小做了性能优化,现在比MKL快2到10倍 新增GPU加速稀疏矩阵函数的CUSPARSE库,对于稀疏/稀疏和实密/稀疏操作,比MKL快5到30倍 新增GPU加速随机数生成(RNG)函数的CURAND库,支持Sobol准随机数和XORWOW伪随机数函数,比MKL中类似的函数快10到20倍 H.264编码/解码库现在也包含到CUDA Toolkit中了 CUDA驱动和CUDA C Runtime 支持最新的6GB Quadro和Tesla 对于Windows工作站上的Tesla GPU,现在也可以开启高性能Tesla计算群集(TCC)模式 开发工具 cuda-gdb和Parallel N ...
果不其然,在驱动泄露没多久之后,GTX580正式来临,并带着最新的262.99 WHQL驱动。
在下一版的KlayGE中,D3D9插件光荣退休,OpenGL插件将要取代它在WinXP下的位置。众所周知,ATI的OpenGL驱动一直毛病众多。因此解决OpenGL插件在ATI卡上出现的错误成了当务之急。本文就讨论一下在增强OpenGL插件的过程中遇到的陷阱及其解决方法。测试的显卡为HD5870,所有问题在9.12-10.10的驱动中都会出现。 glBlitFramebufferEXT 在以前的版本里,OpenGL插件在ATI显卡上的文字显示总是乱码。一开始怀疑是vbo或者shader造成的,最后定位在texture本身。在texture的局部拷贝过程中,OpenGL插件用的是GL_EXT_framebuffer_blit扩展的glBlitFramebufferEXT。ATI驱动对GL_EXT_framebuffer_blit的支持似乎并不完善,结果是虽然什么错误都没发生, ...
从Cuda 3.2 RC所带的261.00驱动来看,GF GTX580赫然在列,同时还有GF GTS 455和GF 405(还能更差些么),看来580很快将降临人间。 NV 261.00驱动下载 桌面: R261.00 Vista / Seven 64-bit R261.00 Vista / Seven 32-bit R261.00 XP 32-bit R261.00 XP 64-bit 笔记本: R261.00 Vista / Seven 64-bit for Notebook R261.00 Vista / Seven 32-bit for Notebook R261.00 XP 32-bit for Notebook R261.00 XP 64-bit for Notebook
DX SDK June 2010的shader编译器改了很多,在ATI卡上一切安好,而在NV的D3D11卡上,PNTriangles和SubD等D3D11例子都执行失败。老一点的驱动是就剩下点了,没有三角形,259.xx的驱动是破碎的三角形。最后到260.93和260.99才解决问题。今天看到一个帖子http://blogs.msdn.com/b/chuckw/archive/2010/10/27/june-2010-hlsl-compiler-issue-with-tessellation.aspx,里面提到了用#pragma的方法关掉新编译器的优化,也同样能解决。 其实归根到底,还是NV驱动的bug才对,所以建议大家升级驱动。
自从NVIDIA的GTX480推出以来,网上能见到不少对比评测。但大家一般都是用3DMark之类大型的评测方法,得到的结果比较笼统。我在这里打算评测的方法是用DX SDK Feb2010的sample,对GPU的不同模块分开评测。这样的结果对于图形相关人员更有意义。 我的评测打算分三轮进行,分别评测传统图形流水线,DirectCompute和Tessellation的性能。测试的机器是两台Dell T5400 Workstation(Xeon E5440 4-core,4GB内存),分别装一块GTX480和一块HD5870。两块显卡都是公版配置。操作系统是Win7 64bit,使用传统界面以消除Areo界面的PS开销。显卡驱动分别是Forceware 197.41和Catalyst 10.3。 第一轮 传统图形流水线 第一论测试的是两块显卡在游戏常见 ...