最近这几个版本经常出现一些比较大的改进,需要跨多个版本才能实现。所以一直没写改进的文章。现在4.14很快就要发布了,逼自己把渲染部分的重要变化总结一下吧。
Cluster shading成为默认渲染框架
在4.11里,曾经有个实验性质的cluster shading。那时候性能还不如tile based shading,所以也就默认关闭。在4.12中,cluster shading经过了一系列的优化,终于在性能上赶上来了。所以也就能取代tile based shading,成为默认的渲染框架。
对Cluster shading的优化主要集中在cluster如何划分上。经过对不同参数组合的尝试,找到最佳的一组。不过本来的想法是用pixel shader实现shading的部分,而不是compute shader。那样的话就能让不支持compute ...
上一篇讲了tone mapping的改进。作为引擎的一个长期议题,优化是不可缺少的。本篇就讲讲在4.10中引入的新优化。
CPU端
在profiler里看到的占据CPU耗用第一名的一直是驱动。原先一直没在意这个,前一阵自己看了一下,发现前几位的好几个都是在SceneManager里,而且都和渲染队列相关。具体情况是,在每一帧确定渲染队列的时候,会执行一遍这样的步骤:
扫描一遍场景里的所有SceneObject,根据它的Renderable的类型建立一个从Renderable到SceneObject列表的unordered_map,每个物体作为那个Renderable的instance
把unordered_map中的Renderable建立一个队列
渲染这个队列
销毁unordered_map
所以其实这里的unordered_map只是 ...
本系列前面的五篇已经让引擎可以在D3D12下跑通所有的例子。但这并不代表功能已经齐全。其中很多例子能跑通的原因,是因为例子本身有fall back的代码,允许在没有各种高级功能的情况下运行。Compute shader就是其中的一个。本篇将会讲解如何加入compute shader,以及在此过程中遇到的一个大坑。
计算引擎
和以前的API不同的是,D3D12是个多引擎的API,可以让硬件的不同的独立部分异步执行,以提高效率。D3D12里的引擎有,渲染引擎、计算引擎和拷贝引擎。这三个引擎有不同的指令队列,可以在程序的控制下并行执行和互相同步。所以,在D3D12里,推荐的做法是,渲染和计算分开,放到不同引擎执行。所以虽然compute shader也可以在渲染引擎执行 ...
经过前面的练习,实现query已经没什么难的了。
Query heap
在D3D12里,query也是放在heap中。但和其他heap不同的是,query heap与其说是heap,不如说是array。它并不需要设置给设备,而是相当于一次可以提交多个query。Query heap的数量不限,所以为了简单实现,可以给每个query建立一个query heap。
D3D12_QUERY_HEAP_DESC query_heap_desc;
query_heap_desc.Type = D3D12_QUERY_HEAP_TYPE_OCCLUSION;
query_heap_desc.Count = 1;
query_heap_desc.NodeMask = 0;
ID3D12QueryHeap* query_heap;
TIF(device->CreateQueryHeap(&query_heap_desc, IID_ID3D12QueryHeap,
reinterpret_cast<void**>(&query_heap))); ...
上一篇把完成了一个最基本的D3D12程序,画一个三角形。同时我也说了,没有回头路。本篇将开始从11on12转向纯D3D12。
上一篇我们的假设假设是最基本的系统,关掉所有post process、UI、文字,就渲染一个三角形。这样的系统至少需要一个vertex buffer、一个rtv、一个vs、一个ps、一次clear、一次draw call。进一步的发展需要一个稍微复杂的系统,有文字和UI。也就是还需要一个index buffer、一个cbv、一个srv、一个sampler。Index buffer和vertex buffer的构建没区别,所以就是cbv、srv和sampler的事情。
在此之前,需要先介绍两个D3D12的概念,heap和root signature。因为CBV/SRV/UAV/Sampler都需要依赖于这两个。
Heap
Heap是D3D12新 ...
从八月初开始正式做D3D12插件以来,经过5个星期、每天平均一小时的开发,终于达成了第一阶段的目标:在渲染层接口不变的情况下,用纯D3D12渲染所有例子。
其实还不是所有特性都实现了。在例子中,遇到这种情况会退回到另一条code path。原先这些code path是为了在较弱的硬件上也能达到同样的效果,同样也可以用于开发新插件的中间产品。还没实现的特性有:
Stream output(退回到render to texture)
Compute shader(退回到用pixel shader实现)
UAVs
No overwrite(退回到discard)
Query(总是返回0)
Indirect draw
Depth stencil和压缩纹理的mipmap生成(退回到在CPU上生成)
下一个阶段会进一步实现这些特性,做 ...
上一篇把资源转成了用12的设备建立,下一步有点犯难了。
让我们做一个假设。要让一个最基本的系统能渲染起来,换句话说,关掉所有post process、UI、文字,就渲染一个三角形。至少需要一个vertex buffer、一个rtv、一个vs、一个ps、一次clear、一次draw call。Vertex buffer的问题已经解决;vs和ps本身和11的一样;clear和11的几乎一样,只要改成调用graphics command list上的函数即可;draw call也是。好了,那么问题就集中在
如何使用rtv;
如何组装起来渲染
但无论如何,这都是不归路。我们只能向前走,再也没法像前面那样,用11on12来让两者交互使用。
RTV
D3D12里的RTV是放在一个heap里的,使用的时候把heap里的一个hand ...
上一篇我们讲了如何建立D3D12的设备,并在其之上建立出11on12的设备。接下去就要开始一步一步转移到纯D3D12下了。
第一个应该转的是相对独立的资源,包括buffer和texture。建立D3D12的资源,之后用前文说的CreateWrappedResource转成D3D11的资源,继续交给D3D11on12渲染就可以了。这样仍然可以往前走一小步,保证引擎还能工作。
Buffer
Buffer包括vertex buffer、index buffer和constant buffer。
D3D12_HEAP_PROPERTIES heap_prop;
heap_prop.Type = D3D12_HEAP_TYPE_UPLOAD;
heap_prop.CPUPageProperty = D3D12_CPU_PAGE_PROPERTY_UNKNOWN;
heap_prop.MemoryPoolPreference = D3D12_MEMORY_POOL_UNKNOWN;
heap_prop.CreationNode ...
自从去年GDC释出了一些消息以来,D3D12 SDK终于在上个月底随着VS2015RC公开了。除了API的更新,D3D12还包含了一个称为11on12的库,让移植前所未有的快捷。目前KlayGE的D3D12插件正在开发中,本系列文章将会把一些方法和经验总结出来。简单起见,后续的代码省略了错误检查等细节。同时,阅读本系列的前提是对D3D11有基本的了解。
D3D移植的过去
纵观D3D的历史,几乎每个版本都是从新开发,和旧版本没有接口上的继承关系。也就是说,和一般COM组件的概念不同,不能从新版本的接口QueryInterface出老版本的接口。结果就是,每次需要移植到新的D3D版本,都会需要拷贝代码、修改代码,甚至重写。在整个渲染部分都换到新API之前,系统完全无法工 ...