Tech article - KlayGE游戏引擎

实时全方向非平面反射

Dec 6

KlayGE 4.1支持由王清源提供的屏幕空间反射，但由于只是屏幕空间，反射方向就被局限到跟视线相同的方向。在即将发布的KlayGE 4.2中，这个功能被扩展到了支持多个方向，成为了实时的全方向非平面反射。（虽然7月底就已经实现了这个功能，但到现在才有时间整理出demo...）多方向反射必然需要往不同方向渲染多次场景，而且每一次都必须是带lighting和shading的效果。因此，Deferred rendering layer引入了multi-viewport的功能，只要定义几个不同的viewport，就能同时得到不同视点的场景渲染结果，包括当前帧的RGB/depth，和上一帧的RGB/depth。这个功能不但能用在反射，还能用于分屏显示、多视角显示、缩略图等游戏常见的情景。这样相当于 ...

2 Comments SSR Read more

完整的顶点压缩

Nov 11

KlayGE, Tech article

在压缩tangent frame一文中，我们看到了把tangent frame压缩到4个字节的方法。现在让我们看看如何压缩其他属性，以达到减小顶点数据的目的。顶点属性首先看看完整的顶点都包含了哪些属性：属性类型大小（字节）备注 position float3 12 texcoord float2 8 tangent float3 12 binormal float3 12 normal float3 12 blend_index uint4 16 骨骼动画模型才有 blend_weight float4 16 骨骼动画模型才有总共 88 经过tangent frame压缩，同时一般引擎都会把blend_index和blend_weight存入uint32，顶点格式就成了：属性类型大小（字 ...

1 Comment compression Read more

在Deferred框架中轻松实现Decal

Oct 31

KlayGE, Tech article

现代3D游戏经常会需要用到decal，子弹孔、脚印……传统的decal渲染从Quake 2时代开始就没怎么变过，通过画一个紧贴着物体的四边形来实现。问题一直很多，比如光照的不一致，z-fighting造成的闪烁，渲染状态的来回切换，等等。那么到了deferred框架中，这种情况会有所好转吗？有趣的是，deferred框架内实现decal不但非常容易：100行之内的代码量，不到20分钟就能完成，而且非常稳定，完全没有上述各种缺点。更有趣的是，deferred的decal被至少三组不同的人都提出过完全相同的算法，都在讨论会出现的相同问题，只是被分别叫成了不同的名字。现在看看这三组： Crytek的Jan Krassnigg在2010年于Game Engine Gems 1里的一篇文章A Deferred D ...

4 Comments Decal, Deferred Read more

纯后处理的volumetric light

Oct 15

Tech article

按照先前的计划，KlayGE 4.2中将加入volumetric light的效果，目前已经由Parsifal Wang实现并集成入引擎中。这里的volumetric light，或者说light shaft，方法上类似于CE和3DMark的做法——把场景渲染得到的depth texture和color texture进行radial blur，得到的结果在通过alpha blend叠加回原先的结果。具体算法可以参考GPU Gems 3的文章。这个方法还是相当快的。在GTX 480上只要0.3ms，在NVS 4200M这种低端移动显卡上也只要2.5ms。目前仍存在一些优化的空间，以后速度还能更快。打开volumetric light，静帧的效果没有动起来好看：关闭volumetric light：

Comments Off volumetric Read more

在程序中掌控NVIDIA Optimus

Sep 23

DirectX, Tech article

NVIDIA的Optimus技术可以在笔记本上兼顾耗电量和性能，并能做到自动无缝切换。但问题就在于，不想让它自动的时候，该怎么办？在ThinkPad T420s上，NV的独立显卡是NVS 4200M，feature level支持到D3D 11.0；Intel的集成显卡是HD 3000，feature level支持到D3D 10.1。（对feature level还不熟悉的朋友可以看这篇）在BIOS中控制支持Optimus的平台上，在BIOS中可以找到选项，可以选择使用NV、Intel或者自动切换。但这个是静态的，每次切换都得重启，肯定不是我们想要的。在右键菜单中控制在exe文件的图标上按右键，菜单里有一个“用图形处理器运行”的项，里面可以选择NV卡或者Intel卡。有趣的是，如果你在程序中枚举adapter，总会返回两块 ...

10 Comments NVAPI, NVIDIA, Optimus Read more

压缩tangent frame

Sep 21

Tech article

前言：对tangent frame的压缩，其实在2008年做All-frequency rendering of dynamic, spatially-varying reflectance这篇paper的过程中，就曾在茶余饭后讨论过这个事情。这其实是个很trivial的问题，但看到Crytek和Avalanche分别在两年的SIGGRAPH talk上都煞有介事地提到这个问题，才想写这篇blog介绍一下。 Avalanche Studios的Emil Persson，也就是Humus，在SIGGRAPH 2012上的talk Creating Vast Game Worlds中提到了他们在游戏中如何压缩顶点数据，其中对于tangent frame的压缩与去年Crytek的Spherical Skinning with Dual-Quaternions and QTangents的压缩方法极其相似。但在两者的介绍中，由于某些原因，总有一些细节的陷阱没有提到。 ...

3 Comments compression, tangent Read more

未来属于SVO？

Sep 4

Tech article

在刚刚结束的SIGGRAPH 2012上，Cyril Crassin提出的Sparse Voxel Octree（SVO）极其热门，几乎每个涉及到real time rendering的course和talk都免不了提及SVO。加上UE4将会采用SVO、idTech6早就说了将会采用SVO，更是起到了推波助澜的作用。那么SVO是什么，它能解决什么样的问题呢？ SVO简介 Voxelization 传统的mesh都表示成以三角形和四边形为单位的图元。而在SVO里，图元是更为简单和离散的voxel。每个voxel有其中心位置、大小等信息，但不需要考虑相互之间的拓扑关系。各种求交计算也变得简单了。从mesh转成voxel表达的过程就称为voxelization。 Voxelization的方法也是逐步发展过来的。从基于CPU的方法，到NVIDIA基于一层一层渲染 ...

18 Comments SIGGRAPH, SVO Read more

Normal2Height工具已经完成

May 1

KlayGE, Tech article

多年前就想为KlayGE做个Normal2Height的工具，一直没时间，现在终于抽空把它完成了。缘由 Normal map的来源有多种。游戏开发中常规的做法是根据高模和低模的位置对应关系生成height map，然后用height map生成normal map。这种情况下不必担心是否能得到高精度的height map。但很多低端的做法是让美术直接画normal map，根本没有高模。随着游戏渲染水平的提高，normal mapping（NM）这种1970年代的技术已经不能满足需要了，越来越多的游戏开始过渡到更精确的parallax mapping（PM）、parallax occlusion mapping（POM）甚至displacement mapping（DM）。他们除了normal map，还需要有height map才能工作。所以如果normal map是手绘而成，就 ...

5 Comments tool Read more

FFT镜头效果的新进展

Apr 28

GPU, KlayGE, Tech article

FFT镜头效果已经完成，并集成入KlayGE开发版中，命名为FFTLensEffectPostProcess。除此之外，还写了一个命令行工具，用于产生镜头效果的纹理。虽然FFT的方法能在一个pass内产生各种复杂的镜头效果，但目前性能低于默认的多重gaussian blur。其中最主要的开销来自于FFT本身，下面就着重就讨论一下GPU FFT的进展和未来。前不久我在用Pixel Shader实现FFT的时候，提到了用Compute Shader来实现FFT效率可以更高。之前Ocean的例子里就有用于实现波浪模拟的CS4 FFT（从NV的例子改进而成），它的输入和输出是1D Buffer的形式。为了更通用，在进入KlayGE核心的时候改成了2D Texture的形式。可惜的是，CS4不能写入纹理，就需要增加一个把Buffer转 ...

2 Comments dct, fft, shader Read more

Forward框架的逆袭：解析Forward+渲染

Apr 21

Tech article

AMD在7900系列显卡发布的时候同时推出了Leo demo，并说明它不是用近年流行的Deferred框架渲染完成，而是用到了一种叫Forward+的框架。这个框架不需要Deferred的大带宽要求，却仍能实时渲染上千光源。EG2012上有篇新paper叫做Forward+: Bringing Deferred Lighting to the Next Level，讲述的就是这个方法。但目前作者还没有放出该论文的全文，这里我只能通过只言片语和AMD的文档来解析这个神奇的Forward+。 Tiled-based Deferred Shading 在进入正题之前，我们先回顾一下Intel在SIGGRAPH Courses 2010里提到的Tiled-based Deferred Shading。它的算法框架是：生成G-Buffer，这一步和传统deferred shading一样。把G-Buffer划分成许 ...

4 Comments Deferred, forward Read more

Newer Entries Older Entries

KlayGE游戏引擎

Archive

实时全方向非平面反射

完整的顶点压缩

在Deferred框架中轻松实现Decal

纯后处理的volumetric light

在程序中掌控NVIDIA Optimus

压缩tangent frame

未来属于SVO？

Normal2Height工具已经完成

FFT镜头效果的新进展

Forward框架的逆袭：解析Forward+渲染

Blogroll

Categories

Sponsors

In-site Search

Archive

Blogroll

Tags

Categories

Sponsors

In-site Search