Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

前言

好久没写博客了,今天来共享一下最近研读的一篇论文吧,文章中[***.pdf]为参考文献可自行谷歌学术下载。因为本人还是个图形学菜鸟,所以有什么问题希望大家多多指正。

Stochastic Light Culling for VPLs on GGX Microsurfaces

词汇解析

VPL

VPL - virtual point light 虚拟点光源

以虚拟的点光源为间接光提供光照。可以在场景中分布多个虚拟点光源,对每个点光源的亮度都设置最大限度,这样就可以模拟在空间中传播的间接光。核心观点是,一般的光传输问题可以近似为计算许多虚拟点光源的直接照明的简单问题。

路径跟踪通过从相机开始跟踪光线来构建路径。在与场景的每个交点上,通过在交点表面上方的半球上随机采样一个出射方向(通常在每个交点上也估计直接光照)来继续路径。基于路径跟踪,双向方法跟踪摄像机子路径和光子路径,然后(确定地)将它们连接起来形成完整的路径。

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

Instant Radiosity (IR)是一种以特定方式构造这两组子路径的双向方法,如上图2所示。首先,生成并存储一组任意长度的光子路径[问题6]。为子路径上的每个顶点(不是路径上的每个点),会完整地储存局部环境:位置、法线、入射方向、BRDF和当前“通量”(即发光光源的辐射通量乘以顶点的吞吐量除以该点的路径的概率密度)。其目的是,为每个顶点存储足够的数据以计算从该顶点向任何方向散射的出射照度。如果按照这种思维,我们可以放弃原始路径的概念,而将顶点建模为一种不同寻常的点光源。由于这些不是场景中的物理光源,我们称之为虚拟点光源(VPLs)。

为了完成IR算法,在第二阶段为每个像素构造相机子路径。因为光的子路径是任意长的,所以只考虑长度为1的摄像机路径就足够了。然后,像所有的双向算法一样,IR将这些摄像机子路径的顶点连接到光路径的顶点,形成完整的路径。但是,由于VPL的生成是预处理过程,所以这个连接步骤与VPL对第一个摄像机命中点的直接照明相当。

一个基本的VPL照明方法总结如下:

第一阶段:生成VPL

    在场景中随机选择一个主光源,随机采样一个位置x\boldsymbol{\mathbf{x}}和方向ω\boldsymbol{\omega}(如果不处理直接照明,在此位置创建一个VPL)。

    追踪射线x+tω\boldsymbol{\mathbf{x}} + t\boldsymbol{\omega}。如果它与一个表面相交,那么在这个相交位置创建一个VPL

    使用俄罗斯轮盘随机决定是否终止路径。如果继续,则采样输出方向,基于BRDF和方向更新路径吞吐量,并继续跟踪。

第二阶段:使用VPL渲染

    为一个表面点着色,只需遍历所有VPL,测试其照明是否被阻挡,如果没有,计算各自的贡献。

[Scalable Realistic Rendering with Many-light Methods.pdf]

GGX

GGX是一种更精确的微表面分布函数,是一种描述微表面法线方向分布的函数,可对于表面粗糙的半透明物体和表面粗糙的不透明物体均可适用。

https://www.jianshu.com/p/be4f025aeb3c

Caustics

Caustics(光焦散)是由曲面或物体反射或折射的光的聚合,或该光的聚合在另一表面上的投影。光焦散是每条光与之相切的曲线或表面,将光的聚合线的边界定义为聚光曲线。因此,在相邻图像中,焦散可以是光斑或它们的明亮边缘。这些形状通常具有尖锐的奇点。光焦散的常见情形就是水波纹。

https://en.wikipedia.org/wiki/Caustic_(optics)

Helmholtz Reciprocity

Helmholtz互异性:入射角和出射角互换,函数值保持不变。

https://blog.****.net/weixin_41036461/article/details/79846176

Lightcuts

Lightcuts(光剪切)是第一种实用的、可扩展的多光源方法。在需要计算光照的每个接收点,Lightcuts会根据分析的每个群集的误差范围和感知指标生成自定义的切割。首先,基于空间和方向相似性,将VPL先组织成二叉树。要为接收点选择一个片段,我们从一个简单的粗略聚类开始,例如将所有灯光放在一个聚类中。这对应于仅由光树的根节点组成的剪切。然后,我们迭代地选择当前剪切中误差范围最大的聚类,并对其进行精炼以替换其在光树中的孩子。重复此过程,直到剪切中所有聚类的误差范围低于基于感知的阈值(通常设置为总数的2%)为止。剪切的大小通常仅取决于VPL的数量,与完全评估相比,随着VPL数量的增加,剪切速度会大大提高。使用分析误差界限还可以确保始终找到并评估最重要的VPL,从而使估算更加可靠。 Davidovic描述了渐进的、对GPU友好的Lightcuts变体。

然而,使用误差界限也有一些缺点。误差边界忽略了遮挡,并且通常过于保守,导致比最优剪切更大。此外,为新的材质模型开发良好的误差界限是具有挑战性和困难的。Lightcuts也没有利用附近接收点的剪切通常非常相似这一事实,而是为每个点从头生成一个剪切。

[Scalable Realistic Rendering with Many-light Methods.pdf]

[Lightcuts A Scalable Approach to Illumination.pdf]

阴影遮罩函数

masking-shadowing function即阴影遮罩函数(也称为可见性函数),是描述光线从入射到出射的过程中,有多少比例被微表面自身的凹凸不平遮挡主了。这部分和法线分布函数很像,依据的是表面的粗糙程度。为了准确描述,首先需要这样的一个函数:给一个方向,获得微表面在这个方向上被自遮挡的面积的比例。

[Geometrical shadowing of a random rough surface.pdf]

[Understanding the masking-shadowing function in microfacet-based BRDFs.pdf]

相关算法

光剔除技术

为了渲染虚拟点光源,并且限制这些点光源的影响范围,就需要对其进行光剔除。现在主要有以下几种光剔除算法:

溅射

splatting技术又称为溅射技术,核心思想是把数据场中每个体素看作一个能量源,当每个体素投向图像平面时,用以体素的投影点为中心的重建核将体素的能量扩散到图像像素上。这种方法之所以叫溅射是因为把能量由中心向四周逐渐扩散的状态形象地比喻为溅射的雪,就好像把一个雪球(体素)扔到一个玻璃盘子上,雪球散开以后,在撞击中心的雪量(对图像的贡献)最大,而随着离撞击中心距离的增加,雪量(贡献)减少。

在此论文中提出了一种包围椭球的方法。

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

目标是计算一个简单的有界区域,该区域之外的光照低于阈值。如上图3所示,对于漫射像素光,这个区域是蛋形的,而对于光滑的表面,其形状类似于光子叶瓣。注意,这些表面是包含空间衰减的等照度面,而不是发光的极坐标图!

出于实际的原因,我们在这两种情况下都使用椭球作为界。对于每个像素的光,我们必须计算椭球参数,并相应地转换一个球面三角形网格来减少三角形数量。

http://blog.sina.com.cn/s/blog_76373c430100yxjd.html

[Splatting Indirect Illumination.pdf]

分块剔除

tiled culling技术又称为分块剔除技术,该方法首先是将屏幕分成小块(比如16*16pixel),每个小块为一个视锥体;在每一个视锥体中,根据ZBuffer得到每个Tile的MinZ和MaxZ(depth bounds),用MinZ到MaxZ这片区域对光做交点测试(一般使用compute shader)——点光源只需要position和range,spotlight也用球来做剔除bound;剔除后,每个Tile里面的光的index写入list,得到Tile个光源index的list,找出场景中那些对当前Tile有贡献的光源,然后对每个Tile中的pixel,只需要计算其对应的Tile中light list内的光源对该像素的贡献;之后进行color pass。

Advancements in Tiled-Based Compute Rendering里面介绍了两种剔除方法,一种是视锥体剔除,一种是AABB剔除,AABB剔除结果好一些

https://blog.****.net/wolf96/article/details/85541991

http://loongstudio.com/wangkan/?p=1657

[Tiled Shading.pdf]

聚类着色

clustered shading技术又称为聚类着色技术,核心思想是给light list的划分增加了一个维度,即depth(当然也可以再增加normal的维度),它根据view frustum的zmin,zmax把场景进一步根据depth划分成若干个slice(基于指数的划分,通常16个),然后在每个slice上对场景中的所有灯光进行light culling,具体的计算方案和tiled based提到的一些方案类似,只是这里不再需要处理深度不连续的问题。

https://zhuanlan.zhihu.com/p/92165837

[Reflective Shadow Map Clustering for Real-Time Global Illumination.pdf]

交错采样

interleaved sampling(即交错采样技术)可以用于减少每个像素当中VPL的数量。

原始的交错采样

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

交错采样的基本思想非常简单,而且从图1中可以立即看出:在累加缓冲区方法中,不规则的采样模式固定在一个像素上,因此对所有像素周期性地重复采样,从而具有较高的像素间混叠的可能性(参见图1a)。对于交错采样,选择覆盖多个像素的不规则偏移模式。通过周期性地重复这个模式,规则的网格仍然像图1b中强调的那样持续存在,但是相邻的像素被不同的模式采样。注意,虽然规则网格的数目增加了,但有效地降低了像素间混叠的可能,并且样本总数保持不变。

[Interleaved Sampling.pdf]

[The Accumulation Buffer: Hardware Support for High-
Quality Rendering.pdf]

交错样本模式的非交错延迟着色

现在,我们使用缓冲区分割/聚合技术来展示延迟着色的扩展。它们被限制为低分辨率的分块子缓冲区,而不是在整个G-buffer上执行着色操作。与标准的延迟着色相比,增加了三个通道。第一个将G-buffer分成几个子缓冲区,第二个在着色阶段后重建交错采样模式,第三个利用相邻像素的空间相关性来混合不相关的光照对像素的贡献。因此,渲染管道现在被分解为5个步骤,如图3所示:

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

创建G-Buffer

在着色操作之前,首先创建三个分别包含位置、法线和颜色的浮点缓冲区(Gbuffer)。材料标识符等材料信息也打包在其余组件中。由于带宽的原因,精度被限制在16位,因此场景是有限的。

G-Buffer分割

初始的G-Buffer被分割成单独的子缓冲区。首先计算两个查找纹理。第一个存储分块函数,第二个存储块转换函数。然后,两个fragment程序依次执行这两个函数。完成后,将子缓冲区平铺到与初始缓冲区大小相同的缓冲区中。

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

块拆分:一个简单的想法是将拆分操作限制在较小的2D块中,以增强数据局部性。因此,将初始G缓冲区细分为p * q个块,并将每个块拆分为n * m个单独的子块。如果块足够小,则在访问过程中,内存访问将保持一致。经过此阶段后,每个子缓冲区被细分为p * q个子块,分布在整个缓冲区中,如上图2.c所示。

块转换:要重建每个子缓冲区,另一阶段将执行交错的子块的转换(请参见图2.c和2.d)。再次强调,由于整个块被移动,因此存储器访问保持一致。

着色计算

为每个子缓冲区计算不同光源的贡献。延迟着色可能进行的任何操作仍然可用。确实,由于以前的G-Buffer被明确地拆分为较小的子缓冲区,因此任何延迟的着色器也可以通过将视口聚焦或在给定的子缓冲区上绘制四边形来使用。然后获得小的辐照度子缓冲区的图块(参见图3.c)。可能会注意到,通过在标准阴影贴图中展开半立方体(或立方体)并用小立方体贴图重新索引它,可以解决半球形(或球形)点光源的可见性。根据应用程序的不同,最终可以使用两种着色技术:SSM(带阴影贴图的阴影)是具有阴影贴图重新投影的阴影传递,而SNSM(无阴影贴图的阴影)是没有阴影映射的阴影传递,阴影贴图重新投影(可见性被忽略)。在这两种情况下,都会处理光泽的BRDF和漫反射的BRDF。

缓冲聚合

一旦完成了着色操作,就可以通过聚合子缓冲区来重构交错模式。此过程与缓冲区拆分过程相反(请参见图3.d),并且出于相同的原因,它以两个过程执行,即块转换过程和块聚合过程。

滤波

为了保证交互性和实时性,每个像素中都值计算很少的光源贡献。如果将滤波应用于屏幕的连续区域,则可以利用场景的几何相干性来虚拟计算每个像素中有许多光源的贡献。

[Non-interleaved deferred shading of interleaved sample patterns.pdf]

主要目标

由于现存的光剔除技术需要限制光源的影响范围,所以会造成场景明显偏暗。

本文的方法为利用GGX微表面生成光滑的单反弹光焦散的实时绘制方法。该方法是基于VPL的随机光剔除,这是一种无偏差的剔除方法,可以随机确定每个VPL的光影响范围,并且是对每个VPL的包围椭球进行分块剔除。包围椭球的计算使用的是一种推导出的简单分析方法,可以为GGX微表面上的VPL生成更紧密的边界椭球。对于成千上万的VPL时,该方法结合交错采样比基于保守光栅化的聚类着色的速度更快(聚类着色法是最新的支持剔除边界椭球的技术)。

本文主要有如下贡献:

    将随机光剔除方法推广到光滑VPL的方向相关影响范围。

    从GGX微平面BRDF反射的VPL中解析地推导出光范围的包围椭球体。

    本文提出了一种有效的包围椭球体的分块剔除算法。

本文的绘制管线如下图2所示。上诉贡献在绘制管线中的橙色部分实现了。

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

算法细节

3 光滑虚拟点光源的随机光剔除

3.1 随机光剔除

随机光剔除算法是通过俄罗斯轮盘确定不重要[问题5]光源的影响范围来随机地删除不重要的光源。对于每一个光源,俄罗斯轮盘通过其在着色点的概率来决定是否剔除这个光源,这个概率与辐射率成正比。对于每一个点光源,其在某个着色点的辐射率如下:

L(ωo,l)=I(ωo)l2 L\left(\boldsymbol{\omega}_{o}, l\right)=\frac{I\left(\boldsymbol{\omega}_{o}\right)}{l^{2}}

其中,I(ωo)I(\boldsymbol{\omega}_{o})表示辐射强度,ωOS2\boldsymbol{\omega}_{O}\in\mathcal{S}^{2}表示从点光源到着色点的方向,l[0,)l\in[0, \infty)表示从点光源到着色点的距离。

在这篇文章中,使用如下的概率函数:

p(ωo,l)=min(I(ωo)δl2,1) p\left(\boldsymbol{\omega}_{o}, l\right)=\min \left(\frac{I\left(\boldsymbol{\omega}_{o}\right)}{\delta l^{2}}, 1\right)

其中δ(0,)\delta \in(0, \infty)是一个用户自定义的参数(这篇文章用的δ=0.001\delta = 0.001)。

如果某个点没有被剔除的话(概率超过某个阈值),就会将它的辐射率除以概率值[问题1],如下所示:

L(ωo,l){L(ω0,l)p(ωo,l)(p(ωo,l)>ξ)0( otherwise ) L\left(\boldsymbol{\omega}_{o}, l\right) \approx\left\{\begin{array}{ll} \frac{L\left(\boldsymbol{\omega}_{0}, l\right)}{p\left(\boldsymbol{\omega}_{o}, l\right)} & \left(p\left(\boldsymbol{\omega}_{o}, l\right)>\xi\right) \\ 0 & (\text { otherwise }) \end{array}\right.

其中,ξ[0,1)\xi \in[0,1)是一个统一的随机数。

随机光剔除算法中,对每一个光源都使用单个随机数ξ\xi;并且对于一个给定的光源,所有的着色点都会使用相同的ξ\xi。这样做的好处就是可以限制每个光源的影响范围,并且能够以无偏差的方式时利用现有的剔除方法。

3.2 虚拟点光源的BRDF相关影响范围

Tokuyoshi为了使用包围球和现有的块剔除方法,但却忽略了概率函数p(ωo,l)p\left(\boldsymbol{\omega}_{o}, l\right)的方向性。这篇文章考虑了光滑虚拟点光源的方向性,如下图4所示:

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

所以,某个VPL的辐射强度计算如下:

I(ωo)=Φf(ωi,ωo)max(ωon,0)I\left(\boldsymbol{\omega}_{o}\right)=\Phi f\left(\boldsymbol{\omega}_{i}, \boldsymbol{\omega}_{o}\right) \max \left(\boldsymbol{\omega}_{o} \cdot \mathbf{n}, 0\right)

其中Φ\Phi表示光子到达VPL处的辐射通量,f(ωi,ωo)f\left(\boldsymbol{\omega}_{i}, \boldsymbol{\omega}_{o}\right)是BRDF,ωiS2\boldsymbol{\omega}_{i} \in \mathcal{S}^{2}是光子的入射方向,nS2\mathbf{n} \in \mathcal{S}^{2}是VPL处的几何法线。因此,上图4所示的VPL的影响范围如下:

lmax(ωo)=p1(ξ)=Φf(ωi,ωo)max(ωon,0)δξl_{\max }\left(\boldsymbol{\omega}_{o}\right)=p^{-1}(\xi)=\sqrt{\frac{\Phi f\left(\boldsymbol{\omega}_{i}, \boldsymbol{\omega}_{o}\right) \max \left(\boldsymbol{\omega}_{o} \cdot \mathbf{n}, 0\right)}{\delta \xi}}

其中lmax(ωo)l_{\max }\left(\boldsymbol{\omega}_{o}\right)是BRDF(f(ωi,ωo)f\left(\boldsymbol{\omega}_{i}, \boldsymbol{\omega}_{o}\right))所反射的辐射率的等值面。为了绑定这个等值面,我们使用了与Dachsbacher溅射算法中使用过类似的椭球面。但与之不同的是,我们为GGX微平面的BRDF引入了包围椭球。

公式推导如下:

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读
(字丑,见谅)

4 GGX反射的包围椭球

4.1 GGX微平面的BRDF

建模微平面的BRDF可以用来表示粗糙平面光的反射,BRDF计算如下:

f(ωi,ωo)=F(ωiωh)G2(ωi,ωo)D(ωhn)4ωinωonf\left(\boldsymbol{\omega}_{i}, \boldsymbol{\omega}_{o}\right)=\frac{F\left(\boldsymbol{\omega}_{i} \cdot \boldsymbol{\omega}_{h}\right) G_{2}\left(\boldsymbol{\omega}_{i}, \boldsymbol{\omega}_{o}\right) D\left(\boldsymbol{\omega}_{h} \cdot \mathbf{n}\right)}{4\left|\boldsymbol{\omega}_{i} \cdot \mathbf{n} \| \boldsymbol{\omega}_{o} \cdot \mathbf{n}\right|}

其中,ωh=ωi+ωoωi+ωo\boldsymbol{\omega}_{h}=\frac{\boldsymbol{\omega}_{i}+\boldsymbol{\omega}_{o}}{\left\|\boldsymbol{\omega}_{i}+\boldsymbol{\omega}_{o}\right\|}表示半程向量,F(ωiωh)[0,1]F\left(\boldsymbol{\omega}_{i} \cdot \boldsymbol{\omega}_{h}\right) \in[0,1]是菲涅尔因子。

D(ωhn)D\left(\boldsymbol{\omega}_{h} \cdot \mathbf{n}\right)是NDF,表示微平面法线的分布。在GGX中,NDF是一个钟形的函数,定义如下:

D(cosθm)=α2χ+(cosθm)π(α2cos2θm+sin2θm)2D\left(\cos \theta_{m}\right)=\frac{\alpha^{2} \chi^{+}\left(\cos \theta_{m}\right)}{\pi\left(\alpha^{2} \cos ^{2} \theta_{m}+\sin ^{2} \theta_{m}\right)^{2}}

其中,α\alpha是粗糙度参数,χ+(cosθm)\chi^{+}(\cos \theta_{m})是海维赛德函数:如果cosθm>0\cos \theta_{m} > 0,则表示1;如果cosθm0\cos \theta_{m} \leq 0,则表示0。本文假定α(0,1]\alpha \in(0,1],这在计算机图形学的数据压缩中很常用,并且很容易被艺术家控制。如果α(0,1]\alpha \in(0,1],那么GGX的NDF在cosθm[0,π/2]\cos \theta_m \in[0,\pi/2]时单调递减。

G2(ωi,ωo)[0,1]G_{2}\left(\boldsymbol{\omega}_{i}, \boldsymbol{\omega}_{o}\right) \in[0,1]是阴影遮蔽函数。在本文中,我们使用Smith微平面模型,因为这个遮蔽函数是可分离的[问题2]:

G1(ωi,ωh)=χ+(ωiωh)G1dist (ωi)G_{1}\left(\boldsymbol{\omega}_{i}, \boldsymbol{\omega}_{h}\right)=\chi^{+}\left(\boldsymbol{\omega}_{i} \cdot \boldsymbol{\omega}_{h}\right) G_{1}^{\text {dist }}\left(\boldsymbol{\omega}_{i}\right)

其中,χ+(ωiωh)\chi^{+}(\boldsymbol{\omega}_{i} \cdot \boldsymbol{\omega}_{h})表示的是正面微平面的二元可见性,并且G1dist(ωi)G_{1}^{dist}(\boldsymbol{\omega}_i)ωh\boldsymbol{\omega}_h无关。根据可见法线分布的约束,G1dist(ωi)G_{1}^{dist}(\boldsymbol{\omega}_i)定义如下:

G1dist (ωi)=ωinS2D(ωn)max(ωiω,0)dω=2ωinωin+(1α2)(ωin)2+α2\begin{aligned} G_{1}^{\text {dist }}\left(\boldsymbol{\omega}_{i}\right) &=\frac{\left|\boldsymbol{\omega}_{i} \cdot \mathbf{n}\right|}{\int_{\mathcal{S}^{2}} D(\boldsymbol{\omega} \cdot \mathbf{n}) \max \left(\boldsymbol{\omega}_{i} \cdot \boldsymbol{\omega}, 0\right) \mathrm{d} \boldsymbol{\omega}} \\ &=\frac{2\left|\boldsymbol{\omega}_{i} \cdot \mathbf{n}\right|}{\left|\boldsymbol{\omega}_{i} \cdot \mathbf{n}\right|+\sqrt{\left(1-\alpha^{2}\right)\left(\boldsymbol{\omega}_{i} \cdot \mathbf{n}\right)^{2}+\alpha^{2}}} \end{aligned}

Smith阴影遮蔽函数有几种形式(比如高度相关的形式),但任何形式都满足G2(ωi,ωo)G1dist (ωi)G_{2}\left(\boldsymbol{\omega}_{i}, \boldsymbol{\omega}_{o}\right) \leq G_{1}^{\text {dist }}\left(\boldsymbol{\omega}_{i}\right)

4.2 包围椭球

因为微平面的BRDF是非常复杂的,所以我们考虑使用一个简化的函数来表示反射波瓣(简化函数大于等于反射波瓣),定义如下:

f(ωi,ωo)max(ωon,0)Fmax(ωi)G1dist(ωi)D(ωhn)4ωinf\left(\boldsymbol{\omega}_{i}, \boldsymbol{\omega}_{o}\right) \max \left(\boldsymbol{\omega}_{o} \cdot \mathbf{n}, 0\right) \leq \frac{F_{\max }\left(\boldsymbol{\omega}_{i}\right) G_{1}^{\mathrm{dist}}\left(\boldsymbol{\omega}_{i}\right) D\left(\boldsymbol{\omega}_{h} \cdot \mathbf{n}\right)}{4\left|\boldsymbol{\omega}_{i} \cdot \mathbf{n}\right|}

其中,Fmax(ωi)F_{\max}(\boldsymbol{\omega}_i)是对于ωi\boldsymbol{\omega}_i来说最大的菲涅尔因子。在不等式右边,与ωo\boldsymbol{\omega}_o有关的就只有NDF的D(ωhn)D(\boldsymbol{\omega}_h \cdot \boldsymbol{n})。当出射方向ωo\boldsymbol{\omega}_o位于以理想镜面反射方向为中心的球形圆上时,ωh\boldsymbol{\omega}_h是一个位于半短轴为θ2\frac{\theta}{2}的球形椭圆上(如下图5.a和5.b)或半长轴为θ2\frac{\theta}{2}的球形双曲线上(如下图5.c),其中理想镜面反射方向为ωu=2(ωin)nωi\boldsymbol{\omega}_{u}=2\left(\boldsymbol{\omega}_{i} \cdot \mathbf{n}\right) \mathbf{n}-\boldsymbol{\omega}_{i},球形圆的半径为θ=arccos(ωoωu)\theta=\arccos \left(\boldsymbol{\omega}_{o} \cdot \boldsymbol{\omega}_{u}\right)θ\theta表示出射方向ωo\boldsymbol{\omega}_o与理想镜面反射方向ωu\boldsymbol{\omega}_u之间的夹角。

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

因此,我们可以获得一个在ωh\boldsymbol{\omega}_hn\boldsymbol{n}之间的角度下界[问题3]:

arccos(ωhn)θ2\arccos \left(\boldsymbol{\omega}_{h} \cdot \mathbf{n}\right) \geq \frac{\theta}{2}

当出射方向ωo\boldsymbol{\omega}_o位于经过入射方向ωi\boldsymbol{\omega}_i和法线n\boldsymbol{n}的大圆上时,不等式左右相等。对于α(0,1]\alpha \in(0,1],因为GGX的NDF是单调递减的,根据上式就有:

D(ωhn)D(cosθ2)D\left(\boldsymbol{\omega}_{h} \cdot \mathbf{n}\right) \leq D\left(\cos \frac{\theta}{2}\right)

因此,基于GGX的光滑反射的等值面就被如下的面s(ωo)s(\boldsymbol{\omega}_o)所包围:

lmax(ωo)s(ωo)=ΦFmax(ωi)G1dist (ωi)D(cosθ2)4δξωin=rπD(cosθ2)\begin{aligned} l_{\max }\left(\boldsymbol{\omega}_{o}\right) \leq s\left(\boldsymbol{\omega}_{o}\right) &=\sqrt{\frac{\Phi F_{\max }\left(\boldsymbol{\omega}_{i}\right) G_{1}^{\text {dist }}\left(\boldsymbol{\omega}_{i}\right) D\left(\cos \frac{\theta}{2}\right)}{4 \delta \xi\left|\boldsymbol{\omega}_{i} \cdot \mathbf{n}\right|}} \\ &=r \sqrt{\pi D\left(\cos \frac{\theta}{2}\right)} \end{aligned}

其中,r=ΦFmax(ωi)G1dist (ωi)4πδξωinr=\sqrt{\frac{\Phi F_{\max }\left(\boldsymbol{\omega}_{i}\right) G_{1}^{\text {dist }}\left(\boldsymbol{\omega}_{i}\right)}{4 \pi \delta \xi\left|\boldsymbol{\omega}_{i} \cdot \mathbf{n}\right|}}。意外的是,这个平面s(ωo)s(\boldsymbol{\omega}_o)是一个椭球体,如下图6所示(推导见附录A)。

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

这个椭球体的半轴是(α\alpha表示粗糙度参数):

(ru,rv,rw)=(1+α22αr,r,r)\left(r_{u}, r_{v}, r_{w}\right)=\left(\frac{1+\alpha^{2}}{2 \alpha} r, r, r\right)

这个椭球体的旋转矩阵是:

R=[ωuωw×ωuωw]\mathbf{R}=\left[\begin{array}{lll} \boldsymbol{\omega}_{u} & \boldsymbol{\omega}_{w} \times \boldsymbol{\omega}_{u} & \boldsymbol{\omega}_{w} \end{array}\right]

其中,ωwS2\boldsymbol{\omega}_w \in\mathcal{S}^{2}是一个单位向量,且与ωu\boldsymbol{\omega}_un\boldsymbol{n}正交(也就是,ωw=ωu×nωu×n\boldsymbol{\omega}_{w}=\frac{\boldsymbol{\omega}_{u} \times \boldsymbol{n}}{\|\boldsymbol{\omega}_{u} \times \boldsymbol{n}\|},当ωun\boldsymbol{\omega}_u \neq \boldsymbol{n})。

这个椭球体的中心是:

c=q+1α22αrωu\mathbf{c}=\mathbf{q}+\frac{1-\alpha^{2}}{2 \alpha} r \omega_{u}

其中,qR3\mathbf{q} \in \mathbb{R}^{3}是VPL的位置。

5 使用包围椭球的分块剔除

尽管基于光栅化的剔除方法支持包围椭球,但本文扩展基于计算的分块剔除方法来使用包围椭球。这种基于计算的剔除方法比基于光栅化的剔除方法更高效、代价更低,因为对于成千上万的光源来说,随机光剔除是与交错采样结合使用的。这种扩展在数学上是微不足道的,但是它的计算代价却高于包围球。因此,本文引入了一个优化的方法。

5.1 椭球-截椎体的相交测试

在视图空间中,对于每一个分块,分块剔除都会执行包围体和截椎体的粗略的相交测试(如下图7.a)。

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

这个视图空间的椭球体使用一个旋转矩阵R^=VR\hat{\mathbf{R}}=\mathbf{V R}和一个中心位置c^=Vc+o\hat{\mathbf{c}}=\mathbf{V} \mathbf{c}+\boldsymbol{o}来表示,其中,3x3的矩阵V\mathbf{V}表示从世界空间到视图空间的旋转,oR3\boldsymbol{o} \in \mathbb{R}^{3}表示从世界空间到视图空间的平移。该椭球体与截锥体的相交测试可等价地表示为球面与截锥体的相交测试,其方法是利用以下变换矩阵对空间进行拉伸:

S=R^[1ru0001rv0001rw]R^T\mathbf{S}=\mathbf{\hat{R}}\left[\begin{array}{ccc} \frac{1}{r_{u}} & 0 & 0 \\ 0 & \frac{1}{r_{v}} & 0 \\ 0 & 0 & \frac{1}{r_{w}} \end{array}\right] \mathbf{\hat{R}}^{T}

使用这个变换矩阵,每一个包围椭球体都会被拉伸到单位球(如图7.b)。因此,通过变换每一个光源的测试空间,我们能够对包围椭球做一些修改就可以重用现有的基于包围球的剔除方法。本文采用了Modified HalfZ剔除法,这个方法使用两个深度聚类和一个截椎体的轴对齐包围盒(AABB)来对包围球-截椎体进行粗糙的相交测试。

5.1.1 Modified HalfZ剔除法

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

图1.4显示了一个分块包围体的2D表示。如图1.4(a)所示,背景物体前面的前景物体会导致分块包围体的深度范围变大。光源可以位于前景和背景之间的空白空间,这样可以通过相交测试,但实际上不影响任何分块中的任何像素。也就是说,深度不连续会导致假阳性交点的增加。

图1.4(b)显示了称为Half Z方法,它是可以更好地处理深度不连续的策略。它只是在中点将深度范围划分为两个,并根据两个深度范围进行筛选:一个是从最小Z到半Z,另一个是从半Z到最大Z。并且逐块为每个深度范围维护一个单独的列表,该方法只需要两个额外的平面测试。

图1.4©显示了第二种策略,称为Modified HalfZ方法。它执行附加的原子操作以在最小Z和半Z之间找到第二个最大值(最大值Z2),在最小Z和半Z之间找到第二个最小值(最小Z2)。相比Half Z方法,这样可以形成更紧密的包围体,但是,由于需要额外的原子操作,计算附加的最小值和最大值比简单地计算半Z要昂贵得多。

5.2 通过旋转测试空间来加速

对于代码优化,大多数现有的剔除方法实现都假定了截椎体的深度平面是与z轴垂直的。然而,我们的拉伸变换却打破了这个假设。这就增加了相交测试的AABB计算的代码复杂度。另外,由于拉伸后的截椎体与AABB的不匹配(如图7.b),就会捕获很多的误报。为了缓和这些问题,本文使用如下的旋转矩阵对测试空间进行额外的旋转:

B={[bxbxbz×bxbz×bxbzbz]T(bx>by)[by×bzby×bzbyby.bzbz]T (otherwise) \mathbf{B}=\left\{\begin{array}{ll} {\left[\frac{\mathbf{b}_{x}}{\left\|\mathbf{b}_{x}\right\|} \quad \frac{\mathbf{b}_{z} \times \mathbf{b}_{x}}{\left\|\mathbf{b}_{z} \times \mathbf{b}_{x}\right\|}\right.} & \left.\frac{\mathbf{b}_{z}}{\left\|\mathbf{b}_{z}\right\|}\right]^{\mathrm{T}} \quad\left(\left\|\mathbf{b}_{x}\right\|>\left\|\mathbf{b}_{y}\right\|\right) \\ {\left[\frac{\mathbf{b}_{y} \times \mathbf{b}_{z}}{\left\|\mathbf{b}_{y} \times \mathbf{b}_{z}\right\|} \quad \frac{\mathbf{b}_{y}}{\left\|\mathbf{b}_{y}\right\|}\right.} & .\left.\frac{\mathbf{b}_{z}}{\left\|\mathbf{b}_{z}\right\|}\right]^{\mathrm{T}} \quad \text { (otherwise) } \end{array}\right.

其中,bx=S[100]T\mathbf{b}_{x}=\mathbf{S}\left[\begin{array}{lll}1 & 0 & 0\end{array}\right]^{\mathrm{T}}by=S[010]T\mathbf{b}_{y}=\mathbf{S}\left[\begin{array}{lll}0 & 1 & 0\end{array}\right]^{\mathrm{T}},并且bz=bx×by\mathbf{b}_{z}=\mathbf{b}_{x} \times \mathbf{b}_{y}。旋转矩阵B\mathbf{B}用于使变换后的截椎体的深度平面与z轴保持垂直(如图7.c)。这就能让我们简化AABB的计算代码,并且计算一个对剪切后的截锥体包裹更紧密的AABB。在本文中,每一个光源的矩阵BS\mathbf{BS}和位置BSc^\mathbf{BS\hat{c}}被计算后都会存储到内存当中。然后,在光剔除阶段的椭球体-截锥体相交测试时,都会加载这些BS\mathbf{BS}BSc^\mathbf{BS\hat{c}}

实现细节

交错采样

除了随机光剔除,本文使用了对GPU友好的交错采样技术来减少每个像素中VPL的数量(如下图8所示)。首先,该技术将规则采样模式中的像素去交错到屏幕的子区域中。然后,对于每一个子区域,使用不同的VPL的子集来进行着色。比如,对65536个VPL使用8x8的交错采样,每一个子区域的VPL数量就会减少到1024个。在本文中,我们的随机光剔除在每个子区域中都会执行。所以,这种交错采样技术不仅减少了着色的时间,还减少了剔除的时间。我们基于分块延迟着色的方法在单通道下实现了这个算法交错样本模式的非交错延迟着色。尽管方差在渲染的图像中可见为噪声,但是在后期处理中使用交叉双边滤波器可以消除此噪声。

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

漫反射VPL

尽管包围椭球也可以用于漫反射VPL,这个形状(由Dachsbacher导出的)几乎是一个球体。因此,对于漫反射VPL,我们使用的是包围球,其半径等于椭球的最长半轴。在本文中,包围球的中心点位置和半径分别由q+(13)34Φkπδξn\mathbf{q}+\left(\frac{1}{3}\right)^{\frac{3}{4}} \sqrt{\frac{\Phi k}{\pi \delta \xi}} \mathbf{n}(427)14Φkπδξ\left(\frac{4}{27}\right)^{\frac{1}{4}} \sqrt{\frac{\Phi k}{\pi \delta \xi}}随机给定,其中,k是漫反射系数。

不足和改进

高度镜面的表面

尽管我们的方法通过每一个VPL的贡献来剔除VPL,但渲染的质量会受到剔除前VPL密度的限制,类似于lightcuts。因此,对于高频的BRDF有必要生成更多的VPL(如下图11所示)。对于这种大量VPL的情况来说,着色之前的剔除阶段将会是瓶颈。另外,后处理的去噪会模糊细节处的光焦散。我们的方法不能渲染由完美镜面反射的光焦散(即α=0\alpha = 0时)。

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

光滑对光滑的相互反射

尽管本文提高了光滑VPL的采样的效率,但由于采样概率的问题,仍然忽略了着色点处的BRDF。如果着色点处是高度镜面的BRDF(如下图12所示),这个限制会造成显著的差异(即噪声)。在实际中,对于漫反射对光滑和光滑对光滑的相互反射,应该使用有偏差的近似方法(如屏幕空间的反射,screen-space reflection),而不是我们的方法。考虑到光滑对光滑的相互反射,未来的研究可能会研究一种无偏差的剔除方法。

Stochastic Light Culling for VPLs on GGX Microsurfaces论文研读

各向异性反射瓣

对于由入射方向ωi\boldsymbol{\omega}_i和法线n\boldsymbol{n}定义的平面来说,我们的包围椭球体可以很好地拟合。另一方面,对于方向ωw\boldsymbol{\omega}_w(与这个平面正交)来说,包围椭球会非常松弛。这是因为微平面BRDF模型的反射瓣对于掠射入射方向(a grazing incoming direction[问题4])是各向异性的。因此,可能要减少半轴rwr_w的空间。此外,我们的包围椭球体没有考虑NDF的各向异性。尽管对于一个各向异性的NDF,包围椭球体可以通过最大的粗糙度来计算,但是这样会形成一个松弛的包围体。根据这种各向异性的反射来缩小包围椭球体也是我们未来的工作。

问题

问题1

如果用辐射率除以概率值的话,不就增强了光源的辐射率了吗?(概率值小于等于1)。这样是否会违背能量守恒定理?且分别将L(ωo,l)L\left(\boldsymbol{\omega}_{o}, l\right)p(ωo,l)p\left(\boldsymbol{\omega}_{o}, l\right)带入后计算得出的L(ωo,l)δL(\boldsymbol{\omega}_{o}, l) \approx\delta

a: 1、除以概率值是为了补偿被轮盘截断的光强;2、见上面公式推导

问题2

这个可分离是怎么分离的:G1G_1G2G_2有什么关系,或者怎么将G1G_1用于GGX的BRDF?

a:详见阴影遮罩函数解析。

问题3

为什么是下界呢?

a:因为ωo\boldsymbol{\omega}_oωu\boldsymbol{\omega}_u之间的夹角为θ\theta,所以当ωi\boldsymbol{\omega}_iωo\boldsymbol{\omega}_oωu\boldsymbol{\omega}_u三者共面的时候,ωh\boldsymbol{\omega}_hnn之间的夹角最小(为θ2\frac{\theta}{2});当ωo\boldsymbol{\omega}_oωi\boldsymbol{\omega}_iωu\boldsymbol{\omega}_u不共面时,ωh\boldsymbol{\omega}_hnn之间的夹角就大于三者共面时的θ2\frac{\theta}{2},所以θ2\frac{\theta}{2}就是下界。

思维错误原因:以前认为θ\theta是一个固定值,所以ωh\boldsymbol{\omega}_hnn之间的夹角最小值是能够为0的,因此ωh\boldsymbol{\omega}_hnn之间的夹角肯定是可以小于这个固定值的。但是事实上θ\theta是由ωo\boldsymbol{\omega}_oωu\boldsymbol{\omega}_u确定的,其是一个可变量。但一旦确定了ωo\boldsymbol{\omega}_oωu\boldsymbol{\omega}_u的方向,θ\theta也就确定了,这个时候ωh\boldsymbol{\omega}_h的方向也就确定了,但是由于ωo\boldsymbol{\omega}_o可以在球形圆上的任意位置,所以ωh\boldsymbol{\omega}_hnn之间的夹角大小是处在一个范围内的,这个下界就是这个范围的最小值。

问题4

a grazing incoming direction是啥?

a: 掠射入射角。光从一种介质向另一种介质传播,入射角接近于90度时称之为掠射。注意:一定要从光疏介质(折射率小)向光密介质(折射率大),入射角一定要极其接近于90°。入射角为90°(事实上略小于90°,但在计算时完全可以按90°算)

问题5

这个重要性是怎么判断的?

a: 概率是取1与辐射率采样的较小值,如果某个VPL对该着色点来说重要的话,概率值就为1;如果不重要,就小于1。

问题6

这些信息怎么储存,2D纹理或者立方体纹理都不足够吧?使用3D纹理储存,还是直接保存在OpenGL缓冲中然后直接传给绘制?

a: 应该不是是用纹理存储,类似普通数组的存储方式