對作者心血表示感謝,先附上原文: http://www.86vr.com/teach/cursor/200410/3841.html
實(shí)時(shí)3D繪圖的陰影效果
目 錄
1 平面陰影 2 體積陰影
附帶的源程序(91KB)
在目前的實(shí)時(shí)3D繪圖中,要做出真實(shí)的陰影效果,是很不容易的。因?yàn)殛幱笆且蛭矬w遮住光源所產(chǎn)生的,因此,要做出正確的陰影效果,就需要對整個(gè)場景做處理,這樣才能判斷出哪些物體被哪些物體遮住了。
不過,目前的3D硬件,并不容易進(jìn)行這類的測試,因?yàn)橘Y料量和工作量都太大了。不過,這并不表示使用現(xiàn)在的3D硬件就無法做出陰影。現(xiàn)在已經(jīng)有很多方法是適合用在目前的3D硬件上面,可以產(chǎn)生效果不錯(cuò)的陰影。本文會(huì)就一些常用的方法,做簡單的介紹。
1、平面陰影
目前常用的方法,幾乎都是把陰影看成是“物體投射到其它表面”來處理。在光源是平行光的時(shí)候(例如,太陽光),可以看成是物體把陰影“投射”到另一個(gè)表面上,如下圖所示:
如果場景中只有一個(gè)重要的光源(即最強(qiáng)的光源),那可以假設(shè)只有這個(gè)光源會(huì)產(chǎn)生明顯的陰影。以平行光源來說,要把陰影“投射”到一個(gè)平面上,就是一件相當(dāng)容易的事。
設(shè)空間有一點(diǎn)V,平行光源的方向是L,要投射陰影的平面是P,那么,存在一常數(shù)k使
成立,如下圖(V、L、和 P均為四維向量,表示一個(gè)三維的齊次坐標(biāo):homogeneous coordinate):
解上式得
空間中的點(diǎn)V投影到平面P的位置是V+kP。對一個(gè)3D模型(model)的每個(gè)頂點(diǎn)都代入這個(gè)式子,就可以得到投影的結(jié)果了。不過,因?yàn)槟壳暗?D硬件都是以4×4的矩陣來做變換,所以如果能把投影的動(dòng)作寫成一個(gè)矩陣,就會(huì)方便很多。
設(shè)V = <Vx, Vy, Vz, 1>,L = <Lx, Ly, Lz, 0>,P = <a, b, c, d>;展開前面的式子,會(huì)發(fā)現(xiàn)k有一個(gè)分母:
因此這個(gè)式子會(huì)有點(diǎn)復(fù)雜。不過,因?yàn)樵贠penGL中的向量都是齊次坐標(biāo)(homogeneous coordinate),所以可以先把分母提出來,放到w中。對Vx展開得到:
整理一下得到
這樣就變成向量內(nèi)積的形式,可以放到矩陣中。對Vy和Vz做同樣的動(dòng)作,再加上放到w的分母部分,就可以得到下面的矩陣:
因此,理論上,要畫陰影時(shí),把MODELVIEW矩陣設(shè)成上面的矩陣,畫出物體,就會(huì)是陰影的樣子。
上面討論的是以平行光源為主。如果光源是點(diǎn)光源,也可以用類似的方法來做。
這個(gè)方法可以對任何平面做出陰影的效果。如果有多個(gè)平面,可以分別對每個(gè)平面都做一次。不過,這個(gè)方法顯然是沒辦法把陰影投影到曲面上。所以,這個(gè)方法通常稱為平面陰影(planar shadow)。
理論的部分已經(jīng)討論完了。不過,實(shí)作的時(shí)候,還有一些細(xì)節(jié)部分是需要特別注意的。
首先,如果真的直接用上面的方法來做,那做出來的結(jié)果可能會(huì)像這樣:
這是因?yàn)楫嬃藞D中的地板之后,再畫黑色的陰影時(shí),會(huì)和地板產(chǎn)生所謂的Z fighting現(xiàn)象,也就是陰影的一部分的Z值較地板的Z值小,所以會(huì)畫出來,但是有些部分的Z值則可能比地板的Z值大,所以就沒畫出來了。這種現(xiàn)象會(huì)使得陰影變得破碎不完整。
現(xiàn)在的3D硬件通常提供一個(gè)叫多邊形偏移(polygon offset)的功能,用來解決Z fighting的問題。多邊形偏移的原理,是在畫一個(gè)物體時(shí),要求把它的Z值進(jìn)行一個(gè)小的調(diào)整。例如,在上面的例子中,我們可以把陰影的Z值減一個(gè)小的數(shù)字,這樣就可以避免Z fighting的現(xiàn)象。
處理掉Z fighting后,再來是第二個(gè)問題:
上圖中,陰影跑到地板的外面去了。這里需要一個(gè)方法,把陰影切到地板的范圍內(nèi)。這個(gè)例子中,地板的邊界是直線,所以可以用user defined clip planes來做。不過,如果地板是奇怪的形狀,就需要?jiǎng)e的方法。
而且,光是把陰影切到地板的范圍內(nèi)是不夠的。通常陰影是用blending的方式畫上去的。如果一個(gè)物體的形狀比較復(fù)雜,那有些地方可能會(huì)blend兩次或更多次。這樣會(huì)讓陰影看起來不是同一個(gè)顏色,即有些地方顏色較深而有些地方較淺。
現(xiàn)在的3D硬件多半支持模板緩沖區(qū)(stencil buffer)。模板緩沖區(qū)是一個(gè)用來“做記號(hào)”的緩沖區(qū)。通常模板緩沖區(qū)可以存放1 bits到8 bits不等的數(shù)字,不同的硬件支持的大小會(huì)不一樣。目前的3D硬件通常把模板緩沖區(qū)和Z buffer放在一起。例如,它可能支持15 bits的Z buffer加上1 bit的模板緩沖區(qū);或是支持24 bits的Z buffer加上8 bit的模板緩沖區(qū)。因此,通常模板緩沖區(qū)的測試是和Z測試一起做的,也就是在使用Z buffer時(shí),模板緩沖區(qū)可說是“免費(fèi)”的。
在我們的例子中,可以先把模板緩沖區(qū)(stencil buffer)全清為0。在畫地板之前,把模板緩沖區(qū)設(shè)定為“當(dāng)Z測試通過時(shí),把模板的值設(shè)為1”。這樣一來,畫完地板之后,地板所占有的那些像素的模板值就都會(huì)是1,其它的地方還是0。現(xiàn)在,把模板緩沖區(qū)設(shè)定成“當(dāng)Z測試通過時(shí),若模板的值為1才畫,且將模板的值設(shè)為0”。然后開始畫陰影。這樣畫出來的陰影,一定會(huì)在地板的范圍內(nèi),而且每個(gè)像素只會(huì)被畫一次,不會(huì)出現(xiàn)blend兩次的情形。
如果有多個(gè)平面要投影,可以為每個(gè)平面指定不同的模板(stencil)值。不過,如果模板緩沖區(qū)(stencil buffer)只有1 bit,那就沒辦法了。這時(shí),可能就需要在畫下一個(gè)平面之前,先把模板緩沖區(qū)清掉,這樣會(huì)花很多時(shí)間。
下圖是一個(gè)完整的例子:
參考程序你可以去試驗(yàn)。這個(gè)程序需要至少2 bits的模板緩沖區(qū)(stencil buffer)支持。
平面陰影(Planar shadow)就差不多是這個(gè)樣子了。平面陰影的好處是簡單、容易做,而且在投影面不多的時(shí)候,速度很快。但是,當(dāng)投影面變多時(shí),或是物體很復(fù)雜時(shí),速度很快就會(huì)變得很慢,因?yàn)閷γ總€(gè)平面都需要把投影的物體再畫一次。而且,它只能投影在平面上,對于不規(guī)則的表面則完全沒辦法。
還有一些別的方法可以產(chǎn)生陰影的效果。后面還會(huì)再討論一些產(chǎn)生陰影的方式,都可以投影在任何不規(guī)則的表面上。
2、體積陰影
前面所介紹的方法,即平面陰影(Planar shadow),只適用于平面上。但是,除了少數(shù)的情形之外,絕大多數(shù)的情形下,根本無法預(yù)測陰影會(huì)被投射在什么樣的表面上。所以,我們需要自由度更高的方法。
在這里介紹一個(gè)較為靈活的方法,它可以將陰影投射在不規(guī)則的表面上。這個(gè)方法稱為體積陰影(Volumetric Shadow)。這個(gè)方法的動(dòng)點(diǎn)在于,它并不是利用“把物體投影到表面”的方式來產(chǎn)生陰影,而是去找出場景中,有哪些像素是在陰影中。也就是說,想象一個(gè)物體擋住光時(shí),在物體的后面會(huì)形成一個(gè)大的“陰影錐”。很明顯的,若一個(gè)像素在“陰影錐”之中,那它就是在陰影之中。如下圖所示:
上圖中的紅色球體,在受光照后,在后方產(chǎn)生一個(gè)“陰影錐”,即Shadow Volume,而這個(gè)“陰影錐”和灰色平面的交集,就是陰影會(huì)出現(xiàn)的地方。
所以,基本上體積陰影(Volumetric Shadow)的原理是很簡單的。不過,要真正實(shí)作又是另一回事。為了簡單起見,這里先以一個(gè)簡單的三角形開始。目前的3D繪圖幾乎都是以三角形為基礎(chǔ),所以從三角形開始,應(yīng)該是很適當(dāng)?shù)摹?
現(xiàn)在,假設(shè)有一個(gè)已經(jīng)繪制完成的3D場景。因?yàn)槭褂肸 buffer的關(guān)系,對每一個(gè)像素而言,都有一個(gè)相對的Z值,即表示該像素和觀察者的距離的值。如果現(xiàn)在有一個(gè)三角面,把陰影投射到這個(gè)3D場景中,并畫出這個(gè)三角面的“陰影錐”。因?yàn)槲矬w是一個(gè)三角形,所以它的“陰影錐”也是一個(gè)三角錐。這時(shí),要如何知道3D場景中,有哪些像素是和這個(gè)三角錐有交集?
其實(shí)方法很簡單。想象許多射線,由觀察者射向每個(gè)像素。如果射線和“陰影錐”完全沒有交集,它所對應(yīng)的像素當(dāng)然就不會(huì)和“陰影錐”有交集。不過,即使是射線和“陰影錐”有交集,并不一定表示該像素就一定和“陰影錐”有交集,因?yàn)樯渚€可能會(huì)射入“陰影錐”后又射出。所以,只有在射線射入“陰影錐”之后,在離開“陰影錐”之前就遇到其對應(yīng)的像素時(shí),才表示這個(gè)像素和“陰影錐”有交集。下圖顯示出各種不同的情形:
上圖中的(1)和(2)都是面對觀察者的面,所以它們所涵蓋的像素,就是“射線會(huì)射入陰影錐”的像素。而(3)則是背對觀察者的面,所以它所涵蓋的像素是“射線會(huì)離開陰影錐”的像素。所以,會(huì)和陰影錐有交集的像素,就是(1)+(2)-(3)的那些像素,也就是陰影所在的位置。
不過,要怎么在一般的3D繪圖硬件中,得到(1)+(2)-(3)的結(jié)果呢?和平面陰影(Planar shadow)一樣,這需要模板緩沖區(qū)(stencil buffer)。在OpenGL和Direct3D中的模板緩沖區(qū)都可以讓它進(jìn)行“加一”和“減一”的動(dòng)作。所以,只要把模板緩沖區(qū)設(shè)定成:在繪制(1)和(2)的面時(shí),讓模板緩沖區(qū)加一;而在繪制(3)的面時(shí),讓 模板緩沖區(qū)減一。這樣一來,在畫完(1)~(3)時(shí),那些模板(stencil)值不為0的像素就是陰影了。最后,把所有模板不為0的像素利用alpha blending的方式,使其亮度降低,就可以達(dá)到繪制陰影的效果。
上面的例子是用一個(gè)三角面。對于比較復(fù)雜的物體,其原理還是一樣的。當(dāng)物體是由許多三角面組成時(shí),可以把所有面對光源的三角面都進(jìn)行上面的動(dòng)作,就可以產(chǎn)生陰影。不過,這樣有個(gè)缺點(diǎn):因?yàn)楹芏嗳敲娴倪吺墙釉谝黄鸬模赃@樣做會(huì)十分浪費(fèi)時(shí)間。要提高效率其實(shí)也很容易。在繪制“陰影錐”的時(shí)候,若有一個(gè)邊是被兩個(gè)三角面所共享,那就表示這是一個(gè)“內(nèi)部”的邊,在繪制“陰影錐”的時(shí)候,就可以不用去畫這個(gè)邊。這樣就可以省下不少的時(shí)間。
這個(gè)方法適用于非常復(fù)雜的物體。不過,它還是可能會(huì)遇上一些問題。一個(gè)情形是,如果觀察者在“陰影錐”的內(nèi)部,會(huì)發(fā)生一些麻煩的情形。不過,對大部分的情形來說,只要將模板緩沖區(qū)(stencil buffer)設(shè)定成“減到0就停止”,即0 - 1 = 0,就可以解決。當(dāng)然這無法解決所有的問題,不過通常已經(jīng)夠好了。另外,如果物體不是 convex(即“凸”的),那可能會(huì)出現(xiàn)“射線重復(fù)進(jìn)入陰影錐”的情形。這種情形并不會(huì)有問題,不過模板緩沖區(qū)就需要比較多bit才不會(huì)出錯(cuò)。一般來說,4 bits就已經(jīng)可以處理絕大多數(shù)的物體的。
下面的畫面是體積陰影(Volumetric Shadow)的結(jié)果,是由DirectX 8 SDK中的一個(gè)示范程序所產(chǎn)生的。這個(gè)程序的結(jié)構(gòu)并不復(fù)雜,所以有興趣的話,可以自行參考它的原始碼。
這個(gè)方法比平面陰影(Planar shadow)更能適用于不同的場景。不過,它當(dāng)然也有缺點(diǎn)。最主要的缺點(diǎn)是在于它的復(fù)雜度。要做出有效率的“陰影錐”,需要對物體做相當(dāng)麻煩的處理,基本上就是要找出物體在某個(gè)方向的“外緣”(即silhouette)。雖然這并不太難做,但是還是需要花費(fèi)相當(dāng)?shù)腃PU時(shí)間去處理。另外,為所有的物體繪制出其“陰影錐”,需要相當(dāng)大量的填充率(fill rate)和內(nèi)存頻寬。若是延后渲染(deferred renderer),例如圖素渲染(tile renderer)則影響不會(huì)這么大,特別是圖素渲染可以支持一些特別的功能,來加速體積陰影(Volumetric Shadow)的動(dòng)作。
基本上,體積陰影(Volumetric Shadow)的效果,一般來說都不錯(cuò)。最主要的缺點(diǎn)則是在效率方面,特別是當(dāng)物體的復(fù)雜度和數(shù)量增加時(shí),CPU需要的工作量會(huì)大增,是較為不理想的。后面會(huì)再介紹一些速度更快的方法。
|