說到3D,很多人的第一反應可能是酷炫生動的3D電影,以及它為我們帶來的歡樂亦或驚險之旅。但你知道嗎?正如3D電影的拍攝是一項“大制作工程”一樣,3D深度視覺的形成也是一個龐大的系統性工程,需要人體多系統的介入、協調來完成。深度感知是在三維空間(3D)和物體距離上感知世界的視覺能力[1]。我們的大腦在判斷所看到物體的深度時,往往會使用兩種視覺線索:生理學線索和心理學線索。前者是將真實的物理信息提供給大腦,而后者則提供的是一些視覺幻象。在我們的大腦作出判斷所使用的視覺線索中,生理學線索蘊含著真正的物理深度信息,典型的生理學線索由晶狀體聚焦、輻輳、以及雙眼視差3個因素構成。
我們的晶狀體(lens) 是一個神奇的鏡頭,隨著周圍肌肉的伸縮和舒展,這個神奇鏡頭的焦距可以在一定范圍內自由調節。也就是說,正常情況下,當平行光進入人眼時,它會被晶狀體自動匯聚到視網膜(retina)上的一個點。由此以來,如圖(1)(A&B)所示,我們可以將物理世界中真實的深度信息準確成像至視網膜上。

而晶狀體對于平行光的自動匯聚功能,則是通過睫狀肌的收縮或松弛改變屈光度來實現的。如果一個人眼球中睫狀肌調節負擔過重,就會導致晶狀體過度變厚且不能恢復原狀、或者眼球的前后徑過長,以至于晶狀體的屈光能力過強;遠處物體的光線通過這個神奇鏡頭的折射所形成的物像,就會落在視網膜的前方[2]。如圖(1)(C)所示,在這種情況下,這個人看到的就會是一個模糊不清的物像,而這就是近視眼的成因。
除去單眼的晶狀體調節功能之外,我們的雙眼也能夠捕捉真實存在的深度信息。在視覺信息方面,輻輳就是指雙眼同時向反方向運動以獲得或維持單一的雙眼視覺的行為[3]。
當我們在看物體A時,我們其實是在通過雙眼視線根據物體A發生的相反方向的變化運動后匯聚到我們視網膜上的一個點,來感知物體A的位置的。
當我們在看遠處的物體時,眼睛會彼此轉動遠離,有效地將同一點固定在無限遠,目光也就會隨之發散直到平行,這便是一個人在遠眺時深邃的、渙散的眼神,如圖(2)(C);而當我們看近處的物體時,眼睛會朝著聚合的方向轉動,這就叫做“輻輳”[3],夸張一點就會成為“斗雞眼”,如圖(2)(A)和(B)。

圖(2). 輻輳的三種不同形態:從左到右依次為“斗雞眼”、一般輻輳和平行視線
輻輳本質上是一種用于距離和深度感知的雙目動眼神經提示,是一種由內在肌肉完成的收斂性眼球運動[4]。每只眼睛外側肌肉使用轉動眼球的力的強弱,為大腦提供了關于物體距離的線索[5]。
如果將手指放在眼睛前方20厘米處,眼球肌肉轉動的力需要比手指在50厘米處時更加大,也給大腦信息提供了說明:20厘米的距離的確比50厘米近。
雙眼視差 (Binocular Parallax)
值得一提的是,當我們看同一個物體,用上面已經提到的專業術語來說,當我們兩眼視軸輻輳在這個物體上時,物體的映像就會落在兩眼視網膜的對應點上。如果我們雙眼的視網膜重疊起來,那么它們的視像重合,我們就能夠看到單一、清晰的物體。然而,人的眼距往往在65毫米左右,這就意味著每一個人雙眼的視網膜之間會存在著65毫米左右的間距,從而,在觀察物體時,我們兩眼的視網膜上會出現物像差異,這樣的差異就是雙眼視差[6]。

雙眼視差在深度視覺領域有著非凡的意義。圖(3)中的兩張有細微差異的圖片各自傳遞出的信息,將在大腦的視覺皮層中被處理,從而讓我們獲得深度感知,估計到物體的距離。開頭中提到的3D電影,就是充分利用雙眼視差的原理實現的:如圖(4)所示,電影放映時,兩臺放映機同步運轉,同時畫面投放在銀幕上,形成左像右像雙影。

觀眾的特制眼鏡或幕前輻射狀半錐形透鏡光柵,使觀眾左眼只看到從左視角拍攝的畫面,右眼只看到從右視角拍攝的畫面,最后經過大腦的融合,成為3D視覺影像[7]。那么,為什么我們看3D電影的時間久了,會有眩暈的感覺呢?開頭說過,眼球里的晶狀體會自動根據物體的距離聚焦;而在我們觀看3D電影時, 晶狀體聚焦的平面和雙眼輻輳的匯聚平面通常不一致。3D電影的畫面變換非常快,所以人眼需要頻繁使用聚焦和輻輳兩種功能,使物體的像準確地落在視網膜上。短時間內,我們還能忍受這種需要頻繁發生的功能,但一段時間后,就會產生視覺疲勞甚至頭暈惡心之感。
以上是生理學線索在3D深度視覺的形成中所起到的作用。在下一期文章里,我們將為大家介紹另一個關鍵——心理學線索在3D深度視覺這個龐大工程中所做的貢獻。