2021-4-10 | 互聯(lián)網(wǎng)
真實場景建模是虛擬現(xiàn)實、計算機圖形學和計算機視覺研究的重要內(nèi)容之一,特別是構(gòu)造室外靜態(tài)場景三維模型,如故宮、巴黎圣母院、自由女神像等,它在文化遺產(chǎn)數(shù)字化保護、數(shù)字城市、數(shù)字影視與娛樂等方面有重要的應用價值.
傳統(tǒng)的三維場景建模方法往往需要使用專門設備對目標場景進行數(shù)據(jù)采集,如用三維激光掃描儀采集場景的幾何信息,用同一個已標定的相機采集場景的外觀,用可控的主動光源對場景進行照明等,因而受到場景規(guī)模、幾何結(jié)構(gòu)、周邊環(huán)境與光照條件等的諸多限制,能適用的場景數(shù)量非常有限,而且這種數(shù)據(jù)采集過程的復雜性和高成本也決定了其伸縮性較差,難以用于街道乃至城市規(guī)模的室外場景建模.
近幾年,隨著數(shù)碼相機、照相手機與互聯(lián)網(wǎng)的普及,人們將拍攝的大量的室外場景照片上傳到互聯(lián)網(wǎng)進行分享.
截至2011年2月,著名的照片分享站點picasaweb的照片總數(shù)達到70億張,flickr.com達50億張,而社交網(wǎng)站Facebook的共享照片更高達600億張,再加上Google街景等照片,構(gòu)成了海量的互聯(lián)網(wǎng)共享照片集.
這種照片集有3個特點:
1)覆蓋面廣.
幾乎涵蓋了世界的各個角落,特別是對于各地的名勝古跡,往往有大量從不同視點、在不同時間(一年四季,一天從早到晚)和不同天氣條件(晴天、多云等)下拍攝的照片;
2)獲取成本很低.
例如人們可以輕松地從Google上搜索、下載超過20萬張?zhí)彀查T的照片;
3)具有無結(jié)構(gòu)性.
即拍攝的視點是無序分布的,并且拍攝時的光照條件未經(jīng)過測量,拍攝者所使用的相機、鏡頭各不相同,響應曲線和色彩未經(jīng)過標定,場景中還常存在雜亂的遮擋現(xiàn)象等.
這些特點決定如何挖掘和利用這類新數(shù)據(jù)集中豐富的信息,快速、方便地構(gòu)造逼真的虛擬場景模型,這是近年來互聯(lián)網(wǎng)發(fā)展給虛擬現(xiàn)實、計算機圖形學和計算機視覺帶來的新的研究熱點.
本文先分析基于互聯(lián)網(wǎng)照片構(gòu)造室外場景模型中存在的基本科學問題,然后分別從室外場景的幾何、光照和反射屬性建模技術(shù)3個方面,分析和總結(jié)該領域的國內(nèi)外研究現(xiàn)狀,并給出對發(fā)展趨勢的思考.
1基于互聯(lián)網(wǎng)照片集的室外場景建模
互聯(lián)網(wǎng)照片記錄了室外場景的外觀,照片中各像素每個通道的值反映了由場景各點向觀察者視點方向出射的光照輻射度,這取決于光照條件、場景的幾何結(jié)構(gòu)、其表面材質(zhì)的光學屬性、相機的視點、投影變換參數(shù)、曝光參數(shù)和成像系統(tǒng)的響應曲線.
這些因素中,前三者與相機無關(guān),它們之間的交互作用決定了場景在某一時刻形成的光場,若僅考慮由不透明材質(zhì)構(gòu)成的場景,則該交互過程可用繪制方程表示為L(x,ωo)=∫ΩLin(x,ωi)V(x,ωi)ρ(ωi,ωo)h(n,ωi)dωi(1)該方程是在場景中某一點x處單位正半球面Ω上的積分,其中ωi,ωo分別表示入射與出射光方向;n是表面法向量;Lin(x,ωi)表示入射輻照度;V(x,ωi)表達環(huán)境光源可見性,其值為0或1;ρ(ωi,ωo)表示材質(zhì)反射屬性,常用雙向反射分布函數(shù)(bidirectionalreflectancedistributionfunction,BRDF)描述;投影因子h(n,ωi)=n•ωi,常包含在BRDF模型ρ中;L(x,ωo)則是出射輻射度.
與相機相關(guān)的參數(shù)中,投影與視點三維變換通常用相機內(nèi)外參數(shù)矩陣P和M表示,如(u,v)T=P•M•(x,y,z)T=P•(R|t)•(x,y,z)T所示,其中R和t分別是視點的相對旋轉(zhuǎn)、平移參數(shù).
曝光參數(shù)與響應曲線則分別用I(u,v)=f(k•L(u,v))中線性系數(shù)k與從輻射度L到像素值I的非線性映射f來表示.
因此,從照片構(gòu)造場景模型可看作反射與成像的逆過程,根據(jù)式(1),由不同照片中的像素值,求出拍攝各照片的視點與投影參數(shù)、場景各點三維坐標與表面法向量,以及表面材質(zhì)的BRDF反射屬性模型和環(huán)境光照信息.
研究者們對基于圖像建模研究已經(jīng)取得豐碩的成果,但與這些傳統(tǒng)方法相比,通過互聯(lián)網(wǎng)共享照片集進行場景建模要解決的難點問題包括:
問題1.
傳統(tǒng)基于圖像的建模方法中拍照所用的相機往往曝光參數(shù)已知,響應曲線可用實驗測出,很容易將不同相片中的像素值投影到統(tǒng)一的線性輻照度空間.而拍攝每張互聯(lián)網(wǎng)照片所用的不同相機曝光參數(shù)和響應曲線無法事后通過實驗測量,因此需要發(fā)掘照片自身特征和場景中的不變特性,對各照片進行輻射度標定.
問題2.
傳統(tǒng)基于圖像的建模方法所用的場景照片往往是視點固定或已知的,其分布也滿足一定軌跡和順序.而互聯(lián)網(wǎng)照片的拍攝視點都是未知的,分布具有無序和不均勻性,因此需要發(fā)掘場景自身幾何結(jié)構(gòu)的不變性對外觀的作用和約束、求出相機視點,并對視點進行篩選,按一定結(jié)構(gòu)重新組織;然后將基于照片集的建模問題劃分為有序的子問題,設計出高效的幾何重構(gòu)算法.
問題3.
室外場景的外觀是一個甚高維空間,變幻無窮的環(huán)境光照與陰影、變化的視點位置與鏡頭焦距、多種多樣材質(zhì)的復雜反射屬性、復雜幾何結(jié)構(gòu)帶來的自遮擋與隨機出現(xiàn)的前景遮擋等,各自都具有很高的維度.互聯(lián)網(wǎng)照片集雖然數(shù)量多,所采樣到的場景外觀仍只是一個相對很小的子空間,使得求解問題高度病態(tài).