為改進基于高斯的人群渲染系統(tǒng)提供了堅實的基礎(chǔ),對需要可擴展和逼真可視化的實時應(yīng)用具有實際意義

中國AI網(wǎng) 2025年05月28日)高效逼真的人群渲染是虛擬現(xiàn)實等實時圖形應(yīng)用的重要組成。業(yè)界正在探索3DGS在實時人群渲染方面的潛力。在一項研究中,愛爾蘭都柏林圣三一大學(xué)團隊提出了一個2AFC實驗,并旨在確定3D高斯Avatar的感知質(zhì)量。

研究人員探索了三個因素:運動、LOD和Avatar高度。其中,被試將查看成對的動畫3D高斯Avatar,并選擇最詳細(xì)的一個。團隊指出,相關(guān)研究結(jié)果可以為基高斯人群渲染中的LOD策略優(yōu)化提供信息支持,從而幫助在實時應(yīng)用中實現(xiàn)高效渲染的同時保持視覺質(zhì)量。

圣三一大學(xué)研究團隊評估3D高斯人群渲染感知質(zhì)量  第1張

多年來,逼真人群場景模擬一直是一個活躍的研究領(lǐng)域。在這項研究中,愛爾蘭都柏林圣三一大學(xué)團隊專注于人群渲染的3DGS問題,并評估了多個因素是如何影響用戶感知高斯人群。

高斯Avatar的自適應(yīng)LOD策略在平衡計算成本和視覺保真度方面顯示出了希望,特別是在虛擬環(huán)境中。然而,盡管先前已經(jīng)研究了LOD人類表征的感知,但使用基于真實圖像的高斯Avatar進行人群渲染的感知影響尚未得到充分探索。

針對這個問題,團隊提出了一個用戶研究,目標(biāo)是回答以下關(guān)于高斯Avatar的問題:

Q1:比起復(fù)雜的周期性運動,簡單的周期性運動是否更容易引起偽影?
Q2:減少LOD(即高斯數(shù))是否會提高偽影的可見性?
Q3:如果增加距離),偽影是否不那么明顯?
Q4:偽影的可見性是否會因運動、LOD和像素的不同組合而有所不同?

在一個2AFC實驗中,團隊研究了運動、LOD和像素及其相互作用對高斯Avatar感知的影響。其中,被試將查看成對的動畫3D高斯Avatar,其中一個以最高質(zhì)量(黃金標(biāo)準(zhǔn))渲染,而另一個以較低的LOD渲染。

一組被試查看Avatar的周期性慢跑動作,而另一組查看復(fù)雜的武術(shù)表演。對于兩者,任務(wù)都是選擇顯示的兩個Avatar中最詳細(xì)的一個。以運動(2)× LOD (3) ×像素(5)和準(zhǔn)確度(即正確選擇金標(biāo)準(zhǔn)的次數(shù)比例)為自變量進行三向方差分析(ANOVA),然后進行Bonferroni事后檢驗。

更高的精度表明視覺偽影更明顯。團隊發(fā)現(xiàn),對于Q1,答案是否定的。運動是主要的影響因素,復(fù)雜運動比周期性運動的精度更高,表明前者的偽影更明顯。

對于Q2,答案是肯定的,因為準(zhǔn)確性(以及隨之而來的偽影檢測)隨著高斯函數(shù)數(shù)量的增加而下降。

第三個問題的答案是“不總是”,因為沒有發(fā)現(xiàn)像素的主要影響。但要回答第4個問題,像素確實與LOD相互作用,當(dāng)Avatar以最低LOD和最低像素數(shù)(即在最遠的距離)呈現(xiàn)時最為準(zhǔn)確。沒有發(fā)現(xiàn)其他顯著的相互作用效應(yīng)。

團隊指出,這一結(jié)果可用于指導(dǎo)在實時動畫人群場景中放置高斯人群。獲得的見解可以幫助優(yōu)化LOD策略并實現(xiàn)高效渲染,同時在實時應(yīng)用程序中保持視覺質(zhì)量。

另外,結(jié)果證明了3DGS方法在實現(xiàn)計算效率而不犧牲視覺保真度方面的潛力。然而,特定限制為未來的探索提供了機會。3DGS使用多視圖圖像作為輸入來重建場景。3D高斯圖像的不透明度α在0和1之間優(yōu)化。然而,高斯Avatar將不透明度固定在α = 1,以保持所有3D高斯可見,迫使網(wǎng)絡(luò)預(yù)測準(zhǔn)確的3D高斯位置。

圣三一大學(xué)研究團隊評估3D高斯人群渲染感知質(zhì)量  第2張

當(dāng)多個不透明的3D高斯投影到單個像素時,由于距離較遠的3D高斯疊加,可能會出現(xiàn)偽影。被試會注意到,手周圍的白點、虛線或衣服的文字等意想不到的視覺人工偽影會影響他們的判斷,并可能會給結(jié)果帶來偏見。在未來的實驗中處理相關(guān)偽影將有助于消除混淆因素。

另外,未來的研究需要對查看條件進行標(biāo)準(zhǔn)化,以確保被試的一致性。另外,盡管研究考察了運動、3D高斯數(shù)和距離,但它沒有考慮到其他感知因素,如照明條件或環(huán)境復(fù)雜性。所以,在未來的研究中納入變量將增強所建議閾值的適用性和穩(wěn)健性。

相關(guān)論文:Evaluating CrowdSplat: Perceived Level of Detail for Gaussian Crowds

總之,團隊表示盡管存在限制,但結(jié)果為改進基于高斯的人群渲染系統(tǒng)提供了堅實的基礎(chǔ),對需要可擴展和逼真可視化的實時應(yīng)用具有實際意義。