從單視圖圖像中精確地重建三維形狀

中國AI網 2025年08月08日)在一項研究中,杭州電子科技大學團隊提出了一種無監督學習方法,在不依賴外部監督信號或先驗形狀模型的情況下,從單視圖圖像精確地重建三維形狀。所述創新方法通過在現有數據執行姿勢轉換來生成不同角度的新圖像和深度圖,特別關注極端姿勢下的圖像重建。通過使用新生成的圖像和深度圖作為訓練樣本,研究人員重新輸入模型并使用生成的預測深度圖對其進行優化。

實驗結果表明,所提出方法在單視圖人臉3D重建任務中具有優異的性能,特別是在極端姿態下,明顯優于傳統方法。

杭州電子科技大學開發無監督3D人臉重建算法  第1張

隨著計算機視覺領域的不斷發展,3D重建技術在虛擬現實和增強現實等領域得到了廣泛的應用。然而,盡管相關應用對高質量的三維重建有很大的需求,但如何從單視圖圖像中準確地恢復三維形狀,特別是在復雜的位姿變化下,依然是一個迫切的挑戰。

傳統的三維重建方法通常依賴于多視圖圖像或深度傳感器,在特定實際應用中可能受到設備限制或獲取成本的限制。近年來,隨著深度學習技術的快速發展,基于單視圖圖像的三維重建研究逐漸成為研究熱點。通過從單視角圖像中提取潛在的3D信息,研究人員希望減少對多視角數據和昂貴硬件的依賴。不過,現有的方法大多需要大量的標記數據或依賴于先驗的形狀模型,限制了它們在大規模應用中的通用性和適用性。

另外,盡管有的方法在特定標準姿勢取得了一定的成功,但在面對復雜和極端的姿勢變化時,它們的表現依然不夠理想,并且無法準確捕獲對象(特別是人臉)形狀的微小變化。

在三維重建任務中,位姿變化是影響重建質量的關鍵因素。傳統的人臉重建方法往往依賴于靜態和標準化的姿態數據,在面對復雜姿態變化的真實場景(如極端俯仰角、向左旋轉等)時,往往會導致形狀失真或細節缺失。特別是在極端的姿勢下,依然難以準確地恢復面部的三維結構,難以避免傳統模型中常見的變形現象。

為了解決上述挑戰,杭州電子科技大學團隊利用一種無監督學習方法,旨在從單視圖圖像中準確地重建三維人臉形狀,而不依賴于注釋數據或先驗形狀模型。

主要想法是通過自動編碼器對輸入圖像的深度、亮度、視角、光照信息和人臉屬性進行解耦,有效地提取三維結構信息。這種解耦不僅有助于模型更好地理解圖像中的空間關系,而且在一定程度上減輕了極端姿態對重建結果的負面影響。

為了進一步提高重建質量,他們設計了一種數據增強策略,通過對現有數據進行姿態變換,特別是極端姿態變換,生成不同角度的圖像和深度圖,增強模型對復雜姿態的適應能力。本研究的貢獻在于提出了一種新的無監督三維人臉重建框架,特別是在復雜和極端姿態下,通過有效的姿態增強和結構信息解耦,顯著提高了單視圖圖像的三維重建。

這一研究不僅為無監督學習在三維重建中的應用提供了新的思路,同時為未來復雜姿態下的三維建模任務提供了更有效的技術路徑。實驗結果表明,在處理極端姿態變化的人臉三維重建任務時,所提出方法的重建精度明顯優于傳統方法。特別是在姿態變化極端的場景中,模型能夠準確地恢復人臉的三維形態,避免了傳統方法因姿態變化造成的失真問題。另外,通過無監督學習,所提出方法有效地減少了對人工標記數據的依賴,在資源有限的現實場景中擴大了三維重建技術的潛力。

杭州電子科技大學開發無監督3D人臉重建算法  第2張

實驗結果如表1所示。const.null深度基線通過一個常量項生成一個恒定的均勻深度圖,并作為一個較低的性能參考。另一方面,平均g.t.深度基線使用實際場景的平均真實深度值生成深度圖,以提供一個更接近真實場景的基線。unsup3d是基于無監督學習方法的基線。在所有實驗中,結果表明所提出方法明顯優于兩個恒定基線,驗證了所采用的姿態自適應機制的有效性。

特別是,機制能夠有效地適應三維人臉的不同姿態,具有更強的魯棒性,能夠在復雜場景下獲得更準確的深度估計。相關結果進一步證明了模型在應對不同位姿變化方面的優越性和穩定性。最終的三維人臉重建渲染顯示出令人印象深刻的細節和準確性,充分展示了所提出方法的優勢。

在隨機姿態下的人臉重建中,可以看到在不同角度下,人臉的再現度非常高,既保證了幾何結構的準確性,又能很好地捕獲到人臉的微小變化和表情細節,展示了模型較強的多姿態適應能力。

原始視角下的人臉重建與實際深度信息和紋理細節無縫結合,呈現出自然逼真的外觀,顯示出模型在真實場景中的高適應性和魯棒性。最突出的特點是陰影效果的處理,光影的相互作用表現出深度和形狀的真實感,進一步增強了重建效果的立體感和視覺沖擊力。

總體而言,渲染不僅體現了技術上的突破,同時展示了深度學習模型在復雜任務中的準確性和細致化處理能力,足以滿足高精度3D人臉重建的應用場景。

相關論文:Unsupervised pose adaptation based 3D face reconstruction algorithm

https://dl.acm.org/doi/pdf/10.1145/3723420.3723435

總的來說,團隊提出的三維人臉重建方法不僅具有優秀的姿態適應能力,而且有效地保持了人臉屬性的一致性。實驗結果表明,在處理不同姿態下的三維重建時,所提出方法能夠準確地保留人臉的基本屬性,如面部特征、性別、年齡等,并且無論姿態如何變化,人臉的核心屬性始終保持不變。這樣,模型克服了常用深度估計方法在位姿變化過程中可能造成的屬性損失問題,保證了重建結果的穩定性和可信度。

最終效果圖進一步驗證了這一點,重建的人臉不僅具有較高的幾何精度,而且在不同視點下的細節和人臉屬性表現出非常強的一致性。這表明所提出方法可以在三維人臉重建中有效地保持人臉的個性特征,并具有廣泛的應用潛力。