提高了效率并繞過了直接的傳感器數據訪問
(中國AI網 2025年05月22日)SLAM這項基礎技術在AR/VR等領域有著廣泛的應用。SLAM模擬評估新概念,但在資源受限的設備進行測試面臨挑戰:計算成本高,傳感器數據訪問受限。
在一項研究中,德國康斯坦茨大學團隊提出了一個使用網格幾何投影作為特征的稀疏框架,它提高了效率并繞過了直接的傳感器數據訪問,從而推進了SLAM研究。

SLAM是計算機視覺領域的一種基礎方法,對增強現實和虛擬現實設備的操作至關重要。SLAM算法依賴于各種傳感器,如激光雷達、攝像頭和深度傳感器,在估計設備位置的同時構建環境地圖。
Visual SLAM主要使用圖像作為輸入數據。然而,需要對圖像流進行額外的處理以檢測和匹配幀之間的顯著特征。特征的準確檢測和匹配對于估計連續幀之間的camera姿態至關重要。在實際部署之前,仿真在有效測試SLAM概念方面起著關鍵作用。它支持快速原型設計,降低噪點,提高可重復性,并可調整建模環境、過程和傳感器的參數。
在SLAM仿真中,與現實世界的SLAM一樣,從生成的虛擬環境圖像中提取圖像特征。然而,無論是使用現代人工智能方法還是使用經典的計算機視覺技術,基于特征的方法不僅會帶來計算開銷,而且在特征匹配中會引入固有的噪點和模糊性。直接使用頭顯進行SLAM研究的另一個主要挑戰是,商業AR/VR硬件的原始傳感器數據訪問受限。
為了解決所述限制,德國康斯坦茨大學團隊提出了一個高效且可移植的框架,可以直接從運行時虛擬環境執行單目SLAM,從而避免了直接訪問傳感器的需要。
另外,作為基于圖像的SLAM特征的替代方案,所述方法執行網格幾何組件的投影。框架通過利用計算機生成環境中固有的結構元素,特別是多邊形網格,優先考慮效率。據研究人員所知,這是第一個利用多邊形網格頂點的實時SLAM系統。它有三個優點:
首先,所述方法消除了特征關聯誤差,提高了位置估計精度,提高了運行效率,使其成為相關應用中作為GroundTruth的潛在候選。
其次,SLAM框架能夠獨立運行(無需接到PC進行繁重工作),可直接作為用戶應用在低預算的現成頭顯運行,無需真正的傳感器輸入。
第三,框架允許使用任意的3D網格,不需要紋理。
所以,這項研究可以將SLAM的研究機會和原型設計擴展到VR之外,包括機器人和更廣泛的計算機視覺應用。它特別適合于虛擬仿真環境中的SLAM研究和原型設計。

團隊主要是從PTAM的簡單性和雙并行模塊中獲得靈感,從而開發了Mesh2SLAM。另外,他們采用了ORB-SLAM2的初始化、追蹤和映射過程,并將模塊與自己的特征處理方法相結合。
鑒于資源受限設備在SLAM研究中的重要性日益增加,所述方法被設計為輕量級、可移植且更獨立于第三方庫。處理圖像特征的核心組件模塊由頂點特征處理方法所取代,另外,特別是在可視化方面,它包含了自己的可選OpenGL ES可視化引擎,允許更大的可移植性。如圖1所示,Mesh2SLAM在主應用程序線程和兩個專用SLAM線程(Tracking和Mapping)之間并發地操作。
幀從場景幾何中捕獲作為頂點特征,并由前端追蹤模塊處理。后端Mapping模塊進行后驗優化,包括窗口束調整,以最小化誤差,實現幀姿和映射點的最佳擬合。
相關論文:Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications
總的來說,團隊提出的Mesh2SLAM是一個快速高效的基于幾何的SLAM框架。它的主要新穎之處在于利用網格幾何組件、頂點特征和利用GPU加速來提高位置估計的準確性,并大大減少計算開銷。
作為一個SLAM模擬,Mesh2SLAM保持了SLAM功能,同時繞過了基于圖像的方法中阻礙原型設計的問題。在XR開發的背景下,其輕量級稀疏地圖表示非常適合定位為重點的任務,包括追蹤用戶運動、支持空間交互、驗證姿態估計方法以及對其他定位算法進行基準測試。另外,未來的考慮包括將其擴展到協作定位或多代理SLAM。

