多用戶定位系統

中國AI網 2025年04月23日)近年來,隨著AR技術的快速發展,對多用戶協同體驗的需求日益增長。與單用戶體驗不同,確保每個用戶的空間定位并保持多個用戶之間定位和方向的同步和一致性是一個重大挑戰。

在一項研究中,臺灣大學和JorJin Technologies基于Unity 3D游戲引擎,以單目RGB圖像為開發平臺,提出了一種基于ORB-SLAM2的多用戶定位系統。

系統不僅執行用戶定位,而且將一個通用的虛擬對象放置在環境中的平面,以便每個用戶都能正確地透視該對象。生成的虛擬對象可作為多用戶位置同步的參考點,而定位信息通過中央服務器在每個用戶的AR設備之間傳遞。

以其為基礎,其他用戶在特定用戶空間中的相對位置和運動通過虛擬化身呈現。另外,使用深度學習技術從單個RGB圖像中估計圖像的深度圖,以解決AR應用中的遮擋問題,令虛擬對象在AR場景中顯得更加自然。

臺灣大學分享基于單目SLAM的多用戶AR定位系統,實現厘米級協同與真實遮擋  第1張

增強現實技術將3D虛擬模型、圖像和聲音疊加到現實世界中,允許人們使用智能手機、平板電腦和AR眼鏡等設備看到虛擬對象并與之交互。隨著AR技術在過去數年間的快速發展,越來越多的AR應用正朝著多用戶體驗的方向發展。

無論在哪個領域,AR應用通常都需要實現諸如用戶定位和追蹤、環境場景理解和遮擋處理等技術。

多用戶定位和追蹤是AR應用中的一項關鍵技術。其主要目的是確定用戶在現實世界中的位置和方向,并利用網絡通信技術將每個用戶的位置信息傳輸到其他用戶的設備,以實現虛擬對象的精確放置。

定位技術通常包括基于標記和無標記的定位方法?;跇擞浀腁R定位需要放置特定的現實世界標記,如QR碼或圖像,并使用攝像頭識別和追蹤它們。這個方法可以實現較高的定位精度,因為標記提供了清晰的位置和方向信息,所以可以很容易地將虛擬物體放置在精確的位置。我們可以很容易地根據標記計算和同步每個用戶的位置和方向。但是,如果在用戶的視場范圍內沒有標記,則追蹤功能無法繼續。

另一方面,無標記AR定位技術可以通過識別場景中的特征點來確定虛擬對象的位置,不需要特殊的標記,更加方便。這種方法利用攝像頭或其他傳感器捕獲真實場景中的特征點,如墻壁、桌子和椅子,并使用計算機視覺技術進行識別和追蹤。

諸如ORB-SLAM2的無標記定位使用環境中的特征點來確定用戶的攝像頭姿勢。然而,目前只有少數成熟的方法利用所述技術對多個用戶分別停留在不同位置的多個坐標系進行對齊。

環境場景理解技術是AR應用中最重要的技術之一,通常用于確定虛擬對象應該放置的適當位置,例如現實世界中的桌子表面。

遮擋同時是AR應用中需要解決的一個重要問題。遮擋是指虛擬對象被現實世界物體遮擋或隱藏的準確表現。在傳統的AR應用中,虛擬對象直接疊加在圖像上,使得虛擬物體持續出現在真實物體之上并遮擋真實物體。這將極大地影響AR應用程序的真實感和交互性。

所以在這項研究中,團隊提出了一種解決了同步多個用戶在不同空間定位的挑戰的全新AR系統,這樣用戶就可以在他們的物理空間中查看所有其他人的Avatar,并通過確定適當的平面來放置虛擬對象供所有人查看。另外,系統旨在從單個RGB圖像中估計環境的深度圖,專門為遮擋處理設計。

臺灣大學分享基于單目SLAM的多用戶AR定位系統,實現厘米級協同與真實遮擋  第2張

圖2給出了設計的多用戶定位系統架構,概念目標應用如圖1所示。一群戴著AR眼鏡的人圍坐在一張工作桌旁進行討論,其中一個虛擬化身作為遠程參與者。這允許參與者跨越物理邊界進行交流,并在他們的環境中看到虛擬對象和信息。

所提出的系統可以分為四個主要組成:

定位模塊利用攝像頭拍攝的RGB圖像,通過SLAM算法,準確估計用戶的攝像頭姿態,并用于在Unity中更新虛擬攝像頭,從而從用戶的角度正確渲染虛擬對象。

平面估計模塊,利用SLAM過程生成的映射信息,在環境中識別出適合放置虛擬對象的平面

協調服務器,在多個用戶之間協調坐標系統和平面信息,促進所有參與者之間的信息交換和協作。

深度服務器采用深度學習模型估計每幀真實環境的深度圖,并在Unity中處理深度圖的遮擋問題,增強AR體驗的整體真實感。

相關論文:A Monocular SLAM-based Multi-User Positioning System with Image Occlusion in Augmented Reality

總的來說,團隊主要提出了一個多用戶定位系統,它能夠準確地將虛擬對象放置在桌面,并使用ORB-SLAM2以正確的角度呈現它們。

為了實現遠程協作,他們利用估計的平面作為參考框架來對齊多個參與者的SLAM坐標系,從而在AR環境中展示同步的角色運動。另外,結合了Midas的單目深度估計模型來模擬遮擋效果。

研究人員指出,這一系統可以作為開發人員的工具,為開發多用戶AR應用程序提供必要的技術。他們對系統中的不同模塊進行了一系列的實驗來驗證它們的性能。比例尺標定過程和平面估計模塊的定性結果表明,系統能夠準確計算SLAM映射與真實環境之間的比例尺,并精確地將虛擬對象放置在桌子表面。

定位模塊的定量和定性結果則表明,系統可以準確地追蹤用戶的姿勢,并將虛擬對象保持在期望的位置。

與商業解決方案Vuforia相比,定位模塊在RMSE方面只有0.0065米的平移誤差和0.6302度的旋轉誤差。

當然,他們認識到,隨著用戶數量的增加,系統不能很好地擴展,所以,未來的研究將繼續進行探索。