XR眼間預測模型配置

中國AI網 2025年07月17日)XR技術正在快速增長,并可能廣泛應用于游戲以外。對于XR設備,視頻編碼使用大量資源,并造成巨大功耗和延遲。所以,減少視頻編碼延遲和處理開銷可能幫助XR設備實現更長的正常運行時間。

在一份專利申請中,高通就介紹了一種XR眼間預測模型。例如,可以利用多攝像頭之間聯合源信道編碼方案的預測模型作為變換函數。發明的一個優點是,可以利用與多個攝像頭注視的幾何形狀和方向相關信息來獲得用戶眼睛之間的粗略預測。另一優點可包括基于注視的幾何形狀和方向的壓縮改進,以及視頻編碼器的功率降低。

在一個實施例中,將與第一攝像頭的第一視角相關聯的第一幀的至少一部分轉換為與第二攝像頭的第二視角相關聯的第二幀的至少一部分。所述設備向第二無線設備發送用于將所述第一幀的至少一部分轉換為所述第二幀的至少一部分的所述至少一個預測模型的預測指示。所述設備向所述第二無線設備發送編碼信號,編碼信號包括包含至少所述第一幀和所述第二幀的組合的組合幀。所述設備基于所述至少一個預測模型對所述組合幀進行解碼。

視頻編碼器,如H.264、H.265或類似,將視頻(例如圖像)的每一幀分解成子區域的基礎上運行,然后對于每個子區域,編碼器可以嘗試數個假設(例如預測),編碼器可以根據視頻質量和壓縮選擇最佳或最優假設。假設可以以各種形式進行預測。例如,特定預測可能基于相鄰像素,時間預測可以基于實時圖像等等。

......(全文 4042 字,剩余 3486 字)

高通專利提出XR眼間預測模型,降低視頻編碼功耗  第1張
請微信掃碼通過小程序閱讀完整文章
或者登入網站閱讀完整文章
映維網會員可直接登入網站閱讀
PICO員工可聯系映維網免費獲取權限