查看引用/信息源請點擊:中國AI網
重新定義下一代VR與AR音效
(中國AI網 2025年11月25日)MPEG-I 沉浸式音頻是由國際標準化組織運動圖像專家組制定的一套國際標準,它的核心目標是為虛擬現實和增強現實世界創造極其逼真、動態和交互式的3D聲音體驗。日前,諾基亞發文介紹了MPEG-I沉浸式音頻標準:

隨著虛擬現實和增強現實逐漸步入主流應用,一場讓沉浸式體驗真正逼真化的競賽正在進行——這不僅限于視覺,更包括聽覺。MPEG-I 沉浸式音頻應運而生,這一新的全球標準旨在重新定義聲音如何塑造我們對數字世界的體驗。
所述標準近期已由MPEG音頻小組最終確定,而它定義了聲音在3D空間中的行為方式,從而為虛擬現實和增強現實實現自然、動態且逼真的音頻效果。
從體育、游戲、培訓、現場音樂會到虛擬旅行和沉浸式社交體驗,MPEG-I為新時代奠定了基礎。在這個時代,沉浸式音頻將如同環繞四周的視覺影像一樣真實且易于獲取。
創新解析
新標準支持完整的六自由度移動——這意味著當你轉身、行走或環顧四周時,聲音會自然地隨之調整——同時保持足夠輕量,以實現高效的流媒體傳輸和實時渲染。
它能模擬真實的聲學環境,包括早期反射、混響、聲學遮蔽、衍射和多普勒效應,使得在VR/AR中的導航體驗更加真實。
MPEG-I 沉浸式音頻的建模能力將有助于讓創作者、開發者和最終用戶更易于獲得和普及高質量的沉浸式體驗。
想象一下,當你穿過虛擬體育場時,聽到人群的歡呼聲根據你的位置逼真地變化;或者在一個虛擬音樂會中,聲音隨著你在空間中的移動而做出相應反應。該標準將在VR和AR中實現逼真的音頻體驗,并確保跨設備和跨服務生態系統的互操作性,從而提高生產效率并降低成本。
在AR和VR中,用戶都能完全沉浸在周圍的聲學環境中,并可以在聲場中導航,同時音頻聲源保持在其各自的位置上。
VR音頻重現將你帶入完全虛構的聲學環境,而在AR重現中,你的物理聲音環境會以合理的方式與額外的虛擬聲音相輔相成。
支撐所述標準的技術
想象一下進入元宇宙中的一個黑暗洞穴。當你行走時,你的腳步聲會產生逼真的回聲,在石壁上回蕩,并且聲音會根據洞穴的大小和形狀發生細微變化。
諾基亞在三個主要領域為MPEG-I沉浸式音頻貢獻了尖端音頻技術:后期混響渲染、增強現實支持以及多個HOA采樣的渲染。
MPEG-I沉浸式音頻中的后期混響是首個為VR和AR應用打造的沉浸式版本,它可以為物理聲學環境自動配置自身,并支持互聯環境。
AR支持通過聆聽空間信息接口實現,使應用程序能夠配置物理聆聽空間的虛擬表示。
最后,多個HOA信號采樣的渲染使最終用戶能夠體驗到完整保真的6DoF環境,這些環境是實時采集的,無需昂貴的預制作成本。
MPEG-I沉浸式音頻能夠從音頻場景錄制區域中離散位置采集的HOA信號,自動創建一個連續的音頻場景。
MPEG-I沉浸式音頻旨在使新的VR/AR及擴展現實應用成為可能,在這些應用中,沉浸式音頻重現能夠自動根據正在被采集或建模的空間進行自我配置。
標準化的下一步
標準化的沉浸式音頻技術正在解鎖新的可能性和目標市場。目前我們已經邁出了重要的第一步,使參考渲染軟件能夠在消費級移動設備上運行,允許用戶能夠在他們的安卓設備體驗新穎的AR和VR體驗。
目前團隊正在開展進一步的工作,以實現用移動設備為MPEG-I沉浸式音頻采集空間音頻,最終允許消費者能夠采集完整的六自由度場景。
標準化的下一步是根據關鍵用例的應用開發者反饋,進一步開發渲染技術。
推動早期標準采用者和內容創作者的應用,對于獲取洞察、理解音頻行業如何推進個人消費者、企業及跨行業的沉浸式音頻未來至關重要。

