提高對環境聲音的定向感知能力增強
(中國AI網 2025年08月04日)AR是一種將虛擬內容疊加到用戶真實世界視圖的技術,從而提供復合視圖。AR設備可以將語音轉換為文本,并將書面轉錄內容呈現在顯示器的預定區域。這樣的技術對于聽力受損用戶十分有用。
在一份專利申請中,谷歌就介紹了一種相關技術。具體來說,發明描述了一種根據捕獲音頻數據生成環境聲音的情景信息的方法,目標是提高對環境聲音的定向感知能力增強。
在一個實施例中,專利描述的方法包括,從由顯示設備上的多個麥克風捕獲的音頻數據中檢測環境聲音;基于所述音頻數據,確定所述環境聲音的聲源位置;基于包含所述環境聲音的所述音頻數據的音頻段,生成關于所述環境聲音的情境信息;以及由所述顯示設備基于所述聲源位置顯示所述情境信息。
另外,可以基于所述音頻數據,確定所述環境聲音的第一聲源的第一位置和所述語音的第二聲源的第二位置;基于包含所述環境聲音的所述音頻數據的第一音頻段,生成關于所述環境聲音的第一情境信息;基于音頻數據的第二音頻段,生成關于所述語音的第二情境信息;由所述顯示設備基于所述第一聲源的所述第一位置顯示所述第一情境信息;以及由所述顯示設備基于所述第二聲源的所述第二位置顯示所述第二情境信息。
......(全文 3267 字,剩余 2775 字)
請微信掃碼通過小程序閱讀完整文章或者登入網站閱讀完整文章
映維網會員可直接登入網站閱讀
PICO員工可聯系映維網免費獲取權限

