將新穎且緊湊的大光學(xué)擴(kuò)展量波導(dǎo)架構(gòu)與AI驅(qū)動(dòng)的全息算法相結(jié)合。原型機(jī)在比現(xiàn)有技術(shù)大兩個(gè)數(shù)量級的3D眼動(dòng)范圍內(nèi)展示了高質(zhì)量的3D圖像

中國AI網(wǎng) 2025年07月29日)借助人工智能優(yōu)化的3D全息技術(shù),斯坦福大學(xué)和Meta的研究人員推出了一款輕巧如眼鏡的3D頭戴設(shè)備。他們宣稱,這是邁向通過“視覺圖靈測試”的重要一步。

從透鏡到屏幕,整個(gè)顯示器的厚度僅為3毫米。“未來,大多數(shù)虛擬現(xiàn)實(shí)顯示器都將是全息的。”手持一款不比普通眼鏡大多少的VR頭顯原型的斯坦福大學(xué)電氣工程學(xué)教授戈登·韋茨斯坦(Gordon Wetzstein)如是說道,“全息技術(shù)能提供其他任何類型的顯示器都無法實(shí)現(xiàn)的功能,而其封裝尺寸卻遠(yuǎn)小于當(dāng)今市場上的任何產(chǎn)品。”

斯坦福與Meta聯(lián)合研發(fā)AI全息眼鏡,突破VR顯示技術(shù)瓶頸  第1張

混合現(xiàn)實(shí)旨在無縫橋接物理和數(shù)字空間,提供超越現(xiàn)實(shí)世界限制的體驗(yàn)。相關(guān)的沉浸式平臺為培訓(xùn)、通信、娛樂和教育等應(yīng)用提供了變革性的能力。為了實(shí)現(xiàn)用戶與虛擬環(huán)境之間無縫且舒適的交互界面,近眼顯示器必須采用可穿戴的外形設(shè)計(jì),確保時(shí)尚且可全天使用,同時(shí)提供與真實(shí)世界相媲美的感知真實(shí)且易于訪問的體驗(yàn)。

基于波導(dǎo)的全息顯示器是解決設(shè)計(jì)緊湊型近眼顯示器并生成感知真實(shí)圖像這一挑戰(zhàn)的最有前途的技術(shù)之一。相關(guān)顯示器基于全息原理,可以編碼質(zhì)量與現(xiàn)實(shí)無法區(qū)分的3D場景,并能夠?qū)⒐鈱W(xué)堆棧的功能壓縮到輕薄、輕量的全息光學(xué)設(shè)計(jì)中。全息顯示器同時(shí)為近眼顯示器承諾了獨(dú)特的能力,包括像素級深度控制、高亮度、低功耗和光學(xué)像差校正能力。

然而,盡管基于輕薄光學(xué)波導(dǎo)的全息近眼顯示器在實(shí)現(xiàn)非常緊湊的外形方面顯示出了前景,但它們所實(shí)現(xiàn)的圖像質(zhì)量、生成 3D彩色圖像的能力或光學(xué)擴(kuò)展量都受到嚴(yán)重限制。

數(shù)字全息顯示器的一個(gè)根本問題是當(dāng)前空間光調(diào)制器提供的有限空間帶寬積或光學(xué)擴(kuò)展量。實(shí)際上,小的光學(xué)擴(kuò)展量從根本上限制了可以同時(shí)實(shí)現(xiàn)的視場角范圍和可能的視窗范圍。

應(yīng)對這一挑戰(zhàn)的實(shí)用解決方案需要雙管齊下。首先,必須以極高的精度對光的傳播進(jìn)行建模。其次,模型需要高效且能擴(kuò)展到大光學(xué)擴(kuò)展量設(shè)置。

計(jì)算光學(xué)的最新進(jìn)展表明,人工智能方法可用于學(xué)習(xí)相干波通過全息顯示器的精確傳播模型,從而顯著提高圖像質(zhì)量。相關(guān)模型一般使用卷積神經(jīng)網(wǎng)絡(luò),并通過實(shí)驗(yàn)捕獲的相位-強(qiáng)度圖像對進(jìn)行訓(xùn)練,從而比純模擬模型更準(zhǔn)確地模擬特定顯示器的光電特性。然而,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型無法準(zhǔn)確預(yù)測大光學(xué)擴(kuò)展量波導(dǎo)中的復(fù)雜光傳播,部分原因是錯(cuò)誤地假設(shè)光源是完全相干。其他重要問題包括模型的效率,以及在大光學(xué)擴(kuò)展量設(shè)置下的可擴(kuò)展性,同時(shí)確保準(zhǔn)確性和效率。

所以,斯坦福大學(xué)和Meta團(tuán)隊(duì)基于部分相干理論,將波傳播學(xué)習(xí)問題重新表述為相干性重建。他們推導(dǎo)了一個(gè)基于物理的波傳播模型,參數(shù)化了波導(dǎo)內(nèi)波傳播算子的互強(qiáng)度的低秩近似,并考慮了部分相干性,從而比現(xiàn)有的相干模型更準(zhǔn)確地模擬全息顯示器。

另外,所提出方法通過新興的連續(xù)隱式神經(jīng)表示來參數(shù)化光通過波導(dǎo)的傳播,使得能夠高效地學(xué)習(xí)一個(gè)模型,并用于在大光學(xué)擴(kuò)展量范圍內(nèi)任意空間和頻率坐標(biāo)的部分相干波前傳播。與現(xiàn)有方法相比,隱式模型實(shí)現(xiàn)了卓越的質(zhì)量。它需要的訓(xùn)練數(shù)據(jù)和時(shí)間比現(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)模型架構(gòu)少一個(gè)數(shù)量級,并且其連續(xù)性特性能更好地泛化到未見過的空間頻率,同時(shí)提高了波前未觀測部分的準(zhǔn)確性。

除了模型,研究人員同時(shí)設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)全息顯示系統(tǒng)。它包含一個(gè)全息波導(dǎo)、一個(gè)全息透鏡和一個(gè)微機(jī)電系統(tǒng)反射鏡。光學(xué)架構(gòu)通過轉(zhuǎn)向照明提供了大的有效光學(xué)擴(kuò)展量,并具有超緊湊的外形。

斯坦福與Meta聯(lián)合研發(fā)AI全息眼鏡,突破VR顯示技術(shù)瓶頸  第2張

總的來說,他們主要是將新穎且緊湊的大光學(xué)擴(kuò)展量波導(dǎo)架構(gòu)與AI驅(qū)動(dòng)的全息算法相結(jié)合,而原型機(jī)在比現(xiàn)有技術(shù)大兩個(gè)數(shù)量級的3D眼動(dòng)范圍內(nèi)展示了高質(zhì)量的3D圖像。結(jié)果是,顯示器既具有較大的視場,又具有較大的視窗。另外,這種眼鏡可以連續(xù)戴上幾個(gè)小時(shí),不會造成脖子或眼睛疲勞。

相關(guān)論文:Synthetic aperture waveguide holography for compact mixed-reality displays with large étendue

https://www.nature.com/articles/s41566-025-01718-w

當(dāng)然,這只是團(tuán)隊(duì)科研三部曲的第二部。第一部是介紹可以在小巧外形中實(shí)現(xiàn)高圖像質(zhì)量的全息波導(dǎo)。在第二部是建立一個(gè)工作原型。至于第三部的真正商業(yè)化產(chǎn)品,將工程的更精細(xì)的細(xì)節(jié)帶入生活。韋茨斯坦承認(rèn)這可能尚需要數(shù)年的時(shí)間,但最終一定能夠?qū)崿F(xiàn)。