迪士尼研究部門近日發(fā)布了一項(xiàng)創(chuàng)新的圖像壓縮技術(shù),該技術(shù)在保持較低數(shù)據(jù)傳輸率的同時(shí),能夠生成更為逼真的圖像效果。
這項(xiàng)新型編解碼技術(shù)雖然在復(fù)雜度上較傳統(tǒng)的JPEG和AV1等編解碼器有所提升,但在圖像質(zhì)量和處理效率方面都展現(xiàn)出顯著優(yōu)勢(shì)。研究團(tuán)隊(duì)發(fā)現(xiàn),通過將量化誤差與圖像處理中的噪聲處理相結(jié)合,可以在目標(biāo)比特率下更好地重建圖像細(xì)節(jié)。
迪士尼壓縮方法與之前方法的比較。作者聲稱細(xì)節(jié)恢復(fù)效果有所改善,同時(shí)提供了一種不需要數(shù)十萬美元訓(xùn)練的模型,并且運(yùn)行速度比最接近的等效競(jìng)爭(zhēng)方法更快。
研究人員表示,新技術(shù)只需執(zhí)行不到10%的完整處理流程,且無需對(duì)系統(tǒng)架構(gòu)進(jìn)行重大改動(dòng)。在實(shí)際測(cè)試中,即使其他壓縮方法使用兩倍的比特率,該技術(shù)重建的圖像質(zhì)量仍更受最終用戶歡迎。
然而,該技術(shù)也存在一些局限性。在某些特定情況下,重建的圖像可能會(huì)出現(xiàn)細(xì)微的不準(zhǔn)確,例如直線輕微彎曲或小物體邊界略有扭曲。這些問題主要源于系統(tǒng)特征維度的限制。
在實(shí)際應(yīng)用測(cè)試中,研究團(tuán)隊(duì)采用了多個(gè)數(shù)據(jù)集進(jìn)行評(píng)估,包括Kodak、CLIC2022和COCO30k。評(píng)估指標(biāo)涵蓋了峰值信噪比(PSNR)、學(xué)習(xí)感知相似性指標(biāo)(LPIPS)、多尺度結(jié)構(gòu)相似性指數(shù)(MS-SSIM)和Fréchet初始距離(FID)等多個(gè)維度。
進(jìn)一步比較迪士尼的新方法(以綠色突出顯示)與其他方法的對(duì)比。
用戶研究采用了強(qiáng)制選擇方法,通過類似國際象棋錦標(biāo)賽的Elo評(píng)級(jí)系統(tǒng)進(jìn)行評(píng)估。結(jié)果顯示,即便在競(jìng)爭(zhēng)對(duì)手使用兩倍數(shù)據(jù)量的情況下,迪士尼的新技術(shù)仍然獲得了明顯更高的用戶評(píng)分。
在處理速度方面,新技術(shù)相比主要競(jìng)爭(zhēng)對(duì)手提升顯著,處理時(shí)間從6.87秒縮短至3.49秒。這一效率的提升,加上出色的壓縮效果,使該技術(shù)在圖像存儲(chǔ)和傳輸領(lǐng)域具有重要的應(yīng)用價(jià)值。
值得注意的是,圖像壓縮技術(shù)的發(fā)展對(duì)于解決全球數(shù)據(jù)存儲(chǔ)、流媒體傳輸和能源消耗等問題具有重要意義。雖然最佳技術(shù)方案并不總能獲得最廣泛的市場(chǎng)認(rèn)可,但迪士尼的這項(xiàng)創(chuàng)新為業(yè)界提供了一個(gè)在效率和性能之間取得良好平衡的解決方案。

