蘋果正在與加利福尼亞大學(xué)圣迭戈分校,卡內(nèi)基梅隆大學(xué),華盛頓大學(xué)和麻省理工學(xué)院共同展開研究

Vision Pro QQ群交流:653565822

中國AI網(wǎng) 2025年05月26日)為了幫助訓(xùn)練人形機器人,諸如特斯拉和英偉達等機構(gòu)和團隊紛紛把目光投向了XR頭顯。通過這種方式,人型機器人可以1:1地復(fù)刻映射人類操作員的動作,而軟件可以以實現(xiàn)第一人稱視頻的實時傳輸和精確控制輸出,同時保持極低延遲。

現(xiàn)在,蘋果同樣有參與其中,并正在與加利福尼亞大學(xué)圣迭戈分校,卡內(nèi)基梅隆大學(xué),華盛頓大學(xué)和麻省理工學(xué)院共同展開基于Apple Vision Pro的人形機器人訓(xùn)練研究。

值得一提的是,彭博社早前報道稱,蘋果正在研發(fā)能夠在雜亂空間中穿行并處理洗碗等家務(wù)的機器人。

蘋果聯(lián)合多所高校開展基于Vision Pro的人形機器人訓(xùn)練研究  第1張

研究人員主要探索了一個更具可擴展性的數(shù)據(jù)源,以自我為中心的人類演示,從數(shù)據(jù)和建模的角度減輕人形機器人和人類之間的具身差距。

團隊收集了一個自中心的數(shù)據(jù)集(PH2D)。其中,Apple Vision Pro可以記錄人類操作員的實際動手操作,包括抓取和抬起等動作,并在錄制過程中提供語音指導(dǎo)。然后,視頻會放慢并用于機器人訓(xùn)練。

他們同時訓(xùn)練了人類-人形機器人行為策略HAT。HAT的狀態(tài)-動作空間對于人類和人形機器人是統(tǒng)一的,并且可以對人形機器人的動作進行微分重定向。

相關(guān)論文:Humanoid Policy ~ Human Policy

實驗結(jié)果表明,這種解決方案顯著提高了數(shù)據(jù)收集效率,改善了策略魯棒性和泛化性。