HOVER是什么

HOVER是英偉達推出的1.5M小模型,全稱為“Humanoid Versatile Controller”,即人形機器人的多功能全身神經(jīng)通用控制器。模型用150萬參數(shù)實現(xiàn)對機器人復(fù)雜動作的控制,能適應(yīng)多樣任務(wù)如導(dǎo)航、桌面操作和移動操作等,每種任務(wù)需要獨特的控制模式。HOVER的核心創(chuàng)新在于用全身運動模仿作為各種任務(wù)的通用抽象,提供通用的運動技能,用在學(xué)習(xí)多種全身控制模式。基于多模式策略蒸餾框架將不同控制模式整合到統(tǒng)一的策略中,實現(xiàn)模式間的無縫切換,且保留每種模式的優(yōu)勢,提高未來人形機器人應(yīng)用的效率和靈活性。

HOVER  英偉達推出的通用人形機器人功能控制器1.5M小模型 第1張HOVER的主要功能多模式控制:HOVER能無縫切換不同的控制模式,如導(dǎo)航、桌面操作和移動操作等,每種模式都有特定的控制需求。運動學(xué)位置跟蹤:HOVER支持對機器人關(guān)鍵部位的3D位置進行跟蹤,實現(xiàn)精確的運動復(fù)制。關(guān)節(jié)角度跟蹤:HOVER能跟蹤每個機器人電機的目標關(guān)節(jié)角度,實現(xiàn)復(fù)雜的肢體動作。根跟蹤:HOVER能跟蹤機器人的根速度、高度和方向,對保持平衡和執(zhí)行動態(tài)動作至關(guān)重要。統(tǒng)一命令空間:HOVER設(shè)計統(tǒng)一的命令空間,適應(yīng)各種控制設(shè)備,如操縱桿、動作捕捉系統(tǒng)、外骨骼和虛擬現(xiàn)實頭設(shè)。策略蒸餾:HOVER從Oracle策略中提取和蒸餾,將多種控制技能整合到單一的“通用策略”中,提高效率和靈活性。HOVER的技術(shù)原理本體感覺和命令屏蔽:HOVER基于本體感覺(機器人自身的狀態(tài)感知)和命令屏蔽(選擇性激活不同的命令空間)確定任務(wù)命令,支持獨立控制機器人的上半身和下半身。多模式策略蒸餾框架:HOVER用策略蒸餾技術(shù),將從大規(guī)模人類運動數(shù)據(jù)中學(xué)習(xí)到的Oracle策略轉(zhuǎn)化為能處理多種控制模式的單一策略。DAgger框架:HOVER采用DAgger(Dataset Aggregation)框架對齊學(xué)生策略和Oracle策略的動作,基于監(jiān)督學(xué)習(xí)優(yōu)化學(xué)生策略。模擬訓(xùn)練:HOVER的訓(xùn)練在NVIDIA Isaac模擬套件中進行,套件基于GPU加速,能快速模擬長時間的訓(xùn)練,將模型遷移到現(xiàn)實世界中,無需額外的微調(diào)。統(tǒng)一命令空間設(shè)計:HOVER的命令空間設(shè)計既通用又原子,能覆蓋大多數(shù)現(xiàn)有的控制配置,且能任意組合支持各種模式。運動重定向:HOVER能將人類動作數(shù)據(jù)集重定向為機器人動作數(shù)據(jù)集,基于匹配關(guān)鍵點和優(yōu)化參數(shù)實現(xiàn)。HOVER的項目地址項目官網(wǎng):hover-versatile-humanoid.github.ioarXiv技術(shù)論文:https://arxiv.org/pdf/2410.21229HOVER的應(yīng)用場景導(dǎo)航與移動:HOVER能控制人形機器人在復(fù)雜環(huán)境中進行導(dǎo)航和移動,如在不平坦的地面上行走或在狹窄的空間中穿梭,適于搜索救援、導(dǎo)覽服務(wù)等場景。桌面操作:在需要精細操作的桌面任務(wù)中,如組裝電子元件或進行實驗室工作,HOVER能精確控制機器人的上肢和手部關(guān)節(jié),實現(xiàn)復(fù)雜的手眼協(xié)調(diào)操作。移動操作(Loco-manipulation):結(jié)合移動與操作的任務(wù),例如在移動過程中抓取和搬運物體,HOVER能協(xié)調(diào)機器人的全身動作,實現(xiàn)流暢的搬運和操作任務(wù)。人機交互:HOVER支持各種輸入設(shè)備(如VR頭盔、動作捕捉系統(tǒng)、外骨骼)進行人機交互,讓機器人能模仿人類的動作和行為,適于娛樂、教育和培訓(xùn)等領(lǐng)域。遠程操作與仿真:在遠程操作場景中,HOVER能實時響應(yīng)操作者的指令,執(zhí)行精確的遠程任務(wù),如遠程手術(shù)輔助或危險環(huán)境作業(yè)。