南洋理工大學(xué)與上海人工智能實(shí)驗(yàn)室聯(lián)合發(fā)布開源框架 PhysX-Anything,只需一張 RGB 圖像即可輸出帶幾何、關(guān)節(jié)、物理參數(shù)的完整3D 資產(chǎn),可直接導(dǎo)入 MuJoCo、Isaac Sim 進(jìn)行機(jī)器人策略訓(xùn)練。
技術(shù)亮點(diǎn)
1. 由粗到細(xì) pipeline:先預(yù)測整體物理屬性(質(zhì)量、質(zhì)心、摩擦系數(shù)),再部件級細(xì)化幾何與關(guān)節(jié)極限角度,避免“視覺優(yōu)先”導(dǎo)致的物理失真。
2. 新型壓縮3D 表示:把面片+關(guān)節(jié)軸+物理屬性編碼進(jìn)8K 維隱向量,推理時(shí)一次解碼,生成速度較 SOTA 提升2.3倍。
3. 顯式物理監(jiān)督:在數(shù)據(jù)集里加入12萬組真實(shí)物理測量,訓(xùn)練階段引入質(zhì)心、慣量與碰撞盒損失,確保仿真一致性。
實(shí)測結(jié)果
在 Geometry-Chamfer 與 Physics-Error 雙指標(biāo)上,PhysX-Anything 分別降低18% 與27%;絕對尺度誤差 <2cm,關(guān)節(jié)運(yùn)動(dòng)范圍誤差 <5°,顯著優(yōu)于 ObjPhy、PhySG 等最新方法。真實(shí)場景測試(宜家家具、廚房用具)中,生成資產(chǎn)導(dǎo)入 Isaac Sim 后,機(jī)器人抓取成功率提升12%,訓(xùn)練步數(shù)減少30%。
開源與影響
項(xiàng)目已上線 GitHub,權(quán)重、數(shù)據(jù)和評測基準(zhǔn)同步開放;團(tuán)隊(duì)計(jì)劃2026Q1發(fā)布支持「視頻輸入」的 V2版,可預(yù)測可動(dòng)部件時(shí)序軌跡,為動(dòng)態(tài)場景策略學(xué)習(xí)提供支持。
論文:https://arxiv.org/pdf/2511.13648

