單張圖像生成三維世界
(中國AI網 2024年12月03日)由華裔科學家李飛飛創辦的空間智能公司World Lab日前分享了一項成果:只需單張圖像即可生成三維世界。團隊研發的人工智能系統可以允許用戶進入任何圖像,并以三維方式進行探索其中的世界。
除了圖片本身之外,所生成的3D世界的一切都是由AI生成,而且所述項目的重點在于:生成的3D世界具有交互性。盡管目前是用WASD方向鍵和鼠標進行探索,但不難想象,以后用戶或許可以直接通過XR頭顯進行探索。

場景在瀏覽器中實時渲染,配備了可控的camera效果和可調節的模擬景深。你甚至可以改變其中的顏色,動態調整背景光影,在場景中插入其他對象。
在過去,之前大多數生成模型預測的是像素,而這個AI系統直接預測3D場景。所以場景在生成后就會一直存在。你回頭看,背后的場景不會改變。
所生成的世界遵循3D幾何的基本物理規則。它們有一種堅實和深度的感覺,與其他人工智能生成的視頻的夢幻性質形成鮮明對比。
當然,目前只是早期預覽,而李飛飛團隊正在努力優化所生成世界的大小和保真度,并嘗試提供用戶與它們交互的新方法。
更多信息及效果演示請訪問這個頁面。

