HunyuanVideo 1.5 是騰訊混元團隊開源的輕量級視頻生成模型,參數規模為8.3B。模型基于Diffusion Transformer架構,支持通過文字描述或圖片生成5-10秒的高清視頻,具備強大的指令理解能力,能...
-
-
MiMo-Embodied 是小米發布的全球首個開源的跨領域具身大模型,整合了自動駕駛和具身智能兩大領域的任務,實現了在環境感知、任務規劃、空間理解等多方面的卓越性能。模型基于視覺語言模型(VLM)架構,通過四階段訓練策略,...
-
SAM 3(Segment Anything Model 3)是 Meta AI 最新推出的先進計算機視覺模型,能通過文本、示例和視覺提示檢測、分割和跟蹤圖像及視頻中的對象。...
-
Seekdb是OceanBase開源的AI原生數據庫,解決AI應用開發中多模態數據融合與實時處理的痛點。支持向量檢索、全文搜索與結構化數據過濾的融合查詢,一條SQL即可完成跨模態數據處理,如“近7天交易超5萬元、位置異常且行...
-
SAM 3D 是 Meta 推出的先進 3D 重建模型,包含 SAM 3D Objects 和 SAM 3D Body 兩個子模型。SAM 3D Objects 能從單張圖像重建物體和場景的 3D 模型,支持多視角一致性和復...
-
PinMe 是開源的一鍵部署工具,能讓靜態網站或前端項目快速上線。工具用 IPFS 分布式存儲和 ENS 域名,生成永久鏈接,無需服務器和 DNS。...
-
MVGenMaster是復旦大學、阿里巴巴達摩院和湖潘實驗室共同推出的多視圖擴散模型,基于增強3D先驗處理多樣化的新視角合成(NVS)任務。模型基于度量深度和相機姿態扭曲的3D先驗,提升NVS的泛化和3D一致性。...
-
HiFiVFS(High Fidelity Video Face Swapping)是騰訊和VIVO公司推出的高保真視頻換臉框架,HiFiVFS基于Stable Video Diffusion(SVD)框架,用多幀輸入和時間...
-
360Zhinao2-7B是360自研的AI大模型360智腦7B參數升級版,涵蓋基礎模型及多種上下文長度的聊天模型。360Zhinao2-7B模型是繼360Zhinao1-7B之后的重要更新,基于采用全新的多階段訓練方式和更...
-
AnchorCrafter是基于擴散模型的智能視頻制作系統,用在自動生成具有高保真度的主播風格產品推廣視頻。基于整合人-物交互(HOI)到姿態引導的人體視頻生成中,實現對物體外觀和運動控制的高度還原,及對復雜人物-物體交互的...










