Qwen2.5-Turbo是阿里推出的先進語言模型,將上下文長度從 128k 擴展到了 1M ,相當于100萬個英文單詞或150萬個漢字。擴展讓模型能處理更長的文本,如長篇小說、演講稿或代碼。Qwen2.5-Turbo用高效...
-
-
Pixtral Large是法國Mistral.ai開源的1240億參數(shù)超大多模態(tài)模型,具備前沿級圖像理解能力,支持128K上下文,能理解文本、圖表和圖像。Pixtral Large基于Mistral Large 2開發(fā),擁...
-
Agent K v1.0 是華為諾亞方舟實驗室與倫敦大學學院團隊聯(lián)合推出的端到端自主數(shù)據(jù)科學智能體,能自動化、優(yōu)化和泛化處理多種數(shù)據(jù)科學任務。Agent K v1.0基于結構化推理和動態(tài)記憶管理,在無需人工微調的情況下,從經...
-
Voyage Multimodal-3 是 Voyage AI 推出的先進的多模態(tài)嵌入模型,能處理交錯的文本和圖像,并從 PDF、幻燈片、表格等截圖中捕捉關鍵視覺特征,無需復雜文檔解析。Voyage Multimodal-3...
-
Hali是特斯聯(lián)聯(lián)合國際輕奢品牌Buttons推出的多模態(tài)多智能體協(xié)作AI Agent。Hali具備類人思考、長記憶、物理世界感知和多智能體協(xié)作四大特點,語義理解準確率超97%,中英文翻譯準確率達96%。Hali被設計為用戶...
-
DanceFusion是清華大學推出的開源框架,專注于音頻驅動的舞蹈動作重建與生成。DanceFusion結合分層時空Transformer-VAE和擴散模型,能處理社交媒體上的不完整和嘈雜骨骼數(shù)據(jù),生成與音樂同步的逼真舞蹈...
-
Skywork O1是昆侖萬維推出的天工大模型4.0 O1版,是國內首款具備中文邏輯推理能力的o1模型。Skywork O1在模型輸出中內生了思考、計劃、反思等能力,顯著提升推理能力。Skywork O1模型包括基于開源Ll...
-
Symphony Creative Studio是TikTok推出的AI視頻創(chuàng)作工具,幫助廣告主和內容創(chuàng)作者簡化視頻制作流程。Symphony Creative Studio集成視頻生成、轉換和擴展功能,用戶輸入信息和素材或...
-
LLaMA-Mesh是清華大學和NVIDIA共同推出的項目,基于將3D網(wǎng)格生成與大型語言模型(LLMs)結合,實現(xiàn)用文本提示直接生成3D模型的功能。項目用OBJ文件格式將3D網(wǎng)格的頂點坐標和面定義轉換為文本,基于頂點量化技術...
-
iAgents是清華大學推出的多智能體系統(tǒng),基于為每個用戶配備個人AI智能體促進協(xié)作和完成日常任務。智能體能理解用戶的文件、命令,從協(xié)作中學習,實現(xiàn)自動的信息交換和任務解決。iAgents用infoNav推理機制指導智能體在...










