LlamaCoder 是一個開源的 AI 工具,使用 Llama 3.1 405B 模型快速生成全棧應用程序。旨在提供一種替代 Claude Artifacts 的解決方案。集成了 Sandpack、Next.js、Tail...
-
-
RReHiFace-S是由硅基智能團隊推出的開源項目,實現高保真、實時人臉替換的AI算法,用戶通過簡單的操作在視頻或直播中進行面部交換。...
-
XVERSE-MoE-A36B是由元象推出的中國最大的MoE(Mixture of Experts,混合專家模型)開源大模型。模型具有2550億的總參數和360億的激活參數,性能上與超過100B參數的大模型相媲美,實現跨級的...
-
PyVideoTrans 是開源的視頻翻譯配音工具,將視頻內容從一種語言自動翻譯成另一種語言,并添加相應的字幕和配音。PyVideoTrans支持多語言,具備高效的語音識別和準確的文字翻譯功能,同時使用高質量的語音合成技術來...
-
MMRole是由中國人民大學高瓴人工智能學院研究團隊推出的的一種多模態角色扮演智能體(MRPA)框架。通過結合圖像和文本,使智能體以特定角色進行更自然和沉浸式的對話。...
-
ImageBind是Meta公司推出的開源多模態AI模型,將文本、音頻、視覺、溫度和運動數據等六種不同類型的信息整合到一個統一的嵌入空間中。模型通過圖像模態作為橋梁,實現其他模態數據的隱式對齊,無需直接的模態間配對數據。...
-
NarratoAI 是基于AI技術自動化影視解說和編輯的工具。通過大型語言模型(LLM)理解視頻內容,自動生成解說文案,并將文案轉化為配音,同時進行視頻剪輯和字幕生成。...
-
Pixtral 12B 是法國AI初創公司Mistral推出的首款多模態AI模型,能同時處理圖像和文本。模型擁有 120 億參數,模型大小約為 24GB,基于文本模型 Nemo 12B構建,能回答任意數量、任意尺寸圖像的問題...








