Audio Decomposition是音頻處理技術,基于傅里葉變換和信封匹配將音樂中的各個音符和樂器分離,實現音樂到樂譜的轉換。Audio Decomposition開源項目是Matthew Bird推出的,無需外部樂器分...
-
-
ai-chatbot是Vercel推出的開源項目,基于Next.js框架和Vercel AI SDK構建。ai-chatbot提供一個功能完備、易于定制的AI聊天機器人模板,幫助開發者快速構建高性能和良好用戶體驗的聊天應用。...
-
MagicQuill是香港科技大學、螞蟻集團、浙江大學和香港大學共同推出的開源AI互動式圖像編輯工具。基于用戶友好的界面和AI支持的智能建議,實現精確的局部圖像編輯。用戶用簡單的筆觸和提示詞,輕松添加元素、擦除物體或改變顏色...
-
k0-math是月之暗面推出的最新數學推理模型,主打深入思考能力。在MATH、中考、高考、考研等數學基準測試中,k0-math的成績超過OpenAI的o1系列模型。模型基于不斷探索和試錯解決數學問題,即使在簡單問題上也會進行...
-
Florence-2 是微軟 Azure AI 團隊推出的多功能視覺模型,能執行圖像描述、目標檢測、視覺定位和圖像分割等多種計算機視覺任務。Florence-2 基于 Transformer 架構,用序列到序列學習方法,編碼...
-
Free Video-LLM是創新的無需訓練的高效視頻語言模型,基于提示引導的視覺感知技術,實現對視頻內容的高效理解。模型用預訓練的圖像LLMs,無需額外訓練即可適應視頻任務,減少視頻幀生成的視覺標記數量,降低計算成本。Fr...
-
OmniVision是緊湊的多模態模型,擁有968M參數,專為邊緣設備優化。OmniVision能處理視覺和文本輸入,基于LLaVA架構改進,顯著減少圖像token數量,降低延遲和計算成本。基于可信數據進行DPO訓練,Omn...
-
法信法律基座大模型是基于清華大學與面壁智能科研成果轉化的千億參數通用大模型,由最高人民法院發布,定位為國家級法律AI基礎設施。提供生成式AI底層能力,配套安全治理機制,保障法律AI安全發展。法信法律基座大模型基于清華大學與面...
-
Thinking Claude是基于深度思考協議和瀏覽器擴展工具,增強AI模型Claude-3.5的“深度思維”能力的項目,讓其思考邏輯更接近人類。支持AI以自然、未經過濾的方式深入思考后再回應,支持思考過程的展開和折疊。T...
-
LogoCreator是開源的logo生成器,基于Together AI提供的Flux Pro 1.1技術快速創建專業風格的logo。項目用Next.js和TypeScript構建應用框架,Shadcn和Tailwind C...










