HiCo是360 AI研究院推出的基于擴散模型的層次化可控布局到圖像生成模型,HiCo基于多分支結構設計,實現對對象位置和文本描述的精確控制。HiCo的關鍵特點在于進行空間解耦,有效地處理復雜布局,減少對象缺失和視角沖突等問...
-
-
Fast GraphRAG 是微軟推出的高效的知識圖譜檢索框架,旨在提供可解釋性和高精度的代理驅動檢索工作流。它結合了檢索增強生成(RAG)技術和知識圖譜,提升大型語言模型(LLMs)在處理私有數據和復雜數據集時的性能。...
-
MeetingMind是AI驅動的會議助手,基于錄音和文件上傳功能自動轉錄會議音頻,從中提取關鍵信息,如任務、決策和問題,幫助用戶輕松捕獲和分析會議內容,采取行動。...
-
星辰大模型平臺是中國電信推出的AI大模型集合平臺,覆蓋語義、視覺、語音等多模態領域。包含不同參數量級的模型,支持長文本處理,具備多語種語音識別和多任務視覺處理能力。平臺以開源和技術創新為特點,推動AI技術在各行業的應用落地。...
-
Fish Agent是FishAudio推出的創新的端到端語音處理模型,集成自動語音識別(ASR)和文本到語音(TTS)技術,無需傳統的語義編碼器/解碼器,即可實現語音到語音的直接轉換。模型經過700,000小時的多語言音頻...
-
LongReward是清華大學、中國科學院、智譜AI聯合推出的,基于AI反饋改進長文本大型語言模型(LLMs)性能的方法。LongReward從有用性、邏輯性、忠實性和完整性四個維度為模型響應打分,提供獎勵信號,強化學習的方...
-
VirSci(Virtual Scientists)是上海人工智能實驗室推出的多智能體協作平臺系統,基于模擬科學家團隊的合作過程加速科研創新。系統基于大型語言模型(LLMs),用組織智能體團隊合作生成、評估和完善研究創意,展...
-
Amphion是開源的音頻、音樂和語音生成工具包,是香港中文大學(深圳)副教授武執政團隊聯合上海人工智能實驗室和深圳市大數據研究院共同推出的。工具包支持可重復的研究,幫助初級研究人員和工程師快速進入音頻、音樂和語音生成領域。...
-
Self-Lengthen是阿里巴巴千問團隊推出的創新的迭代訓練框架,能提升大型語言模型(LLMs)生成長文本的能力。框架基于兩個角色,生成器和擴展器協同工作,生成器負責生成初始響應,擴展器將響應拆分、擴展產生更長的文本。...
-
OSAID 1.0(The Open Source AI Definition – 1.0)是Open Source Initiative(OSI)發布的官方標準,用在明確AI系統成為開放源代碼的條件。參與制定OSAID 1...










