IterComp是一個(gè)由清華大學(xué)、北京大學(xué)、LibAI Lab、中國科學(xué)技術(shù)大學(xué)、牛津大學(xué)和普林斯頓大學(xué)的研究人員聯(lián)合推出的文本到圖像生成框架。基于迭代反饋學(xué)習(xí)機(jī)制,聚合多個(gè)擴(kuò)散模型的組合生成偏好,全面提升模型在處理復(fù)雜組合...
-
-
Chat2DB是一款A(yù)I驅(qū)動的數(shù)據(jù)庫管理和分析工具,基于自然語言處理技術(shù),支持用戶用自然語言與數(shù)據(jù)庫進(jìn)行交互,簡化SQL代碼的編寫和數(shù)據(jù)庫管理。Chat2DB支持多種數(shù)據(jù)庫系統(tǒng),包括MySQL、PostgreSQL、Orac...
-
SANA是由NVIDIA、麻省理工學(xué)院和清華大學(xué)共同推出的文本到圖像生成框架,能高效地生成高達(dá)4096×4096分辨率的高清晰度圖像。SANA基于深度壓縮自編碼器、線性擴(kuò)散變換器(Linear DiT)、僅解碼器的小型語言模...
-
Nemotron-70B-Instruct 是英偉達(dá)(NVIDIA)發(fā)布的一個(gè)大型語言模型,基于一種新穎的混合訓(xùn)練方法提升模型遵循指令時(shí)的響應(yīng)質(zhì)量和一致性。模型結(jié)合Bradley-Terry和Regression風(fēng)格訓(xùn)練的元...
-
TANGO 是一個(gè)由東京大學(xué)和 CyberAgent AI Lab 共同推出的開源框架,專注于生成與目標(biāo)語音同步的全身手勢視頻。基于分層音頻運(yùn)動嵌入和擴(kuò)散插值網(wǎng)絡(luò),將目標(biāo)語音音頻與參考視頻庫中的動作完美匹配,確保制作出高保真...
-
Ministral 3B和8B是由Mistral AI推出的兩款新型AI小模型,專為設(shè)備端計(jì)算和邊緣使用場景設(shè)計(jì)。在知識、常識、推理、功能調(diào)用和效率方面為10億參數(shù)以下的類別設(shè)定新的標(biāo)準(zhǔn)。Ministral 3B和8B支持高...
-
Marco是阿里國際最新推出的大規(guī)模商用翻譯大模型,支持15種全球主流語種,包括中、英、日、韓、西、法等。在BLEU評測指標(biāo)上超越Google翻譯、DeepL、GPT-4等競爭對手,提供基于語境的精準(zhǔn)翻譯,避免字面意思造成的...
-
模型判官是一個(gè)基于 Next.js 構(gòu)建的在線AI模型評測平臺,用戶輸入問題并選擇多個(gè)AI模型進(jìn)行測試,幫助用戶快速識別出最適于需求的AI模型。平臺的特色在于,提供多個(gè)模型的回答,自動調(diào)用一個(gè)評判模型評估回答的質(zhì)量,給出評分...
-
AgentStack是一個(gè)開源工具,旨在幫助開發(fā)者快速構(gòu)建AI代理項(xiàng)目。基于提供一個(gè)預(yù)配置的模板和集成流行的代理框架及大型語言模型(LLM)提供商,簡化從零開始創(chuàng)建AI代理的過程。AgentStack支持macOS、Wind...
-
Hallo2是由復(fù)旦大學(xué)、百度公司和南京大學(xué)共同推出的音頻驅(qū)動肖像圖像動畫生成模型。能將單張參考圖片和持續(xù)幾分鐘的音頻輸入結(jié)合起來,基于可選的文本提示調(diào)節(jié)肖像表情,生成與音頻同步的高分辨率4K視頻。Hallo2基于先進(jìn)的數(shù)據(jù)...










