OMNE Multiagent是天橋腦科學(xué)研究院(Tianqiao and Chrissy Chen Institute,TCCI)推出的大模型多智能體框架。基于長期記憶(Long Term Memory, LTM)構(gòu)建,每...
-
-
DuoAttention是新型的框架,由MIT韓松團(tuán)隊(duì)提出,用在提高大型語言模型(LLMs)在處理長上下文時(shí)的推理效率。基于區(qū)分“檢索頭”和“流式頭”兩種注意力頭,優(yōu)化模型的內(nèi)存使用和計(jì)算速度。檢索頭負(fù)責(zé)處理長距離依賴,需要...
-
CogAgent是清華大學(xué)與智譜AI聯(lián)合推出的多模態(tài)視覺大模型,專注于圖形用戶界面(GUI)的理解和導(dǎo)航。通過視覺模態(tài)對(duì)GUI界面進(jìn)行感知,非傳統(tǒng)的文本模態(tài),更符合人類的直覺交互方式。...
-
Time-MoE是創(chuàng)新的時(shí)間序列基礎(chǔ)模型,基于混合專家(Mixture of Experts, MoE)架構(gòu),將時(shí)間序列預(yù)訓(xùn)練模型的參數(shù)規(guī)模擴(kuò)展至十億級(jí)別。模型用稀疏激活機(jī)制,在預(yù)測(cè)任務(wù)中僅激活部分網(wǎng)絡(luò)節(jié)點(diǎn),有效提升計(jì)算效率...
-
AutoGLM-Web是模擬用戶操作的智能瀏覽器助手,基于大型語言模型構(gòu)建,能執(zhí)行網(wǎng)頁訪問、信息檢索、內(nèi)容總結(jié)等任務(wù)。基于簡(jiǎn)單的文字或語音指令,AutoGLM-Web能在私域網(wǎng)站上完成高級(jí)檢索、模擬用戶瀏覽網(wǎng)頁的過程,快速批...
-
Moonshine是專為資源受限設(shè)備優(yōu)化的語音識(shí)別模型,提供快速且準(zhǔn)確的實(shí)時(shí)語音轉(zhuǎn)文本服務(wù)。適于需要即時(shí)響應(yīng)的應(yīng)用場(chǎng)景,例如現(xiàn)場(chǎng)轉(zhuǎn)錄和語音命令識(shí)別。Moonshine基于先進(jìn)的編碼器-解碼器架構(gòu)和旋轉(zhuǎn)位置嵌入技術(shù),提高模型在...
-
SynthID 是 DeepMind 推出的技術(shù)工具,基于在 AI 生成的內(nèi)容中嵌入數(shù)字水印幫助識(shí)別內(nèi)容。水印對(duì)人類是不可感知的,但能被機(jī)器檢測(cè)到,促進(jìn)信息的信任度。SynthID 適于文本、音樂、圖像和視頻等多種內(nèi)容形式,...
-
Whispo是AI驅(qū)動(dòng)的語音轉(zhuǎn)錄工具,支持用戶按住Ctrl鍵錄制語音,在釋放鍵時(shí)自動(dòng)將轉(zhuǎn)錄的文本插入到正在用的任何支持文本輸入的應(yīng)用程序中。工具的數(shù)據(jù)處理完全在本地進(jìn)行,確保數(shù)據(jù)的安全性和隱私性。...
-
OmniGen是用于統(tǒng)一圖像生成的新擴(kuò)散模型,能在單一框架內(nèi)處理多種圖像生成任務(wù),如文本到圖像的生成、圖像編輯、主題驅(qū)動(dòng)生成和視覺條件生成等。OmniGen涉及傳統(tǒng)計(jì)算機(jī)視覺任務(wù),將任務(wù)轉(zhuǎn)化為圖像生成任務(wù)增強(qiáng)模型的復(fù)雜圖像生...
-
sCM是OpenAI推出的連續(xù)時(shí)間一致性模型,基于擴(kuò)散模型原理進(jìn)行改進(jìn)。sCM簡(jiǎn)化理論框架和優(yōu)化采樣過程,實(shí)現(xiàn)圖像生成速度的顯著提升。sCM模型僅需兩步采樣能生成高質(zhì)量圖像,速度比傳統(tǒng)擴(kuò)散模型快50倍。...










