在大型語言模型(LLM)智能體的發展中,如何有效存儲和利用經驗成為一個關鍵問題。近日,來自伊利諾伊大學香檳分校和谷歌 DeepMind 的研究團隊提出了 Evo-Memory,這是一種流式基準和智能體框架,旨在彌補當前技術的不足。Evo-Memory 不僅評估智能體在測試時的學習能力,還關注自我演變的記憶,挑戰智能體是否能從連續任務流中積累和重用策略,而不僅僅依賴于靜態對話記錄。
傳統的智能體主要依靠對話回憶,存儲對話歷史、工具使用記錄及文檔檢索,以便在未來查詢中重新整合這些信息。然而,這種記憶方式只是被動地緩沖信息,無法主動修改智能體對相關任務的處理策略。相對而言,Evo-Memory 則強調經驗重用,將每次交互視為一個包含輸入、輸出和反饋的經驗,評估智能體是否能在后續任務中檢索這些經驗并將其轉化為可重用的策略。
研究團隊將記憶增強智能體形式化為一個包含四個部分的元組(F, U, R, C),其中 F 為基本模型,R 為檢索模塊,C 為上下文構造,U 則是在每一步后寫入新經驗并演變記憶。Evo-Memory 通過將數據集重新構造成有序任務流,評估智能體在多種環境中的表現。
為了設定基線,研究團隊還定義了 ExpRAG 模型,該模型將每次交互轉化為結構化的經驗文本。在新的任務中,智能體通過檢索相似經驗并將其與當前輸入結合來進行處理。
此外,ReMem 框架則引入了一個 “思考 - 行動 - 記憶細化” 的控制循環,允許智能體在推理過程中主動檢索、修剪和重組其記憶。這種方式使得記憶成為一個顯式對象,能夠在推理時進行動態編輯。
研究結果顯示,使用 ReMem 和 ExpRAG 等自演變記憶的智能體在測試時的表現顯著提高,能夠以更少的步驟完成任務,表現出更高的成功率和準確性。這一研究成果為 LLM 智能體的未來發展提供了新的方向。
論文:https://arxiv.org/pdf/2511.20857
劃重點:
?? Evo-Memory 是一個新推出的流式基準,專注于智能體的經驗重用。
?? ReMem 框架允許智能體在推理過程中動態管理記憶,提升了任務完成效率。
?? 研究顯示,使用自演變記憶的智能體在準確性和成功率方面表現出明顯的提升。

