AgentReview是基于大型語言模型(LLM)的框架,模擬學術同行評審過程。AgentReview基于LLM代理模擬評審者、作者和領域主席的角色,支持研究者在尊重隱私的同時,探索評審偏見、角色和決策機制對評審結果的影響。AgentReview能提供改進同行評審機制的洞見,支持未來的研究。
AgentReview的主要功能模擬同行評審過程:AgentReview模擬真實的學術同行評審流程,包括評審者評估、作者回應、評審者討論和領域主席決策等階段。角色模擬:框架內集成評審者、作者和領域主席(AC)三種角色,每種角色由LLM代理驅動,展現出不同的行為特征。多變量分析:基于模擬,AgentReview探索和分離多種影響評審結果的變量,如評審者的承諾、意圖和知識能力,及AC的決策風格。隱私保護:在模擬過程中,AgentReview尊重評審數據的隱私性,不需要用真實的敏感評審數據。社會學理論驗證:AgentReview驗證如社會影響理論、利他主義疲勞、群體思維和權威偏見等社會學理論在同行評審中的應用。AgentReview的技術原理大型語言模型(LLM):AgentReview基于LLM構建,用語言理解和生成能力模擬評審者和作者的行為。代理建模:框架中的每個角色(評審者、作者、AC)都被建模為具有特定屬性和行為的代理,代理根據預設的特性和規則進行交互。結構化評審流程:AgentReview遵循結構化的五階段評審流程,模擬從初步評審到最終決策的全過程。自定義和擴展性:框架設計為可擴展的,支持研究者根據需要自定義角色屬性和評審流程。數據驅動的洞察:基于大規模模擬生成的數據,AgentReview提供統計顯著的洞察,支持內容和數值分析。AgentReview的項目地址項目官網:agentreview.github.ioGitHub倉庫:https://github.com/Ahren09/AgentReviewHuggingFace模型庫:https://huggingface.co/spaces/Ahren09/AgentReviewarXiv技術論文:https://arxiv.org/pdf/2406.12708在線體驗Demo:https://huggingface.co/spaces/Ahren09/AgentReviewAgentReview的應用場景學術期刊和會議管理:用在優化和管理學術論文的同行評審流程,提高評審質量和效率。評審者培訓與發展:作為教育工具,幫助新評審者學習評審標準和最佳實踐。社會學和心理學研究:基于模擬驗證社會影響、群體思維等理論在評審行為中的應用。跨學科評審研究:比較不同學科間的評審標準和流程,為跨學科期刊設計提供依據。政策制定和評估:輔助政策制定者評估和制定同行評審相關的政策和指導方針。 
