一項最新研究表明,利用生成式 AI 模型,特別是大型語言模型(LLM),可以構(gòu)建一種能夠在多種情境下準(zhǔn)確模擬人類行為的架構(gòu)。這項研究成果為社會科學(xué)研究提供了一個強大的新工具。

研究人員首先招募了1000多名來自美國不同背景的參與者,并對他們進(jìn)行了長達(dá)兩小時的深度訪談,收集了他們的生活經(jīng)歷、觀點和價值觀等信息。然后,研究人員利用這些訪談記錄和一個大型語言模型構(gòu)建了一個“生成式代理架構(gòu)”。

這個架構(gòu)能夠根據(jù)參與者的訪談內(nèi)容創(chuàng)建出上千個虛擬的“克隆人”,每個“克隆人”都擁有獨特的個性和行為模式。研究人員通過一系列標(biāo)準(zhǔn)的社會科學(xué)測試,例如“大五人格測試”和行為經(jīng)濟(jì)學(xué)游戲,來評估這些“克隆人”的行為表現(xiàn)。

令人驚訝的是,這些“克隆人”在測試中的表現(xiàn)與真實參與者高度一致。不僅能夠準(zhǔn)確預(yù)測他們在調(diào)查問卷中的回答,還能預(yù)測他們在實驗中的行為反應(yīng),例如在權(quán)力影響信任的實驗中,“克隆人”的表現(xiàn)與真實參與者一樣,高權(quán)力組的信任度明顯低于低權(quán)力組。

這項研究成果表明,生成式 AI 模型可以被用來創(chuàng)建高度逼真的“虛擬人類”,并用于預(yù)測真實人類的行為。這為社會科學(xué)研究提供了一種全新的方法,例如可以利用這些“虛擬人類”來測試新的公共衛(wèi)生政策或營銷策略的效果,而無需進(jìn)行大規(guī)模的真人實驗。

研究人員還發(fā)現(xiàn),僅僅依靠人口統(tǒng)計學(xué)信息來構(gòu)建“虛擬人類”是不夠的,只有結(jié)合深度訪談內(nèi)容才能更準(zhǔn)確地模擬個體行為。這表明,每個個體都有其獨特的經(jīng)歷和觀點,這些信息對于理解和預(yù)測他們的行為至關(guān)重要。

為了保護(hù)參與者的隱私,研究人員計劃建立一個“代理庫”,并以兩種方式提供訪問權(quán)限:開放訪問固定任務(wù)的匯總數(shù)據(jù),以及限制訪問開放任務(wù)的個體數(shù)據(jù)。這樣既可以方便研究人員使用這些“虛擬人類”,又能最大限度地降低與訪談內(nèi)容相關(guān)的風(fēng)險。

這項研究成果無疑為社會科學(xué)研究打開了一扇新的大門,未來將會產(chǎn)生哪些深遠(yuǎn)的影響,讓我們拭目以待。

論文地址:https://arxiv.org/pdf/2411.10109