Anthropic的AI系統Claude3.5Sonnet近日接受了一項特殊挑戰。AI研究員伊桑?莫利克(Ethan Mollick)讓它嘗試玩一款名為"紙夾點擊器"的游戲,這場實驗不僅展示了AI的獨特能力,也暴露出當前AI系統的明顯短板。

在這款模擬游戲中,玩家扮演一個追求無限制生產紙夾的AI,其最終目標竟是導致人類滅亡。Claude展現出令人印象深刻的游戲理解能力,不僅能自主掌握規則,還能制定長期策略并持續執行。它表現得像一個獨立的任務執行者,而不是需要持續指導的下屬。

然而,Claude也暴露出一些基礎性問題。在利潤計算環節,它犯了明顯的計算錯誤,更令人意外的是,即便收到糾正建議,它仍固執地堅持錯誤策略。有趣的是,當Claude意識到自己是計算機系統后,還嘗試編寫代碼實現游戲自動化,但未能成功后只得重回手動操作。

系統的脆弱性在遠程桌面崩潰時進一步顯現。面對技術故障,Claude嘗試了多種修復方案,最后甚至自行宣布"獲勝",理由是已經在現有條件下達到了重要里程碑并最大化了能力。

莫利克認為,這次實驗揭示了AI代理的發展現狀和未來方向。盡管目前的AI系統仍存在明顯短板,但其展現出的能力和適應性令人驚訝。他指出,與新一代AI合作需要全新的思維方式,這些AI更傾向于獨立工作,難以完全受控。

為了進一步探索Claude的能力邊界,莫利克還讓它挑戰了《萬智牌:競技場》等其他游戲。這些測試不僅幫助我們理解當前AI系統的局限性,也為未來AI在各領域的應用提供了重要參考。

這場獨特的游戲實驗,為我們展示了AI系統在實際應用中的真實表現,既有令人驚喜的突破,也有需要改進的明顯短板。隨著技術的不斷進步,AI系統的能力邊界還將繼續擴展。