近日,來自麻省理工學院的初創公司 OpenAGI 正式亮相,并宣布其新推出的 AI 模型 Lux 在計算機操作方面的表現超越了 OpenAI 和 Anthropic 的同類產品,且成本僅為其十分之一。OpenAGI 的首席執行官秦增義表示,Lux 是一種基礎模型,旨在通過解析計算機截圖,自動執行桌面應用程序中的操作。

在最新發布的 Online-Mind2Web 基準測試中,Lux 的成功率達到了83.6%,而 OpenAI 的 Operator 僅為61.3%,Anthropic 的 Claude Computer Use 則為56.3%。這種顯著的性能差距讓業界人士對 Lux 的技術能力充滿期待。

與傳統的大型語言模型不同,Lux 采用了 “Agent主動預訓練” 的方法,專注于從計算機截圖和動作序列中學習。這一自我強化的訓練循環使得 Lux 能夠在不斷探索的過程中提高自身能力,從而實現了更高效的操作。

OpenAGI 還聲稱,Lux 的操作成本大約是 OpenAI 和 Anthropic 前沿模型的十分之一,且其速度也更快。不同于僅能處理瀏覽器任務的競爭對手,Lux 可以全面控制桌面應用程序,包括 Excel、Slack 等,極大地擴展了其市場潛力。公司同時發布了開發者軟件開發工具包,允許第三方基于 Lux 開發應用。

在安全性方面,OpenAGI 為 Lux 設計了內置的安全機制,當模型接收到可能違反安全政策的請求時,會拒絕執行,并向用戶發出警告。這一特性在當前 AI 代理快速發展的背景下尤為重要。

秦增義博士背景深厚,曾參與開發多個廣受歡迎的 AI 模型,展示了較小團隊在技術上的潛力與創新。

劃重點:

- ?? OpenAGI 推出的 Lux AI 代理在計算機操作基準測試中獲得83.6% 的成功率,遠超 OpenAI 和 Anthropic。

- ?? Lux 采用獨特的學習方式,通過計算機截圖和動作序列進行訓練,具有自我強化的能力。

- ?? 安全機制內置于 Lux 中,能夠識別和拒絕潛在的危險請求,保障用戶數據安全。