GELab-Zero 是 StepFun 開發的開源 GUI Agent 模型,專注于移動設備的自動化交互和任務執行。具備本地可部署能力,支持在消費級硬件上運行 4B 模型,確保低延遲和隱私保護。GELab-Zero 提供一鍵多終端部署,自動處理環境依賴和設備管理,支持分布式任務編排和多模態 Agent 模式,能靈活處理復雜任務。在多個開源基準測試中,GELab-Zero 表現出色,尤其在 AndroidDaily 基準測試中,其靜態測試準確率高達 73.4%,顯著優于其他模型。解決了移動生態碎片化問題,提供通用兼容性,無需應用開發者適配,企業用戶可直接復用該基礎設施,快速將 MCP 能力集成到產品業務中。
GELab-Zero的主要功能本地可部署:支持在本地運行,無需依賴云端,確保隱私和低延遲。輕量化推理:可在消費級硬件上運行,平衡性能與資源消耗。一鍵多終端部署:提供統一的部署流程,自動處理環境依賴和設備管理。分布式任務編排:支持多設備任務分發,記錄交互軌跡,便于觀察和復現。多模態 Agent 模式:支持多種工作模式,包括 ReAct 閉環、多智能體協作和定時任務。高性能表現:在多個基準測試中表現優異,尤其在 AndroidDaily 基準測試中準確率領先。解決碎片化問題:提供通用兼容性,無需應用開發者適配,適用于復雜的移動生態。企業級應用支持:企業用戶可直接復用基礎設施,快速集成到產品業務中。開源代碼與基礎設施:提供完整的推理基礎設施和預訓練模型,支持快速部署和運行。GELab-Zero的技術原理本地化部署與隱私保護:采用本地部署方式,確保數據處理在本地完成,避免云端交互,從而實現隱私保護和低延遲響應。輕量化模型設計:優化模型結構,使其能夠在消費級硬件上高效運行,降低資源消耗,同時保持較高的推理速度和性能。即插即用的工程基建:提供完整的推理基礎設施,自動處理多設備連接、依賴安裝、權限配置等復雜工程問題,簡化部署流程。多模態交互能力:支持多種交互模式,包括 ReAct 閉環、多智能體協作和定時任務執行,能適應不同場景下的復雜任務需求。動態任務編排與回放:通過分布式任務編排,將任務分配到多個設備上執行,并記錄交互軌跡,便于任務的觀察和復現。強化學習與自適應推理:利用強化學習機制,使 Agent 能夠根據環境反饋動態調整策略,優化任務執行路徑,提升交互效率。通用 GUI 理解與操作:模型具備強大的 GUI 理解能力,能識別和操作各種移動應用界面,無需應用開發者進行額外適配。GELab-Zero的項目地址項目官網:https://opengelab.github.io/Github倉庫:https://github.com/stepfun-ai/gelab-zeroHuggingFace模型庫:https://huggingface.co/stepfun-ai/GELab-Zero-4B-previewGELab-Zero的應用場景移動設備自動化任務執行:在手機等移動設備上自動完成各種任務,如應用操作、信息查詢等。企業級應用集成:企業可快速將 GUI Agent 能力集成到業務系統中,提升自動化水平。復雜任務處理:支持多步驟、多條件的復雜任務,如在線購物、信息檢索等。家庭與個人生活助手:幫助用戶完成日常任務,如推薦電影、查詢交通信息等。教育與學習輔助:在教育類應用中輔助完成學習任務,如在線課程學習、作業提交等。生活服務應用:在生活服務類應用中提供自動化服務,如外賣點餐、打車服務等。 
