近日,中文語言理解領域權威測評基準SuperCLUE發(fā)布第二期手機GUI Agent(離線)測評報告,中興通訊自主研發(fā)的Nebula-GUI-V2憑借92.27的高分強勢登頂總榜。Nebul-GUI是中興通訊星云大模型家族的一員,主要用于各類GUI界面自主操作,在UI元素定位與指令執(zhí)行兩大核心能力上表現(xiàn)突出,以絕對優(yōu)勢領跑行業(yè),彰顯了中興通訊在AI智能交互領域的深厚技術積淀與創(chuàng)新實力。

SuperCLUE本次測評在首期基礎上全面升級,新增"智慧辦公""生活健康"等實用場景,并引入20步左右跨應用困難題,從多維度、全場景精準衡量手機端離線智能交互水平。本次共有國內外12個代表性智能體產(chǎn)品參與角逐,測評結果的權威性和參考價值也因此得到進一步提升,為行業(yè)提供了更為清晰的發(fā)展標桿。
在核心能力測評中,中興Nebula-GUI-V2展現(xiàn)出均衡且卓越的綜合實力。其中,在UI元素定位環(huán)節(jié)以98.40分的高分刷新紀錄,展現(xiàn)出對屏幕目標元素的精準識別與定位能力;指令執(zhí)行環(huán)節(jié)同樣表現(xiàn)亮眼,以88.18分位列第一,在視頻娛樂、音樂播放、交通導航、健康管理、辦公協(xié)作等九大核心場景中均取得優(yōu)異成績,其中健康管理場景得分高達94.00分,辦公協(xié)作場景89.10分,充分體現(xiàn)了產(chǎn)品對用戶多樣化需求的深度適配。

尤為值得關注的是,Nebula-GUI-V2在跨應用復雜任務中表現(xiàn)突出,憑借高效的指令理解能力和精準的操作執(zhí)行邏輯,順利攻克各類高難度場景任務,其任務完成度、動作類型準確率及動作細節(jié)匹配率均處于行業(yè)頂尖水平。這一成果背后,是中興通訊在人工智能、計算機視覺、自然語言處理等領域的持續(xù)技術投入與創(chuàng)新突破,通過優(yōu)化模型架構與算法邏輯,實現(xiàn)了智能交互體驗的跨越式提升。

GUI Agent作為手機端聚合服務的AI“超級入口”,正成為行業(yè)競爭的新焦點。它憑借重塑流量分發(fā)格局的潛力,不僅催生千億級市場機遇,更吸引諸多頭部科技企業(yè)紛紛布局。此次登頂SuperCLUE測評,是中興通訊AI技術創(chuàng)新成果的又一重要體現(xiàn)。隨著智能終端交互需求的不斷升級,中興通訊將繼續(xù)以用戶需求為中心,持續(xù)迭代優(yōu)化產(chǎn)品能力,為全球用戶提供更智能、更便捷、更高效的交互體驗,助力AI技術走進千家萬戶。
-金年會體育