读创

Home

越疆空弈DobotWAM具身大模型,测试平均成功率99.25%

2026/05/31 20:11 读创科技 袁静娴

深圳商报·读创客户端首席记者 袁静娴

近日,越疆科技正式发布自研世界动作模型空弈DobotWAM具身大模型。记者了解到,在具身智能标准评测基准LIBERO上,空弈DobotWAM具身大模型分别完成LIBERO-Spatial、LIBERO-Object、LIBERO-Goal和LIBERO-10四个标准任务套件,覆盖空间关系理解、物体泛化、目标指令理解以及长时序任务执行等关键能力维度,平均成功率达99.25%,领先于π0.5、π0、GR00T-N1.5、π0+FAST等公开模型,以及行业内已有数据公布的其他模型结果。

其中,空弈DobotWAM具身大模型在LIBERO-Object上实现100/100全部成功,在Spatial、Goal和LIBERO-10三个套件中均达到99/100。

越疆表示,机器人走向真实应用,真正的挑战不再是“识别物体”,而是在动态、多变的开放场景中,理解空间关系、拆解任务目标、生成符合运动结构的动作,并在多步执行中始终保持全局一致。

近两年,视觉-语言-动作模型成为具身智能动作生成的主流范式,在数据覆盖充分、任务边界清晰的场景下展现了较高效率。然而,过度依赖二维图像模式或离线轨迹模仿,在面对空间扰动、物体变化、长流程任务和真实接触反馈时,仍容易出现动作漂移、目标丢失,或局部动作正确而整体任务失败的情况。这要求机器人模型必须超越单纯的“模仿”,建立起对动作深层次结构的真正理解。

空弈DobotWAM的高成功率,源于其在感知、理解、控制与数据闭环上的系统性设计。模型在视觉-语言-动作建模的基础上,进一步引入三维空间理解、机器人运动几何约束和真实数据闭环机制,使机器人不仅学会“模仿动作”,更学会“理解动作为什么这样做”。

以多场景任务分类抓取、插充电器和插笔帽三项典型任务为例。这几个任务实则是高精度接触作业,要求模型不仅要识别目标物体的位置,还需理解插头与插座、笔身与笔帽之间的空间关系,并连续完成对准、接近、插入和闭合等动作,直接考验小目标定位与姿态估计、强几何约束下的末端控制以及接触过程中的稳定执行与误差修正三项关键能力。

测试中,空弈DobotWAM大模型能够基于视觉观测完成目标定位,结合机器人自身状态实时生成动作,使机械臂在真实环境中稳定完成抓取以及充电器插接流程。在插笔帽任务中,模型准确判断笔身与笔帽的相对位置及开口方向,完成轴线对齐和精细插入动作,全程保持姿态稳定。

(图片由企业提供)

Copyright©2020 Sxzm. All rights reserved.