高德发布首个面向AGI的全栈具身技术体系“ABot”

4月19日消息，在2026北京亦庄机器人半程马拉松上，阿里旗下高德公开首款开放环境全自主具身机器人"高德途途"，这款四足机器人成功协助视障人士完成复杂避障、人群穿行等实战挑战。据介绍，ABot体系，从架构上突破了传统具身智能“单点拼凑、封闭验证”的碎片化路径，以AGI为核心目标，首次将数据引擎、基座模型与执行中枢耦合为统一系统。目前，高德ABot系列模型已经在全球15项权威基准测试中拿到SOTA。

据了解，ABot体系采用闭环飞轮式设计，涵盖数据、模型、应用三层，架构并非简单堆叠，而是深度咬合、互为引擎，实现“数据驱动模型、模型服务应用、应用反哺数据“。

据介绍，作为数据层的核心， ABot-World通过批量合成 Video、Depth、Point Cloud、Trajectory 四类训练数据，配合RL Training Engine在虚拟环境里定义奖惩、反复试错。模型以高保真仿真替代高昂的真机采集，从根本上弥合Sim-to-Real鸿沟，将数据成本压缩数个数量级。

模型层重点解决具身操作的通用性和导航的长程性，其核心是感知与决策。其中ABot-M负责操作，ABot-N负责导航，两个模型分工训练、通过 Model Skill机制组合调用，完成长程复杂任务。

应用层的核心是具身版“龙虾”ABot-Claw，通过将异构机器人统一于共享认知框架之下，打造具备调度、记忆、分层控制与社会对齐能力的“执行中枢”，以应对长程任务闭环难、知识不共享等问题。

据悉，在PBench、EZSbench、WorldArena、Agibot World Challenge等主流评测中ABot-World持续领先，并成为唯一在物理合规性、动作可控性、零样本泛化三大维度均达SOTA的模型。

此外，作为首个实现五大核心导航任务"大一统"的VLA基座模型，ABot-N具备意图理解、自主决策与持续进化能力，是途途走向开放世界的核心导航引擎。ABot-M是全球首个统一架构的具身操作基座模型，其可实现一个“通用大脑”适配多种形态的机器人，大幅提升操作模型在异构机器人形态和任务场景下的泛化能力。其采用层级式“大脑-动作”架构，通过多模块协同实现单一模型导航任务全覆盖。ABot-N推出后，在VLN-CE（R2R/RxR）、HM3D-OVON、EVT-Bench等7大权威基准上全面刷新SOTA，并在导航精度、社会合规性、zero-shot泛化实现领先。

据介绍，在LIBERO、LIBERO-Plus、RoboCasa GR1、RoboTwin 2.0等主流评测中，ABot-M全面超越π0.5、UniVLA、OpenVLA-OFT等强基线，在泛化能力、鲁棒性与跨形态迁移三个维度实现领先。

在ABot-Claw层面，作为ABot体系的“执行中枢”，ABot-Claw采用集中式Harness架构，将高德地图与用户私有地图设为全局认知锚点，把多模态感知数据统一映射至共享语义空间，形成可动态刷新、持久沉淀的“世界记忆”。新终端接入后，仅需读取全局上下文即可零成本继承环境认知。另外，ABot-Claw 采用"云端大脑—边缘响应"两级设计，兼顾智能深度与执行可靠性。在调度层面，该架构还支持多种异构机器人的并行协作与任务接力，故障时自动接续，实现任务上下文无缝移交与跨形态协作。ABot-Claw还首创闭环反馈与纠错机制，在模糊指令理解、跨机导引等复杂场景中充分验证其鲁棒性与泛化性。（定西）