了解最新公司动态及行业资讯

昨日,小米正式对外发布首代机器人 VLA 大模型 Xiaomi-Robotics-0。随后创办人雷军转发并表示「
小米很早开始布局机器人业务」。
据介绍,Xiaomi-Robotics-0 是一个拥有 47 亿参数、兼具视觉语言理解与高性能实时执行能力的开源 VLA 模型。
官方表示,Xiaomi-Robotics-0 不仅在三大主流的仿真测试中获得优异成绩,更在现实真机任务中实现了物理智能的泛化——动作连贯、反应灵敏,且能在消费级显卡上实现实时推理。

模型采用主流的 Mixture-of-Transformers (MoT) 架构,配备「视觉语言大脑(VLM)+动作执行小脑(Action Expert)」组合。官方称,模型既能听懂指令,又能像人类一样,在动作执行时保持极高的物理灵活性。
性能方面,Xiaomi-Robotics-0 刷新多项 SOTA:
在 LIBERO、CALVIN 和 SimplerEnv 测试中,模型在所有的 Benchmark、30种模型对比中,均取得了当前最优的结果。
模型保留了 VLM 本身的多模态理解能力,尤其是在具身更相关的 benchmark 中表现优异。