EulerAtlas

基于插件的机器人行为学习框架 —— 首发公开:汽车 · 人形机器人

这是一个运行在结合了模仿学习(IL)与 FastTD3 强化学习(RL)RL→IL 管线之上、基于插件的 CLI 机器人行为学习框架。最先公开的两大旗舰域是 汽车(EulerDrive)人形机器人(EulerWalk) —— EulerDrive 提供多摄像头 BEV 自动驾驶(CARLA Town01 闭环验证),EulerWalk 提供人形机器人 RL→IL loco-manipulation 策略,两者均将预训练模型一并打包,无需训练、无需仿真器即可直接加载并运行。统一 obs/action 模式设计用于覆盖汽车、无人机、人形机器人、机器狗、移动操作、物流 AGV、农业机器人、造船厂起重机等 8 个域,而各个域则以 Domain Plugin 形式独立部署、持续扩展。

Open Source · v0.5.0

核心功能

首发公开 2 个域(汽车 · 人形机器人)+ 以插件持续扩展的 8 域模式 · 模仿学习 + FastTD3 强化学习 · SOTA 策略模型

经典域 (01–04)

Internal Schema Boundary — 每个域拥有固定维度模式,所有模块以一致方式通信。

汽车 (road) 4D状态 + 2D动作 — CARLA联动,nuScenes适配器
无人机 (aerial) 6D状态 + 3D动作 — AirSim骨架
人形机器人 33D状态 + 14D动作 (loco-manip) — MuJoCo Humanoid-v5 / HumanoidBench 联动
机器狗 (quadruped) 12D状态 + 8D动作 — MuJoCo Ant-v5联动

工业域 (05–08)

工厂、物流、农业、造船 — 每个域包含专用Mock模拟器和数据适配器。

移动操作 18D状态 + 8D动作 — 推荐模型:ACT
仓储AGV (warehouse) 14D状态 + 4D动作 — 推荐模型:BC-RNN
智慧农业机器人 16D状态 + 6D动作 — 推荐模型:Diffusion
造船厂起重机 (shipyard) 20D状态 + 9D动作 — 推荐模型:ACT

策略模型 (核心 5 + SOTA + RL)

BC-MLP / RNN / CNN基础·时序·视觉行为克隆
ACTAction Chunking Transformer + CVAE(操作 SOTA)
Diffusion Policy基于扩散模型的策略 (DDPM)
SOTA (插件)BEVFuser(多摄像头 BEV)、TemporalTransformer(Tesla-FSD 型)、WholeBodyACT(loco/manip 分离头)
RL Actor NEWFastTD3 off-policy RL (twin critic, n-step) —— RL→IL 工作流

复杂度级别 (L0–L2)

L0 (Toy)Mock 模拟器 + BC-MLP — 教程/CI用
L1 (Intermediate)域推荐模型 + Mock — 算法研究
L2 (Advanced)真实后端 (CARLA / MuJoCo / HumanoidBench) + SOTA 模型

首发公开旗舰 — EulerDrive(汽车)· EulerWalk(人形机器人)

最先公开的两个域。预训练模型已随包附带,无需训练、无需仿真器即可直接加载并运行。其余域以插件形式陆续扩展。

EulerDrive (汽车)

多摄像头 BEV 融合自动驾驶。由 BEVFuserPolicy + IPM BEV 投影 + PID 航点控制器组成,已在 CARLA Town01 三摄像头数据上完成闭环验证。

  • 闭环指标:RouteCompletion / InfractionScore / DrivingScore。
  • 验证结果:CARLA Town01 航点损失 14.71 → 4.56(下降 69%)。
  • 随包模型:bevfuser_lite_carla_town01.pt

EulerWalk (人形机器人)

完整的 RL→IL 管线。先用 FastTD3 强化学习(RLTrainer)训练出专家,再生成演示,最后用 WholeBodyACT 模仿策略进行蒸馏。

  • 验证结果:RL 回报 406 → 418 → IL 损失 1.98e-4,rollout 稳定。
  • 随包模型:wholebodyact_locomanip.ptrl_actor_walk.pt
  • 模式:人形机器人 33D 状态 / 14D 动作 (loco-manipulation)。

※ 首发公开的 2 个域(汽车 · 人形机器人)基于真实后端·数据集,属研究级;其余 6 个域在同一套统一模式之上以插件形式陆续公开。

数据管线 & 仿真

从合成数据生成到仿真rollout的完整管线

数据管线

合成数据生成、外部数据采集、增强、编辑——完整的数据工作流通过CLI完成。

  • Pull:生成/采集合成或真实专家演示数据。
  • Ingest:将JSONL/CSV转换为内部格式。
  • Augment:噪声、镜像、时间抖动等数据增强。
  • Edit:统计检查、过滤、合并、拆分。

仿真 & 评估

在仿真中运行已学习的策略,并自动计算评估指标。

  • Mock模拟器:8个域专用内置模拟器,即时运行(无依赖)。
  • 真实后端:CARLA(汽车)、MuJoCo(机器人)、AirSim/Isaac Lab(骨架)。
  • 并行仿真:ParallelSimManager同时运行N个实例。
  • 场景套件:边角案例场景构建及pass/fail报告。

CLI 参考

以命令组覆盖完整工作流(--lang 支持 5 种语言)

init

从角色/级别自动生成 YAML 配置。

train

训练 BC/IL 策略。支持续训、GPU、检查点、项目追踪。

train-rl NEW

用 FastTD3 强化学习训练专家策略(RL→IL 工作流)。

sim

rollout/replay — 运行并评估策略。支持 --render / --save-video(MP4)。

data

pull, ingest, augment, edit, collect, generate-demos — 数据管线。

model

export/load — 管理模型卡(SafeTensors + config.json)。

skill

内置技能查询、初始化、跨域迁移。

deploy

通过 MessageBridge(mock/ROS2/ZeroMQ)部署策略。

scenario

边角案例场景构建及套件运行。

validate

YAML 配置文件验证(50+ 规则)。

edge

边缘学习生命周期管理 —— 端侧学习、部署与监控。

plugin

Domain Plugin 管理 —— 自定义域的注册、查询与初始化。

架构

4层抽象栈将角色、配置、学习和评估分离

4 层栈 + Domain Plugin

Layer 4 Skill/Meta-Agent — 基于角色/任务的推荐
Layer 3 Config/Validator — YAML 清单 + 50+ 验证规则
Layer 2 Data/Model/Training — 管线、策略网络、BCTrainer
Layer 1 Sim/Eval/Backend — 模拟器、评估、轨迹
Domain Plugin 将自定义域(obs/action 模式、模拟器、适配器)作为插件注册

技术规格

语言 Python 3.11+
框架 PyTorch, Gymnasium
模拟器 Mock(内置), CARLA, MuJoCo
日志 W&B, MLflow(可选)
模型格式 SafeTensors + config.json
错误格式 3行格式 (Category / Fix / See)

教程

通过分步指南快速掌握EulerAtlas

教程即将公开。

安装与入门

安装EulerAtlas并训练您的第一个策略

安装

pip install -e ".[dev]"

# 3行即可开始
euleratlas init --role road --level 0
euleratlas train -c config.yml
euleratlas sim rollout -c config.yml

系统要求

Python 3.11+, PyTorch

MuJoCo, W&B(可选)

用EulerAtlas训练8个域的机器人策略

从汽车到造船厂起重机,从专家演示到策略,3行CLI。

在GitHub上开始 联系我们