EulerAtlas

Framework de Aprendizaje de Comportamiento Robotico Basado en Plugins — Primer Lanzamiento: Automovil · Humanoide

Un framework de aprendizaje de comportamiento robotico basado en CLI y en plugins, que opera sobre un pipeline RL→IL que combina aprendizaje por imitacion (IL) y aprendizaje por refuerzo FastTD3 (RL). Los dos dominios insignia que se lanzan primero son automovil (EulerDrive) y humanoide (EulerWalk) — EulerDrive es conduccion autonoma BEV multicamara (verificada en lazo cerrado en CARLA Town01) y EulerWalk es una politica humanoide de loco-manipulation RL→IL, y ambos incluyen modelos preentrenados en el paquete, de modo que pueden cargarse y ejecutarse al instante sin entrenamiento ni simulador. El esquema unificado obs/action esta disenado para abarcar 8 dominios — automovil, dron, humanoide, perro robot, manipulacion movil, AGV de logistica, robot agricola y grua de astillero — y los dominios se despliegan de forma independiente y se expanden continuamente mediante Domain Plugin.

Open Source · v0.5.0

Funcionalidades Principales

2 dominios de primer lanzamiento (automovil · humanoide) + esquema de 8 dominios que se expande mediante plugins · aprendizaje por imitacion + RL FastTD3 · modelos de politica SOTA

Dominios Clasicos (01–04)

Internal Schema Boundary — todos los modulos se comunican de forma consistente a traves de un esquema con dimensiones fijas por dominio.

Automovil (road) Estado 4D + Accion 2D — Integracion CARLA, adaptador nuScenes
Dron (aerial) Estado 6D + Accion 3D — Esqueleto AirSim
Humanoide Estado 33D + Accion 14D (loco-manip) — Integracion MuJoCo Humanoid-v5 / HumanoidBench
Perro Robot (quadruped) Estado 12D + Accion 8D — Integracion MuJoCo Ant-v5

Dominios Industriales (05–08)

Fabrica, logistica, agricultura, astillero — cada dominio incluye un simulador Mock dedicado y adaptadores de datos.

Manipulacion Movil Estado 18D + Accion 8D — Modelo recomendado: ACT
AGV de Almacen (warehouse) Estado 14D + Accion 4D — Modelo recomendado: BC-RNN
Robot Agricola (smart farm) Estado 16D + Accion 6D — Modelo recomendado: Diffusion
Grua de Astillero (shipyard) Estado 20D + Accion 9D — Modelo recomendado: ACT

Modelos de Politicas (core 5 + SOTA + RL)

BC-MLP / RNN / CNNClonacion de comportamiento basica, temporal y basada en vision
ACTAction Chunking Transformer + CVAE (SOTA en manipulacion)
Diffusion PolicyPolitica basada en modelo de difusion (DDPM)
SOTA (plugin)BEVFuser (BEV multicamara), TemporalTransformer (estilo Tesla-FSD), WholeBodyACT (cabezas separadas loco/manip)
RL Actor NEWRL off-policy FastTD3 (twin critic, n-step) — flujo RL→IL

Niveles de Complejidad (L0–L2)

L0 (Toy)Simulador Mock + BC-MLP — para tutoriales/CI
L1 (Intermediate)Modelo recomendado por dominio + Mock — investigacion de algoritmos
L2 (Advanced)Backend real (CARLA / MuJoCo / HumanoidBench) + modelo SOTA

Dominios insignia de primer lanzamiento — EulerDrive (automovil) · EulerWalk (humanoide)

Los dos primeros dominios que se lanzan. Incluyen modelos preentrenados en el paquete, de modo que pueden cargarse y ejecutarse al instante sin entrenamiento ni simulador. El resto de dominios se expanden secuencialmente como plugins.

EulerDrive (automovil)

Conduccion autonoma con fusion BEV multicamara. Se compone de BEVFuserPolicy + proyeccion BEV por IPM + controlador de waypoints PID, y se verifico en lazo cerrado con datos de 3 camaras de CARLA Town01.

  • Metricas en lazo cerrado: RouteCompletion / InfractionScore / DrivingScore.
  • Resultado de verificacion: perdida de waypoints en CARLA Town01 14.71 → 4.56 (reduccion del 69%).
  • Modelo incluido: bevfuser_lite_carla_town01.pt.

EulerWalk (humanoide)

Pipeline RL→IL completo. Con aprendizaje por refuerzo FastTD3 (RLTrainer) crea un experto, genera demostraciones y las destila en la politica de imitacion WholeBodyACT.

  • Resultado de verificacion: retorno RL 406 → 418 → perdida IL 1.98e-4, rollout estable.
  • Modelos incluidos: wholebodyact_locomanip.pt, rl_actor_walk.pt.
  • Esquema: humanoide estado 33D / accion 14D (loco-manipulation).

※ Los 2 dominios de primer lanzamiento (automovil · humanoide) son de nivel investigacion con backends y datasets reales. Los otros 6 dominios se lanzan secuencialmente como plugins sobre el mismo esquema unificado.

Pipeline de Datos & Simulacion

Pipeline completo desde la generacion de datos sinteticos hasta el rollout en simulacion

Pipeline de Datos

Flujo de trabajo de datos completo por CLI: generacion de datos sinteticos, recopilacion de datos externos, aumento y edicion.

  • Pull: Generacion/recopilacion de datos de demostracion de expertos sinteticos o reales.
  • Ingest: Conversion de JSONL/CSV al formato interno.
  • Augment: Aumento de datos con ruido, reflejo, jitter temporal, etc.
  • Edit: Verificacion de estadisticas, filtrado, fusion, division.

Simulacion & Evaluacion

Ejecute las politicas aprendidas en simulacion y calcule metricas de evaluacion automaticamente.

  • Simulador Mock: Ejecucion inmediata con simuladores integrados dedicados para 8 dominios (sin dependencias).
  • Backends Reales: CARLA (automovil), MuJoCo (robot), AirSim/Isaac Lab (esqueleto).
  • Simulacion Paralela: Ejecucion simultanea de N instancias con ParallelSimManager.
  • Suite de Escenarios: Construccion de escenarios de casos extremos e informes pass/fail.

Referencia CLI

Grupos de comandos para todo el flujo de trabajo (soporte --lang en 5 idiomas)

init

Genera automaticamente la configuracion YAML a partir del rol/nivel.

train

Entrena politicas BC/IL. Soporta reanudacion, GPU, checkpoints y seguimiento de proyectos.

train-rl NEW

Entrena una politica experta con aprendizaje por refuerzo FastTD3 (flujo RL→IL).

sim

rollout/replay — ejecuta y evalua politicas. Soporta --render / --save-video (MP4).

data

pull, ingest, augment, edit, collect, generate-demos — pipeline de datos.

model

export/load — Gestiona tarjetas de modelo (SafeTensors + config.json).

skill

Consulta de habilidades integradas, inicializacion y transferencia entre dominios.

deploy

Despliega politicas con MessageBridge (mock/ROS2/ZeroMQ).

scenario

Construccion de escenarios de casos extremos y ejecucion de suites.

validate

Validacion de archivos de configuracion YAML (50+ reglas).

edge

Gestion del ciclo de vida de aprendizaje en el edge — entrenamiento on-device, despliegue y monitoreo.

plugin

Gestion de Domain Plugins — registro, consulta e inicializacion de dominios personalizados.

Arquitectura

Pila de abstraccion de 4 capas que separa roles, configuracion, aprendizaje y evaluacion

Pila de 4 Capas + Domain Plugin

Capa 4 Skill/Meta-Agent — Recomendaciones basadas en roles/misiones
Capa 3 Config/Validator — Manifiesto YAML + 50+ reglas de validacion
Capa 2 Data/Model/Training — Pipeline, redes de politicas, BCTrainer
Capa 1 Sim/Eval/Backend — Simulador, evaluacion, trayectorias
Domain Plugin Registra dominios personalizados (esquema obs/action, simulador, adaptador) como plugins

Especificaciones Tecnicas

Lenguaje Python 3.11+
Framework PyTorch, Gymnasium
Simuladores Mock (integrado), CARLA, MuJoCo
Registro W&B, MLflow (opcional)
Formato de Modelo SafeTensors + config.json
Formato de Errores Formato de 3 lineas (Category / Fix / See)

Tutoriales

Aprenda EulerAtlas rapidamente con guias paso a paso

Tutoriales proximamente.

Instalacion y Primeros Pasos

Instale EulerAtlas y entrene su primera politica

Instalacion

pip install -e ".[dev]"

# Comience con 3 comandos
euleratlas init --role road --level 0
euleratlas train -c config.yml
euleratlas sim rollout -c config.yml

Requisitos

Python 3.11+, PyTorch

MuJoCo, W&B (opcional)

Entrene politicas de robots en 8 dominios con EulerAtlas

Desde automoviles hasta gruas de astillero, de demostraciones de expertos a politicas con 3 comandos CLI.

Comenzar en GitHub Contactenos