EulerAtlas

Framework de Aprendizaje de Comportamiento Robotico Basado en Plugins — Primer Lanzamiento: Automovil · Humanoide

Un framework de aprendizaje de comportamiento robotico basado en CLI y en plugins, que opera sobre un pipeline RL→IL que combina aprendizaje por imitacion (IL) y aprendizaje por refuerzo FastTD3 (RL). Los dos dominios insignia que se lanzan primero son automovil (EulerDrive) y humanoide (EulerWalk) — EulerDrive es conduccion autonoma BEV multicamara (verificada en lazo cerrado en CARLA Town01) y EulerWalk es una politica humanoide de loco-manipulation RL→IL, y ambos incluyen modelos preentrenados en el paquete, de modo que pueden cargarse y ejecutarse al instante sin entrenamiento ni simulador. El esquema unificado obs/action esta disenado para abarcar 8 dominios — automovil, dron, humanoide, perro robot, manipulacion movil, AGV de logistica, robot agricola y grua de astillero — y los dominios se despliegan de forma independiente y se expanden continuamente mediante Domain Plugin.

Open Source · v0.5.0

Funcionalidades Principales

2 dominios de primer lanzamiento (automovil · humanoide) + esquema de 8 dominios que se expande mediante plugins · aprendizaje por imitacion + RL FastTD3 · modelos de politica SOTA

Dominios Clasicos (01–04)

Internal Schema Boundary — todos los modulos se comunican de forma consistente a traves de un esquema con dimensiones fijas por dominio.

Automovil (road)	Estado 4D + Accion 2D — Integracion CARLA, adaptador nuScenes
Dron (aerial)	Estado 6D + Accion 3D — Esqueleto AirSim
Humanoide	Estado 33D + Accion 14D (loco-manip) — Integracion MuJoCo Humanoid-v5 / HumanoidBench
Perro Robot (quadruped)	Estado 12D + Accion 8D — Integracion MuJoCo Ant-v5

Dominios Industriales (05–08)

Fabrica, logistica, agricultura, astillero — cada dominio incluye un simulador Mock dedicado y adaptadores de datos.

Manipulacion Movil	Estado 18D + Accion 8D — Modelo recomendado: ACT
AGV de Almacen (warehouse)	Estado 14D + Accion 4D — Modelo recomendado: BC-RNN
Robot Agricola (smart farm)	Estado 16D + Accion 6D — Modelo recomendado: Diffusion
Grua de Astillero (shipyard)	Estado 20D + Accion 9D — Modelo recomendado: ACT

Modelos de Politicas (core 5 + SOTA + RL)

BC-MLP / RNN / CNN	Clonacion de comportamiento basica, temporal y basada en vision
ACT	Action Chunking Transformer + CVAE (SOTA en manipulacion)
Diffusion Policy	Politica basada en modelo de difusion (DDPM)
SOTA (plugin)	BEVFuser (BEV multicamara), TemporalTransformer (estilo Tesla-FSD), WholeBodyACT (cabezas separadas loco/manip)
RL Actor NEW	RL off-policy FastTD3 (twin critic, n-step) — flujo RL→IL

Niveles de Complejidad (L0–L2)

L0 (Toy)	Simulador Mock + BC-MLP — para tutoriales/CI
L1 (Intermediate)	Modelo recomendado por dominio + Mock — investigacion de algoritmos
L2 (Advanced)	Backend real (CARLA / MuJoCo / HumanoidBench) + modelo SOTA

Dominios insignia de primer lanzamiento — EulerDrive (automovil) · EulerWalk (humanoide)

Los dos primeros dominios que se lanzan. Incluyen modelos preentrenados en el paquete, de modo que pueden cargarse y ejecutarse al instante sin entrenamiento ni simulador. El resto de dominios se expanden secuencialmente como plugins.

EulerDrive (automovil)

Conduccion autonoma con fusion BEV multicamara. Se compone de BEVFuserPolicy + proyeccion BEV por IPM + controlador de waypoints PID, y se verifico en lazo cerrado con datos de 3 camaras de CARLA Town01.

Metricas en lazo cerrado: RouteCompletion / InfractionScore / DrivingScore.
Resultado de verificacion: perdida de waypoints en CARLA Town01 14.71 → 4.56 (reduccion del 69%).
Modelo incluido: bevfuser_lite_carla_town01.pt.

EulerWalk (humanoide)

Pipeline RL→IL completo. Con aprendizaje por refuerzo FastTD3 (RLTrainer) crea un experto, genera demostraciones y las destila en la politica de imitacion WholeBodyACT.

Resultado de verificacion: retorno RL 406 → 418 → perdida IL 1.98e-4, rollout estable.
Modelos incluidos: wholebodyact_locomanip.pt, rl_actor_walk.pt.
Esquema: humanoide estado 33D / accion 14D (loco-manipulation).

※ Los 2 dominios de primer lanzamiento (automovil · humanoide) son de nivel investigacion con backends y datasets reales. Los otros 6 dominios se lanzan secuencialmente como plugins sobre el mismo esquema unificado.

Pipeline de Datos & Simulacion

Pipeline completo desde la generacion de datos sinteticos hasta el rollout en simulacion

Pipeline de Datos

Flujo de trabajo de datos completo por CLI: generacion de datos sinteticos, recopilacion de datos externos, aumento y edicion.

Pull: Generacion/recopilacion de datos de demostracion de expertos sinteticos o reales.
Ingest: Conversion de JSONL/CSV al formato interno.
Augment: Aumento de datos con ruido, reflejo, jitter temporal, etc.
Edit: Verificacion de estadisticas, filtrado, fusion, division.

Simulacion & Evaluacion

Ejecute las politicas aprendidas en simulacion y calcule metricas de evaluacion automaticamente.

Simulador Mock: Ejecucion inmediata con simuladores integrados dedicados para 8 dominios (sin dependencias).
Backends Reales: CARLA (automovil), MuJoCo (robot), AirSim/Isaac Lab (esqueleto).
Simulacion Paralela: Ejecucion simultanea de N instancias con ParallelSimManager.
Suite de Escenarios: Construccion de escenarios de casos extremos e informes pass/fail.

Referencia CLI

Grupos de comandos para todo el flujo de trabajo (soporte --lang en 5 idiomas)

`init`

Genera automaticamente la configuracion YAML a partir del rol/nivel.

`train`

Entrena politicas BC/IL. Soporta reanudacion, GPU, checkpoints y seguimiento de proyectos.

`train-rl` NEW

Entrena una politica experta con aprendizaje por refuerzo FastTD3 (flujo RL→IL).

`sim`

rollout/replay — ejecuta y evalua politicas. Soporta --render / --save-video (MP4).

`data`

pull, ingest, augment, edit, collect, generate-demos — pipeline de datos.

`model`

export/load — Gestiona tarjetas de modelo (SafeTensors + config.json).

`skill`

Consulta de habilidades integradas, inicializacion y transferencia entre dominios.

`deploy`

Despliega politicas con MessageBridge (mock/ROS2/ZeroMQ).

`scenario`

Construccion de escenarios de casos extremos y ejecucion de suites.

`validate`

Validacion de archivos de configuracion YAML (50+ reglas).

`edge`

Gestion del ciclo de vida de aprendizaje en el edge — entrenamiento on-device, despliegue y monitoreo.

`plugin`

Gestion de Domain Plugins — registro, consulta e inicializacion de dominios personalizados.

Arquitectura

Pila de abstraccion de 4 capas que separa roles, configuracion, aprendizaje y evaluacion

Pila de 4 Capas + Domain Plugin

Capa 4	Skill/Meta-Agent — Recomendaciones basadas en roles/misiones
Capa 3	Config/Validator — Manifiesto YAML + 50+ reglas de validacion
Capa 2	Data/Model/Training — Pipeline, redes de politicas, BCTrainer
Capa 1	Sim/Eval/Backend — Simulador, evaluacion, trayectorias
Domain Plugin	Registra dominios personalizados (esquema obs/action, simulador, adaptador) como plugins

Especificaciones Tecnicas

Lenguaje	Python 3.11+
Framework	PyTorch, Gymnasium
Simuladores	Mock (integrado), CARLA, MuJoCo
Registro	W&B, MLflow (opcional)
Formato de Modelo	SafeTensors + config.json
Formato de Errores	Formato de 3 lineas (Category / Fix / See)

EulerAtlas

Funcionalidades Principales

Dominios Clasicos (01–04)

Dominios Industriales (05–08)

Modelos de Politicas (core 5 + SOTA + RL)

Niveles de Complejidad (L0–L2)

Dominios insignia de primer lanzamiento — EulerDrive (automovil) · EulerWalk (humanoide)

EulerDrive (automovil)

EulerWalk (humanoide)

Pipeline de Datos & Simulacion

Pipeline de Datos

Simulacion & Evaluacion

Referencia CLI

`init`

`train`

`train-rl` NEW

`sim`

`data`

`model`

`skill`

`deploy`

`scenario`

`validate`

`edge`

`plugin`

Arquitectura

Pila de 4 Capas + Domain Plugin

Especificaciones Tecnicas

Tutoriales

Instalacion y Primeros Pasos

Instalacion

Requisitos

GitHub

Entrene politicas de robots en 8 dominios con EulerAtlas

EulerAtlas

Funcionalidades Principales

Dominios Clasicos (01–04)

Dominios Industriales (05–08)

Modelos de Politicas (core 5 + SOTA + RL)

Niveles de Complejidad (L0–L2)

Dominios insignia de primer lanzamiento — EulerDrive (automovil) · EulerWalk (humanoide)

EulerDrive (automovil)

EulerWalk (humanoide)

Pipeline de Datos & Simulacion

Pipeline de Datos

Simulacion & Evaluacion

Referencia CLI

init

train

train-rl NEW

sim

data

model

skill

deploy

scenario

validate

edge

plugin

Arquitectura

Pila de 4 Capas + Domain Plugin

Especificaciones Tecnicas

Tutoriales

Instalacion y Primeros Pasos

Instalacion

Requisitos

GitHub

Entrene politicas de robots en 8 dominios con EulerAtlas

`init`

`train`

`train-rl` NEW

`sim`

`data`

`model`

`skill`

`deploy`

`scenario`

`validate`

`edge`

`plugin`