Framework de Aprendizaje de Comportamiento Robotico Basado en Plugins — Primer Lanzamiento: Automovil · Humanoide
Un framework de aprendizaje de comportamiento robotico basado en CLI y en plugins, que opera sobre un pipeline RL→IL que combina aprendizaje por imitacion (IL) y aprendizaje por refuerzo FastTD3 (RL). Los dos dominios insignia que se lanzan primero son automovil (EulerDrive) y humanoide (EulerWalk) — EulerDrive es conduccion autonoma BEV multicamara (verificada en lazo cerrado en CARLA Town01) y EulerWalk es una politica humanoide de loco-manipulation RL→IL, y ambos incluyen modelos preentrenados en el paquete, de modo que pueden cargarse y ejecutarse al instante sin entrenamiento ni simulador. El esquema unificado obs/action esta disenado para abarcar 8 dominios — automovil, dron, humanoide, perro robot, manipulacion movil, AGV de logistica, robot agricola y grua de astillero — y los dominios se despliegan de forma independiente y se expanden continuamente mediante Domain Plugin.
Open Source · v0.5.02 dominios de primer lanzamiento (automovil · humanoide) + esquema de 8 dominios que se expande mediante plugins · aprendizaje por imitacion + RL FastTD3 · modelos de politica SOTA
Internal Schema Boundary — todos los modulos se comunican de forma consistente a traves de un esquema con dimensiones fijas por dominio.
| Automovil (road) | Estado 4D + Accion 2D — Integracion CARLA, adaptador nuScenes |
|---|---|
| Dron (aerial) | Estado 6D + Accion 3D — Esqueleto AirSim |
| Humanoide | Estado 33D + Accion 14D (loco-manip) — Integracion MuJoCo Humanoid-v5 / HumanoidBench |
| Perro Robot (quadruped) | Estado 12D + Accion 8D — Integracion MuJoCo Ant-v5 |
Fabrica, logistica, agricultura, astillero — cada dominio incluye un simulador Mock dedicado y adaptadores de datos.
| Manipulacion Movil | Estado 18D + Accion 8D — Modelo recomendado: ACT |
|---|---|
| AGV de Almacen (warehouse) | Estado 14D + Accion 4D — Modelo recomendado: BC-RNN |
| Robot Agricola (smart farm) | Estado 16D + Accion 6D — Modelo recomendado: Diffusion |
| Grua de Astillero (shipyard) | Estado 20D + Accion 9D — Modelo recomendado: ACT |
| BC-MLP / RNN / CNN | Clonacion de comportamiento basica, temporal y basada en vision |
|---|---|
| ACT | Action Chunking Transformer + CVAE (SOTA en manipulacion) |
| Diffusion Policy | Politica basada en modelo de difusion (DDPM) |
| SOTA (plugin) | BEVFuser (BEV multicamara), TemporalTransformer (estilo Tesla-FSD), WholeBodyACT (cabezas separadas loco/manip) |
| RL Actor NEW | RL off-policy FastTD3 (twin critic, n-step) — flujo RL→IL |
| L0 (Toy) | Simulador Mock + BC-MLP — para tutoriales/CI |
|---|---|
| L1 (Intermediate) | Modelo recomendado por dominio + Mock — investigacion de algoritmos |
| L2 (Advanced) | Backend real (CARLA / MuJoCo / HumanoidBench) + modelo SOTA |
Los dos primeros dominios que se lanzan. Incluyen modelos preentrenados en el paquete, de modo que pueden cargarse y ejecutarse al instante sin entrenamiento ni simulador. El resto de dominios se expanden secuencialmente como plugins.
Conduccion autonoma con fusion BEV multicamara. Se compone de BEVFuserPolicy + proyeccion BEV por IPM + controlador de waypoints PID, y se verifico en lazo cerrado con datos de 3 camaras de CARLA Town01.
bevfuser_lite_carla_town01.pt.Pipeline RL→IL completo. Con aprendizaje por refuerzo FastTD3 (RLTrainer) crea un experto, genera demostraciones y las destila en la politica de imitacion WholeBodyACT.
wholebodyact_locomanip.pt, rl_actor_walk.pt.※ Los 2 dominios de primer lanzamiento (automovil · humanoide) son de nivel investigacion con backends y datasets reales. Los otros 6 dominios se lanzan secuencialmente como plugins sobre el mismo esquema unificado.
Pipeline completo desde la generacion de datos sinteticos hasta el rollout en simulacion
Flujo de trabajo de datos completo por CLI: generacion de datos sinteticos, recopilacion de datos externos, aumento y edicion.
Ejecute las politicas aprendidas en simulacion y calcule metricas de evaluacion automaticamente.
Grupos de comandos para todo el flujo de trabajo (soporte --lang en 5 idiomas)
initGenera automaticamente la configuracion YAML a partir del rol/nivel.
trainEntrena politicas BC/IL. Soporta reanudacion, GPU, checkpoints y seguimiento de proyectos.
train-rl NEWEntrena una politica experta con aprendizaje por refuerzo FastTD3 (flujo RL→IL).
simrollout/replay — ejecuta y evalua politicas. Soporta --render / --save-video (MP4).
datapull, ingest, augment, edit, collect, generate-demos — pipeline de datos.
modelexport/load — Gestiona tarjetas de modelo (SafeTensors + config.json).
skillConsulta de habilidades integradas, inicializacion y transferencia entre dominios.
deployDespliega politicas con MessageBridge (mock/ROS2/ZeroMQ).
scenarioConstruccion de escenarios de casos extremos y ejecucion de suites.
validateValidacion de archivos de configuracion YAML (50+ reglas).
edgeGestion del ciclo de vida de aprendizaje en el edge — entrenamiento on-device, despliegue y monitoreo.
pluginGestion de Domain Plugins — registro, consulta e inicializacion de dominios personalizados.
Pila de abstraccion de 4 capas que separa roles, configuracion, aprendizaje y evaluacion
| Capa 4 | Skill/Meta-Agent — Recomendaciones basadas en roles/misiones |
|---|---|
| Capa 3 | Config/Validator — Manifiesto YAML + 50+ reglas de validacion |
| Capa 2 | Data/Model/Training — Pipeline, redes de politicas, BCTrainer |
| Capa 1 | Sim/Eval/Backend — Simulador, evaluacion, trayectorias |
| Domain Plugin | Registra dominios personalizados (esquema obs/action, simulador, adaptador) como plugins |
| Lenguaje | Python 3.11+ |
|---|---|
| Framework | PyTorch, Gymnasium |
| Simuladores | Mock (integrado), CARLA, MuJoCo |
| Registro | W&B, MLflow (opcional) |
| Formato de Modelo | SafeTensors + config.json |
| Formato de Errores | Formato de 3 lineas (Category / Fix / See) |
Aprenda EulerAtlas rapidamente con guias paso a paso
Tutoriales proximamente.
Instale EulerAtlas y entrene su primera politica
Python 3.11+, PyTorch
MuJoCo, W&B (opcional)
Desde automoviles hasta gruas de astillero, de demostraciones de expertos a politicas con 3 comandos CLI.
Comenzar en GitHub Contactenos