플러그인 기반 로봇 행동 학습 프레임워크 — 우선 공개: 자동차 · 휴머노이드
모방학습(IL)과 FastTD3 강화학습(RL)을 결합한 RL→IL 파이프라인 위에서 동작하는 플러그인 기반 CLI 로봇 행동 학습 프레임워크입니다. 가장 먼저 공개하는 두 플래그십 도메인은 자동차(EulerDrive)와 휴머노이드(EulerWalk)입니다 — EulerDrive는 멀티카메라 BEV 자율주행(CARLA Town01 클로즈드루프 검증), EulerWalk는 휴머노이드 RL→IL loco-manipulation 정책으로, 둘 다 사전학습 모델을 패키지에 동봉해 학습·시뮬레이터 없이 바로 로드·실행할 수 있습니다. 통합 obs/action 스키마는 자동차·드론·휴머노이드·로봇개·모바일 매니퓰레이션·물류 AGV·농업 로봇·조선소 크레인 등 8개 도메인을 포괄하도록 설계되었고, 도메인은 Domain Plugin으로 독립 배포·계속 확장됩니다.
Open Source · v0.5.0우선 공개 2개 도메인(자동차·휴머노이드) + 플러그인으로 확장하는 8개 도메인 스키마 · 모방학습 + FastTD3 강화학습 · SOTA 정책 모델
Internal Schema Boundary — 도메인별 고정 차원 스키마로 모든 모듈이 일관되게 소통합니다.
| 자동차 (road) | 4D 상태 + 2D 행동 — CARLA 연동, nuScenes 어댑터 |
|---|---|
| 드론 (aerial) | 6D 상태 + 3D 행동 — AirSim 스켈레톤 |
| 휴머노이드 | 33D 상태 + 14D 행동 (loco-manip) — MuJoCo Humanoid-v5 / HumanoidBench 연동 |
| 로봇개 (quadruped) | 12D 상태 + 8D 행동 — MuJoCo Ant-v5 연동 |
공장, 물류, 농업, 조선 — 각 도메인 전용 Mock 시뮬레이터와 데이터 어댑터를 포함합니다.
| 모바일 매니퓰레이션 | 18D 상태 + 8D 행동 — 추천 모델: ACT |
|---|---|
| 물류 AGV (warehouse) | 14D 상태 + 4D 행동 — 추천 모델: BC-RNN |
| 스마트팜 농업 로봇 | 16D 상태 + 6D 행동 — 추천 모델: Diffusion |
| 조선소 크레인 (shipyard) | 20D 상태 + 9D 행동 — 추천 모델: ACT |
| BC-MLP / RNN / CNN | 기본·시계열·비전 기반 행동 복제 |
|---|---|
| ACT | Action Chunking Transformer + CVAE (매니퓰레이션 SOTA) |
| Diffusion Policy | 확산 모델 기반 정책 (DDPM) |
| SOTA (플러그인) | BEVFuser(멀티카메라 BEV), TemporalTransformer(Tesla-FSD형), WholeBodyACT(loco/manip 분리 헤드) |
| RL Actor NEW | FastTD3 off-policy RL (twin critic, n-step) — RL→IL 워크플로우 |
| L0 (Toy) | Mock 시뮬레이터 + BC-MLP — 튜토리얼/CI용 |
|---|---|
| L1 (Intermediate) | 도메인 추천 모델 + Mock — 알고리즘 연구 |
| L2 (Advanced) | 실제 백엔드 (CARLA / MuJoCo / HumanoidBench) + SOTA 모델 |
가장 먼저 공개하는 두 도메인. 사전학습 모델을 패키지에 동봉해 학습·시뮬레이터 없이 바로 로드·실행할 수 있습니다. 나머지 도메인은 플러그인으로 순차 확장됩니다.
멀티카메라 BEV 융합 자율주행. BEVFuserPolicy + IPM BEV 투영 + PID 웨이포인트 컨트롤러로 구성되며, CARLA Town01 3카메라 데이터에서 클로즈드루프로 검증되었습니다.
bevfuser_lite_carla_town01.pt.완전한 RL→IL 파이프라인. FastTD3 강화학습(RLTrainer)으로 전문가를 만들고, 시연을 생성한 뒤 WholeBodyACT 모방 정책으로 증류합니다.
wholebodyact_locomanip.pt, rl_actor_walk.pt.※ 우선 공개하는 2개 도메인(자동차·휴머노이드)은 실제 백엔드·데이터셋 기반 연구급입니다. 나머지 6개 도메인은 동일한 통합 스키마 위에서 플러그인으로 순차 공개됩니다.
합성 데이터 생성부터 시뮬레이션 롤아웃까지 전체 파이프라인
합성 데이터 생성, 외부 데이터 수집, 증강, 편집까지 완전한 데이터 워크플로우를 CLI로 수행합니다.
학습된 정책을 시뮬레이션에서 실행하고, 자동으로 평가 지표를 산출합니다.
커맨드 그룹으로 전체 워크플로우를 수행합니다 (--lang 5개 언어 지원)
init역할/레벨에서 YAML 설정을 자동 생성합니다.
trainBC/IL 정책을 훈련합니다. 이어하기, GPU, 체크포인트, 프로젝트 추적 지원.
train-rl NEWFastTD3 강화학습으로 전문가 정책을 학습합니다 (RL→IL 워크플로우).
simrollout/replay — 정책 실행·평가. --render / --save-video(MP4) 지원.
datapull, ingest, augment, edit, collect, generate-demos — 데이터 파이프라인.
modelexport/load — 모델 카드(SafeTensors + config.json)를 관리합니다.
skill내장 스킬 조회, 초기화, 크로스 도메인 전이를 수행합니다.
deployMessageBridge(mock/ROS2/ZeroMQ)로 정책을 배포합니다.
scenario코너 케이스 시나리오 빌드 및 스위트 실행.
validateYAML 설정 파일 검증 (50+ 규칙).
edge엣지 학습 라이프사이클 관리 — 온디바이스 학습, 배포, 모니터링.
pluginDomain Plugin 관리 — 커스텀 도메인 등록, 조회, 초기화.
4계층 추상화 스택으로 역할, 설정, 학습, 평가를 분리합니다
| Layer 4 | Skill/Meta-Agent — 역할/미션 기반 추천 |
|---|---|
| Layer 3 | Config/Validator — YAML 매니페스트 + 50+ 검증 규칙 |
| Layer 2 | Data/Model/Training — 파이프라인, 정책 네트워크, BCTrainer |
| Layer 1 | Sim/Eval/Backend — 시뮬레이터, 평가, 궤적 |
| Domain Plugin | 커스텀 도메인(obs/action 스키마, 시뮬레이터, 어댑터)을 플러그인으로 등록 |
| 언어 | Python 3.11+ |
|---|---|
| 프레임워크 | PyTorch, Gymnasium |
| 시뮬레이터 | Mock (내장), CARLA, MuJoCo |
| 로깅 | W&B, MLflow (선택) |
| 모델 포맷 | SafeTensors + config.json |
| 에러 포맷 | 3줄 포맷 (Category / Fix / See) |
단계별 가이드로 EulerAtlas를 빠르게 익히세요
튜토리얼은 공개 예정입니다.
EulerAtlas를 설치하고 첫 번째 정책을 훈련하세요
Python 3.11+, PyTorch
MuJoCo, W&B (선택)