EulerAtlas

プラグインベースのロボット行動学習フレームワーク — 先行公開:自動車 · ヒューマノイド

模倣学習(IL)と FastTD3 強化学習(RL)を組み合わせた RL→IL パイプライン上で動作する、プラグインベースの CLI ロボット行動学習フレームワークです。最初に公開する 2 つのフラッグシップドメインは 自動車(EulerDrive)ヒューマノイド(EulerWalk)です — EulerDrive はマルチカメラ BEV 自動運転(CARLA Town01 クローズドループ検証)、EulerWalk はヒューマノイド RL→IL loco-manipulation ポリシーであり、両者とも事前学習モデルをパッケージに同梱しているため、学習・シミュレータなしですぐにロード・実行できます。統合 obs/action スキーマは自動車・ドローン・ヒューマノイド・ロボット犬・モバイルマニピュレーション・物流 AGV・農業ロボット・造船所クレーンなど 8 ドメインを網羅するよう設計されており、ドメインは Domain Plugin として独立デプロイされ、継続的に拡張されます。

Open Source · v0.5.0

コア機能

先行公開 2 ドメイン(自動車 · ヒューマノイド)+ プラグインで拡張する 8 ドメインスキーマ · 模倣学習 + FastTD3 強化学習 · SOTA ポリシーモデル

クラシックドメイン (01–04)

Internal Schema Boundary — ドメイン別固定次元スキーマで全モジュールが一貫して通信します。

自動車 (road) 4D状態 + 2D行動 — CARLA連携、nuScenesアダプター
ドローン (aerial) 6D状態 + 3D行動 — AirSimスケルトン
ヒューマノイド 33D状態 + 14D行動 (loco-manip) — MuJoCo Humanoid-v5 / HumanoidBench 連携
ロボット犬 (quadruped) 12D状態 + 8D行動 — MuJoCo Ant-v5連携

産業ドメイン (05–08)

工場、物流、農業、造船 — 各ドメイン専用Mockシミュレータとデータアダプターを含みます。

モバイルマニピュレーション 18D状態 + 8D行動 — 推奨モデル: ACT
倉庫AGV (warehouse) 14D状態 + 4D行動 — 推奨モデル: BC-RNN
スマートファーム農業ロボット 16D状態 + 6D行動 — 推奨モデル: Diffusion
造船所クレーン (shipyard) 20D状態 + 9D行動 — 推奨モデル: ACT

ポリシーモデル (コア 5 種 + SOTA + RL)

BC-MLP / RNN / CNN基本・時系列・ビジョンベースの行動クローニング
ACTAction Chunking Transformer + CVAE (マニピュレーション SOTA)
Diffusion Policy拡散モデルベースポリシー (DDPM)
SOTA (プラグイン)BEVFuser(マルチカメラ BEV)、TemporalTransformer(Tesla-FSD 型)、WholeBodyACT(loco/manip 分離ヘッド)
RL Actor NEWFastTD3 off-policy RL (twin critic, n-step) — RL→IL ワークフロー

複雑度レベル (L0–L2)

L0 (Toy)Mockシミュレータ + BC-MLP — チュートリアル/CI用
L1 (Intermediate)ドメイン推奨モデル + Mock — アルゴリズム研究
L2 (Advanced)実バックエンド (CARLA / MuJoCo / HumanoidBench) + SOTA モデル

先行公開フラッグシップ — EulerDrive(自動車)· EulerWalk(ヒューマノイド)

最初に公開する 2 つのドメイン。事前学習モデルをパッケージに同梱しているため、学習・シミュレータなしでロード・実行できます。残りのドメインはプラグインとして順次拡張されます。

EulerDrive (自動車)

マルチカメラ BEV 融合の自動運転。BEVFuserPolicy + IPM BEV 投影 + PID ウェイポイントコントローラで構成され、CARLA Town01 の 3 カメラデータでクローズドループ検証されています。

  • クローズドループ指標: RouteCompletion / InfractionScore / DrivingScore。
  • 検証結果: CARLA Town01 ウェイポイント損失 14.71 → 4.56 (69% 減少)。
  • 同梱モデル: bevfuser_lite_carla_town01.pt

EulerWalk (ヒューマノイド)

完全な RL→IL パイプライン。FastTD3 強化学習(RLTrainer)で専門家を作り、デモを生成したうえで WholeBodyACT 模倣ポリシーへ蒸留します。

  • 検証結果: RL リターン 406 → 418 → IL 損失 1.98e-4、安定したロールアウト。
  • 同梱モデル: wholebodyact_locomanip.ptrl_actor_walk.pt
  • スキーマ: ヒューマノイド 33D 状態 / 14D 行動 (loco-manipulation)。

※ 先行公開する 2 ドメイン(自動車 · ヒューマノイド)は実バックエンド・データセットに基づく研究級です。残りの 6 ドメインは同一の統合スキーマ上でプラグインとして順次公開されます。

データパイプライン & シミュレーション

合成データ生成からシミュレーションロールアウトまでの完全なパイプライン

データパイプライン

合成データ生成、外部データ収集、データ拡張、編集まで完全なデータワークフローをCLIで実行します。

  • Pull: 合成または実際の専門家デモンストレーションデータの生成/収集。
  • Ingest: JSONL/CSVを内部フォーマットに変換。
  • Augment: ノイズ、ミラーリング、時間ジッタなどのデータ拡張。
  • Edit: 統計確認、フィルタリング、マージ、分割。

シミュレーション & 評価

学習済みポリシーをシミュレーションで実行し、自動的に評価指標を算出します。

  • Mockシミュレータ: 8ドメイン専用内蔵シミュレータで即座に実行(依存なし)。
  • 実バックエンド: CARLA (自動車)、MuJoCo (ロボット)、AirSim/Isaac Lab (スケルトン)。
  • 並列シミュレーション: ParallelSimManagerでN個のインスタンスを同時実行。
  • シナリオスイート: コーナーケースシナリオのビルドとpass/failレポート。

CLI リファレンス

コマンドグループでワークフロー全体を実行します(--lang 5 言語対応)

init

ロール/レベルから YAML 設定を自動生成します。

train

BC/IL ポリシーを訓練します。再開、GPU、チェックポイント、プロジェクト追跡をサポート。

train-rl NEW

FastTD3 強化学習で専門家ポリシーを学習します (RL→IL ワークフロー)。

sim

rollout/replay — ポリシーの実行・評価。--render / --save-video(MP4) 対応。

data

pull, ingest, augment, edit, collect, generate-demos — データパイプライン。

model

export/load — モデルカード (SafeTensors + config.json) を管理します。

skill

内蔵スキルの照会、初期化、クロスドメイン転移を実行します。

deploy

MessageBridge (mock/ROS2/ZeroMQ) でポリシーをデプロイします。

scenario

コーナーケースシナリオのビルドとスイート実行。

validate

YAML 設定ファイルの検証 (50+ ルール)。

edge

エッジ学習ライフサイクル管理 — オンデバイス学習、デプロイ、モニタリング。

plugin

Domain Plugin 管理 — カスタムドメインの登録、照会、初期化。

アーキテクチャ

4層抽象化スタックでロール、設定、学習、評価を分離します

4 層スタック + Domain Plugin

Layer 4 Skill/Meta-Agent — ロール/ミッションベースの推薦
Layer 3 Config/Validator — YAML マニフェスト + 50+ 検証ルール
Layer 2 Data/Model/Training — パイプライン、ポリシーネットワーク、BCTrainer
Layer 1 Sim/Eval/Backend — シミュレータ、評価、軌跡
Domain Plugin カスタムドメイン(obs/action スキーマ、シミュレータ、アダプター)をプラグインとして登録

技術仕様

言語 Python 3.11+
フレームワーク PyTorch, Gymnasium
シミュレータ Mock (内蔵)、CARLA、MuJoCo
ロギング W&B, MLflow (オプション)
モデル形式 SafeTensors + config.json
エラー形式 3行フォーマット (Category / Fix / See)

チュートリアル

ステップバイステップのガイドでEulerAtlasをマスター

チュートリアルは近日公開予定です。

インストールと始め方

EulerAtlasをインストールして最初のポリシーを訓練

インストール

pip install -e ".[dev]"

# 3行で開始
euleratlas init --role road --level 0
euleratlas train -c config.yml
euleratlas sim rollout -c config.yml

要件

Python 3.11+, PyTorch

MuJoCo, W&B (オプション)

EulerAtlasで8ドメインのロボットポリシーを訓練

自動車から造船所クレーンまで、専門家デモからポリシーまで3行CLIで。

GitHubで始める お問い合わせ