EulerAtlas

プラグインベースのロボット行動学習フレームワーク — 先行公開：自動車 · ヒューマノイド

模倣学習（IL）と FastTD3 強化学習（RL）を組み合わせた RL→IL パイプライン上で動作する、プラグインベースの CLI ロボット行動学習フレームワークです。最初に公開する 2 つのフラッグシップドメインは 自動車（EulerDrive）と ヒューマノイド（EulerWalk）です — EulerDrive はマルチカメラ BEV 自動運転（CARLA Town01 クローズドループ検証）、EulerWalk はヒューマノイド RL→IL loco-manipulation ポリシーであり、両者とも事前学習モデルをパッケージに同梱しているため、学習・シミュレータなしですぐにロード・実行できます。統合 obs/action スキーマは自動車・ドローン・ヒューマノイド・ロボット犬・モバイルマニピュレーション・物流 AGV・農業ロボット・造船所クレーンなど 8 ドメインを網羅するよう設計されており、ドメインは Domain Plugin として独立デプロイされ、継続的に拡張されます。

Open Source · v0.5.0

コア機能

先行公開 2 ドメイン（自動車 · ヒューマノイド）+ プラグインで拡張する 8 ドメインスキーマ · 模倣学習 + FastTD3 強化学習 · SOTA ポリシーモデル

クラシックドメイン (01–04)

Internal Schema Boundary — ドメイン別固定次元スキーマで全モジュールが一貫して通信します。

自動車 (road)	4D状態 + 2D行動 — CARLA連携、nuScenesアダプター
ドローン (aerial)	6D状態 + 3D行動 — AirSimスケルトン
ヒューマノイド	33D状態 + 14D行動 (loco-manip) — MuJoCo Humanoid-v5 / HumanoidBench 連携
ロボット犬 (quadruped)	12D状態 + 8D行動 — MuJoCo Ant-v5連携

産業ドメイン (05–08)

工場、物流、農業、造船 — 各ドメイン専用Mockシミュレータとデータアダプターを含みます。

モバイルマニピュレーション	18D状態 + 8D行動 — 推奨モデル: ACT
倉庫AGV (warehouse)	14D状態 + 4D行動 — 推奨モデル: BC-RNN
スマートファーム農業ロボット	16D状態 + 6D行動 — 推奨モデル: Diffusion
造船所クレーン (shipyard)	20D状態 + 9D行動 — 推奨モデル: ACT

ポリシーモデル (コア 5 種 + SOTA + RL)

BC-MLP / RNN / CNN	基本・時系列・ビジョンベースの行動クローニング
ACT	Action Chunking Transformer + CVAE (マニピュレーション SOTA)
Diffusion Policy	拡散モデルベースポリシー (DDPM)
SOTA (プラグイン)	BEVFuser(マルチカメラ BEV)、TemporalTransformer(Tesla-FSD 型)、WholeBodyACT(loco/manip 分離ヘッド)
RL Actor NEW	FastTD3 off-policy RL (twin critic, n-step) — RL→IL ワークフロー

複雑度レベル (L0–L2)

L0 (Toy)	Mockシミュレータ + BC-MLP — チュートリアル/CI用
L1 (Intermediate)	ドメイン推奨モデル + Mock — アルゴリズム研究
L2 (Advanced)	実バックエンド (CARLA / MuJoCo / HumanoidBench) + SOTA モデル

先行公開フラッグシップ — EulerDrive（自動車）· EulerWalk（ヒューマノイド）

最初に公開する 2 つのドメイン。事前学習モデルをパッケージに同梱しているため、学習・シミュレータなしでロード・実行できます。残りのドメインはプラグインとして順次拡張されます。

EulerDrive (自動車)

マルチカメラ BEV 融合の自動運転。BEVFuserPolicy + IPM BEV 投影 + PID ウェイポイントコントローラで構成され、CARLA Town01 の 3 カメラデータでクローズドループ検証されています。

クローズドループ指標: RouteCompletion / InfractionScore / DrivingScore。
検証結果: CARLA Town01 ウェイポイント損失 14.71 → 4.56 (69% 減少)。
同梱モデル: bevfuser_lite_carla_town01.pt。

EulerWalk (ヒューマノイド)

完全な RL→IL パイプライン。FastTD3 強化学習（RLTrainer）で専門家を作り、デモを生成したうえで WholeBodyACT 模倣ポリシーへ蒸留します。

検証結果: RL リターン 406 → 418 → IL 損失 1.98e-4、安定したロールアウト。
同梱モデル: wholebodyact_locomanip.pt、rl_actor_walk.pt。
スキーマ: ヒューマノイド 33D 状態 / 14D 行動 (loco-manipulation)。

※ 先行公開する 2 ドメイン（自動車 · ヒューマノイド）は実バックエンド・データセットに基づく研究級です。残りの 6 ドメインは同一の統合スキーマ上でプラグインとして順次公開されます。

データパイプライン & シミュレーション

合成データ生成からシミュレーションロールアウトまでの完全なパイプライン

データパイプライン

合成データ生成、外部データ収集、データ拡張、編集まで完全なデータワークフローをCLIで実行します。

Pull: 合成または実際の専門家デモンストレーションデータの生成/収集。
Ingest: JSONL/CSVを内部フォーマットに変換。
Augment: ノイズ、ミラーリング、時間ジッタなどのデータ拡張。
Edit: 統計確認、フィルタリング、マージ、分割。

シミュレーション & 評価

学習済みポリシーをシミュレーションで実行し、自動的に評価指標を算出します。

Mockシミュレータ: 8ドメイン専用内蔵シミュレータで即座に実行（依存なし）。
実バックエンド: CARLA (自動車)、MuJoCo (ロボット)、AirSim/Isaac Lab (スケルトン)。
並列シミュレーション: ParallelSimManagerでN個のインスタンスを同時実行。
シナリオスイート: コーナーケースシナリオのビルドとpass/failレポート。

CLI リファレンス

コマンドグループでワークフロー全体を実行します（--lang 5 言語対応）

`init`

ロール/レベルから YAML 設定を自動生成します。

`train`

BC/IL ポリシーを訓練します。再開、GPU、チェックポイント、プロジェクト追跡をサポート。

`train-rl` NEW

FastTD3 強化学習で専門家ポリシーを学習します (RL→IL ワークフロー)。

`sim`

rollout/replay — ポリシーの実行・評価。--render / --save-video(MP4) 対応。

`data`

pull, ingest, augment, edit, collect, generate-demos — データパイプライン。

`model`

export/load — モデルカード (SafeTensors + config.json) を管理します。

`skill`

内蔵スキルの照会、初期化、クロスドメイン転移を実行します。

`deploy`

MessageBridge (mock/ROS2/ZeroMQ) でポリシーをデプロイします。

`scenario`

コーナーケースシナリオのビルドとスイート実行。

`validate`

YAML 設定ファイルの検証 (50+ ルール)。

`edge`

エッジ学習ライフサイクル管理 — オンデバイス学習、デプロイ、モニタリング。

`plugin`

Domain Plugin 管理 — カスタムドメインの登録、照会、初期化。

アーキテクチャ

4層抽象化スタックでロール、設定、学習、評価を分離します

4 層スタック + Domain Plugin

Layer 4	Skill/Meta-Agent — ロール/ミッションベースの推薦
Layer 3	Config/Validator — YAML マニフェスト + 50+ 検証ルール
Layer 2	Data/Model/Training — パイプライン、ポリシーネットワーク、BCTrainer
Layer 1	Sim/Eval/Backend — シミュレータ、評価、軌跡
Domain Plugin	カスタムドメイン(obs/action スキーマ、シミュレータ、アダプター)をプラグインとして登録

技術仕様

言語	Python 3.11+
フレームワーク	PyTorch, Gymnasium
シミュレータ	Mock (内蔵)、CARLA、MuJoCo
ロギング	W&B, MLflow (オプション)
モデル形式	SafeTensors + config.json
エラー形式	3行フォーマット (Category / Fix / See)

EulerAtlas

コア機能

クラシックドメイン (01–04)

産業ドメイン (05–08)

ポリシーモデル (コア 5 種 + SOTA + RL)

複雑度レベル (L0–L2)

先行公開フラッグシップ — EulerDrive（自動車）· EulerWalk（ヒューマノイド）

EulerDrive (自動車)

EulerWalk (ヒューマノイド)

データパイプライン & シミュレーション

データパイプライン

シミュレーション & 評価

CLI リファレンス

`init`

`train`

`train-rl` NEW

`sim`

`data`

`model`

`skill`

`deploy`

`scenario`

`validate`

`edge`

`plugin`

アーキテクチャ

4 層スタック + Domain Plugin

技術仕様

チュートリアル

インストールと始め方

インストール

要件

GitHub

EulerAtlasで8ドメインのロボットポリシーを訓練

EulerAtlas

コア機能

クラシックドメイン (01–04)

産業ドメイン (05–08)

ポリシーモデル (コア 5 種 + SOTA + RL)

複雑度レベル (L0–L2)

先行公開フラッグシップ — EulerDrive（自動車）· EulerWalk（ヒューマノイド）

EulerDrive (自動車)

EulerWalk (ヒューマノイド)

データパイプライン & シミュレーション

データパイプライン

シミュレーション & 評価

CLI リファレンス

init

train

train-rl NEW

sim

data

model

skill

deploy

scenario

validate

edge

plugin

アーキテクチャ

4 層スタック + Domain Plugin

技術仕様

チュートリアル

インストールと始め方

インストール

要件

GitHub

EulerAtlasで8ドメインのロボットポリシーを訓練

`init`

`train`

`train-rl` NEW

`sim`

`data`

`model`

`skill`

`deploy`

`scenario`

`validate`

`edge`

`plugin`