プラグインベースのロボット行動学習フレームワーク — 先行公開:自動車 · ヒューマノイド
模倣学習(IL)と FastTD3 強化学習(RL)を組み合わせた RL→IL パイプライン上で動作する、プラグインベースの CLI ロボット行動学習フレームワークです。最初に公開する 2 つのフラッグシップドメインは 自動車(EulerDrive)と ヒューマノイド(EulerWalk)です — EulerDrive はマルチカメラ BEV 自動運転(CARLA Town01 クローズドループ検証)、EulerWalk はヒューマノイド RL→IL loco-manipulation ポリシーであり、両者とも事前学習モデルをパッケージに同梱しているため、学習・シミュレータなしですぐにロード・実行できます。統合 obs/action スキーマは自動車・ドローン・ヒューマノイド・ロボット犬・モバイルマニピュレーション・物流 AGV・農業ロボット・造船所クレーンなど 8 ドメインを網羅するよう設計されており、ドメインは Domain Plugin として独立デプロイされ、継続的に拡張されます。
Open Source · v0.5.0先行公開 2 ドメイン(自動車 · ヒューマノイド)+ プラグインで拡張する 8 ドメインスキーマ · 模倣学習 + FastTD3 強化学習 · SOTA ポリシーモデル
Internal Schema Boundary — ドメイン別固定次元スキーマで全モジュールが一貫して通信します。
| 自動車 (road) | 4D状態 + 2D行動 — CARLA連携、nuScenesアダプター |
|---|---|
| ドローン (aerial) | 6D状態 + 3D行動 — AirSimスケルトン |
| ヒューマノイド | 33D状態 + 14D行動 (loco-manip) — MuJoCo Humanoid-v5 / HumanoidBench 連携 |
| ロボット犬 (quadruped) | 12D状態 + 8D行動 — MuJoCo Ant-v5連携 |
工場、物流、農業、造船 — 各ドメイン専用Mockシミュレータとデータアダプターを含みます。
| モバイルマニピュレーション | 18D状態 + 8D行動 — 推奨モデル: ACT |
|---|---|
| 倉庫AGV (warehouse) | 14D状態 + 4D行動 — 推奨モデル: BC-RNN |
| スマートファーム農業ロボット | 16D状態 + 6D行動 — 推奨モデル: Diffusion |
| 造船所クレーン (shipyard) | 20D状態 + 9D行動 — 推奨モデル: ACT |
| BC-MLP / RNN / CNN | 基本・時系列・ビジョンベースの行動クローニング |
|---|---|
| ACT | Action Chunking Transformer + CVAE (マニピュレーション SOTA) |
| Diffusion Policy | 拡散モデルベースポリシー (DDPM) |
| SOTA (プラグイン) | BEVFuser(マルチカメラ BEV)、TemporalTransformer(Tesla-FSD 型)、WholeBodyACT(loco/manip 分離ヘッド) |
| RL Actor NEW | FastTD3 off-policy RL (twin critic, n-step) — RL→IL ワークフロー |
| L0 (Toy) | Mockシミュレータ + BC-MLP — チュートリアル/CI用 |
|---|---|
| L1 (Intermediate) | ドメイン推奨モデル + Mock — アルゴリズム研究 |
| L2 (Advanced) | 実バックエンド (CARLA / MuJoCo / HumanoidBench) + SOTA モデル |
最初に公開する 2 つのドメイン。事前学習モデルをパッケージに同梱しているため、学習・シミュレータなしでロード・実行できます。残りのドメインはプラグインとして順次拡張されます。
マルチカメラ BEV 融合の自動運転。BEVFuserPolicy + IPM BEV 投影 + PID ウェイポイントコントローラで構成され、CARLA Town01 の 3 カメラデータでクローズドループ検証されています。
bevfuser_lite_carla_town01.pt。完全な RL→IL パイプライン。FastTD3 強化学習(RLTrainer)で専門家を作り、デモを生成したうえで WholeBodyACT 模倣ポリシーへ蒸留します。
wholebodyact_locomanip.pt、rl_actor_walk.pt。※ 先行公開する 2 ドメイン(自動車 · ヒューマノイド)は実バックエンド・データセットに基づく研究級です。残りの 6 ドメインは同一の統合スキーマ上でプラグインとして順次公開されます。
合成データ生成からシミュレーションロールアウトまでの完全なパイプライン
合成データ生成、外部データ収集、データ拡張、編集まで完全なデータワークフローをCLIで実行します。
学習済みポリシーをシミュレーションで実行し、自動的に評価指標を算出します。
コマンドグループでワークフロー全体を実行します(--lang 5 言語対応)
initロール/レベルから YAML 設定を自動生成します。
trainBC/IL ポリシーを訓練します。再開、GPU、チェックポイント、プロジェクト追跡をサポート。
train-rl NEWFastTD3 強化学習で専門家ポリシーを学習します (RL→IL ワークフロー)。
simrollout/replay — ポリシーの実行・評価。--render / --save-video(MP4) 対応。
datapull, ingest, augment, edit, collect, generate-demos — データパイプライン。
modelexport/load — モデルカード (SafeTensors + config.json) を管理します。
skill内蔵スキルの照会、初期化、クロスドメイン転移を実行します。
deployMessageBridge (mock/ROS2/ZeroMQ) でポリシーをデプロイします。
scenarioコーナーケースシナリオのビルドとスイート実行。
validateYAML 設定ファイルの検証 (50+ ルール)。
edgeエッジ学習ライフサイクル管理 — オンデバイス学習、デプロイ、モニタリング。
pluginDomain Plugin 管理 — カスタムドメインの登録、照会、初期化。
4層抽象化スタックでロール、設定、学習、評価を分離します
| Layer 4 | Skill/Meta-Agent — ロール/ミッションベースの推薦 |
|---|---|
| Layer 3 | Config/Validator — YAML マニフェスト + 50+ 検証ルール |
| Layer 2 | Data/Model/Training — パイプライン、ポリシーネットワーク、BCTrainer |
| Layer 1 | Sim/Eval/Backend — シミュレータ、評価、軌跡 |
| Domain Plugin | カスタムドメイン(obs/action スキーマ、シミュレータ、アダプター)をプラグインとして登録 |
| 言語 | Python 3.11+ |
|---|---|
| フレームワーク | PyTorch, Gymnasium |
| シミュレータ | Mock (内蔵)、CARLA、MuJoCo |
| ロギング | W&B, MLflow (オプション) |
| モデル形式 | SafeTensors + config.json |
| エラー形式 | 3行フォーマット (Category / Fix / See) |
ステップバイステップのガイドでEulerAtlasをマスター
チュートリアルは近日公開予定です。
EulerAtlasをインストールして最初のポリシーを訓練
Python 3.11+, PyTorch
MuJoCo, W&B (オプション)