Eulerwa Inc.는 모델 학습부터 하드웨어 가속, 자율 에이전트까지 — AI 개발의 모든 단계를 CLI와 오픈소스로 공개합니다.
학습의 EulerForge, 모델 설계의 EulerStack, 데이터의 EulerWeave, 실행의 EulerAgent, 하드웨어의 EulerNPU, 로봇 학습의 EulerAtlas.
HuggingFace 모델에 LoRA를 주입하고, Dense 모델을 Mixture LoRA · MoE Expert LoRA 구조로 전환해 훈련할 수 있는 연구 지향 LLM 파인튜닝 프레임워크입니다. Dense SFT 중심의 일반적인 파인튜닝 흐름에 Dense → MoE 변환과 Phase 스케줄링을 얹어, 라우팅·전문가 특화·MoE 안정성을 작은 GPU 예산에서도 재현 가능하게 실험할 수 있도록 설계했습니다. YAML 프리셋 한 장으로 SFT → DPO/ORPO → RM → PPO까지 이어갑니다.
Dense 모델을 MoE 구조로 바꿔 실험하는 과정을 표준화된 설정으로 다룰 수 있도록 구성했습니다. 실험을 코드 변경이 아닌 YAML 설정으로 관리할 수 있습니다.
mixture_lora / moe_expert_lora 한 줄로 MoE 실험 시작| 인젝션 전략 | Dense LoRA · Mixture LoRA · MoE Expert LoRA · Native MoE Expert LoRA |
|---|---|
| 훈련 타입 | SFT · DPO · ORPO · RM · PPO |
| 지원 백본 | Qwen2/3 · Llama 2/3 · Gemma 3 · Gemma 4 (dense+MoE) · Mixtral |
| 양자화 훈련 | nf4 / int4 / int8 (bitsandbytes) |
| 부가 기능 | HF Export · Optuna 기반 Grid/Bayes 탐색 · 통합 벤치마크 · 5개 언어 CLI |
24편 KO/EN 튜토리얼 + 상세 CLI 레퍼런스 기본 제공
EulerStack은 LLM을 위한 아키텍처 기술 언어(Architecture Description Language)입니다. 구조·학습·서빙이 뒤엉킨 파이썬 모델 파일에서 "아키텍처"만 분리해 전용 선언형 언어로 표현합니다 — 반도체 업계가 schematics+C를 Verilog/VHDL로 바꾼 추상화와 같은 방향입니다. YAML 스펙 한 장이 5계층 파이프라인(DSL → Schema → IR → Compiler → CLI)을 거쳐 HuggingFace PreTrainedModel(config.json + model.safetensors)로 산출되고, EulerForge가 바로 읽어 학습합니다.
v1 "산업 정렬 원칙"에 따라 검증된 산업 표준 → 최근 하이브리드/MoE → v1 실험 프리미티브 순으로 정리되어 있습니다: llm_ 24개(5 스케일 × 4–5 변형, MLA 포함) + arch_ 33개(beginner 2 · intermediate 3 · advanced 5 · expert 23, 그중 *_mini 9개). MLA·MoD·Titans·Dual-Stream 등 Phase B 프리미티브를 arch-스케일로 실험할 수 있습니다.
| 믹서 | Attention · Mamba · RetNet · Hyena |
|---|---|
| FFN | MLP · Gated MLP (SwiGLU) · MoE (top-k 라우팅) |
| 스킬 레벨 워크스루 | beginner(GPT-2/Llama) · intermediate(Mistral/Gemma2/Qwen) · advanced(Jamba/Samba/RetNet) · expert(MoE × 믹서 × depth/receptive-field 3D 설계공간) |
| 컴파일 타겟 | HuggingFace 모델 디렉토리 또는 JSON 런타임 설정 |
스키마 구조 검증 → 교차 필드 호환성 → 리얼리즘 휴리스틱의 3단계 검증으로 설계 오류를 컴파일 전에 잡습니다. 모든 CLI 메시지는 5개 언어(ko/en/zh/ja/es)로 지원됩니다. v0.1.5는 μP 스케일링·분화 보조목적·tissue 조직 선언을 backward-compatible 스펙 확장으로 추가했습니다(기존 YAML 무수정 호환).
연구자와 개발자가 로컬 환경에서 데이터를 정제하고 분석하도록 설계되었습니다.
단일 GPU에서 클러스터 단위로 확장하기 위한 비즈니스 핵심 기능입니다.
8단계 상태 머신(RUN_CREATED → CONTEXT → PLAN → PROPOSE → APPROVE → EXECUTE → RESULT → FINALIZED), Pattern/Graph 오케스트레이터, RAG 파이프라인, 장기 기억(SQLite), MCP 통합, 플러그인 시스템, 30+ CLI 명령, 65개 픽스처를 갖춘 로컬 우선(Local-first) 에이전트 프레임워크입니다. 검증을 LLM이 아닌 코드로 실행하는 결정론적 게이트 노드(kind: shell) 위에 스스로 작성·테스트·수정하는 자가수리 코딩 에이전트(code.dev_loop.v2)를 제공합니다.
에이전트의 모든 행동은 8단계 상태 머신을 거쳐 인간 승인(HITL) 후 실행됩니다. Pattern Orchestrator(YAML 기반 12개 정규 패턴 + LLM·판정·결정론적 shell 게이트 노드)와 Graph Orchestrator(LangGraph 병렬 실행)로 복잡한 워크플로우를 제어합니다. 경계 내 자동 승인(node.auto_approve)과 심볼 게이트(symbol_check)로 fix→test 루프를 자율 실행합니다.
통제력과 보안을 포기하지 않으면서 자율적 기능을 원하는 개발자를 위해 구축되었습니다.
연산자 그래프(spec.yaml)를 138개 연산자(17개 그룹)로 구성하고, 검증 및 컴파일(.npuart)을 거쳐 호스트 CPU 레퍼런스, 기능 NPU 시뮬레이터, Zynq-7000(XC7Z020)·Zynq UltraScale+(ZU3EG/ZU9EG) FPGA에서 실행하는 NPU 추론 합성 스택입니다. INT4/INT8 양자화, 10종 dtype, 4개 백엔드, 15개 CLI 서브커맨드를 제공합니다. 휴머노이드 브레인 SoC(Project 3)가 시뮬레이션되는 데모를 제품 페이지에서 확인하세요.
자세히 보기138개 연산자(17개 그룹, A–Q), 10종 dtype을 지원하며, spec.yaml에서 .npuart 아티팩트로 컴파일합니다.
| 연산자 | 138개 (Core Math, Activation, Normalization, Conv/Vision, Sequence/Attention, Efficient Attention(Flash/Sliding/GQA), MoE/Sparse, Recurrent, Graph, Multimodal, Vision Encoder, Diffusion, Speculative Decoding, Quantization, Mamba/SSM, Cache Compress, Autonomy) |
|---|---|
| DType | fp32, int32, fp16, bf16, int8, uint8, int16, int4, fp8_e4m3, fp8_e5m2 — INT4 가중치 양자화 지원 |
| 타겟 | Zynq-7000 (XC7Z020) · Zynq UltraScale+ (ZU3EG, ZU9EG) FPGA |
validate, compile, run, sim, profile, explain, quantize, migrate-spec, generate, board smoke, calibrate, benchmark, replay, compress-cache 등 15개 서브커맨드. 백엔드: cpu_ref · npu_sim · zynq_ps · zynq_pl_stub.
모방학습(IL)과 FastTD3 강화학습(RL)을 결합한 RL→IL 파이프라인 위에서 동작하는 플러그인 기반 CLI 로봇 행동 학습 프레임워크입니다. 가장 먼저 공개하는 두 플래그십 도메인은 자동차(EulerDrive — BEV 자율주행, CARLA 검증)와 휴머노이드(EulerWalk — RL→IL loco-manipulation)이며, 두 도메인 모두 사전학습 모델을 동봉해 학습 없이 바로 실행할 수 있습니다. 통합 스키마는 자동차·드론·휴머노이드·로봇개·모바일 매니퓰레이션·물류·농업·조선 등 8개 도메인을 포괄하도록 설계되었고, 도메인은 플러그인으로 계속 확장됩니다.
자세히 보기도메인별 고정 차원 obs/action 스키마로 모든 모듈이 일관되게 소통합니다.
| 클래식 (01–04) | 자동차 4/2 · 드론 6/3 · 휴머노이드 33/14 (loco-manip) · 로봇개 12/8 |
|---|---|
| 산업 (05–08) | 모바일 매니퓰레이션 18/8 · 물류 AGV 14/4 · 농업 로봇 16/6 · 조선소 20/9 |
| 정책 모델 | BC-MLP, BC-RNN, BC-CNN, ACT, Diffusion Policy + SOTA(BEVFuser, TemporalTransformer, WholeBodyACT) + RL Actor |
| 레벨 | L0 Toy · L1 Intermediate · L2 Advanced (실제 백엔드: CARLA/MuJoCo/HumanoidBench) |
train-rl, data collect/generate-demos, sim rollout --render/--save-video 추가. Domain Plugin 아키텍처와 엣지 배포까지 지원합니다.
전문 기술 서적 및 오픈 소스 생태계에 접근하세요.
데이터 처리 및 모델 오케스트레이션을 위한 커뮤니티 도구입니다.
기술은 인간을 위해 존재합니다
우리는 인공지능의 군사적 자동화에 반대합니다. 기술은 생명을 빼앗는 데가 아니라 지키는 데 쓰여야 하며, 어떤 기술적 성취도 인간의 안전보다 앞설 수 없습니다.
인공지능은 인간의 존엄을 높이고 민주적 가치를 강화하는 도구여야 합니다. 우리는 AI가 개인의 자유를 억압하거나 민주적 원리를 훼손하는 어떤 목적으로든 활용되는 것에 반대합니다.
오일러와가 공개하는 모든 소프트웨어, 모델, 서비스는 위 원칙에 반하는 용도로 사용할 수 없습니다. 우리는 기술의 쓰임에 대한 책임을 진지하게 받아들입니다.