휴머노이드 제어에서는 특정 하나의 표준 용어만 쓰이기보다는, 여러 계열의 AI/제어 패러다임이 병행됩니다. 다만 업계/연구에서 자주 쓰는 핵심 용어들을 구조적으로 정리해보면 다음과 같습니다.
로봇 제어 파운데이션 모델
1) End-to-End 계열 (최근 트렌드)
(1) VLA (Vision-Language-Action)
- 멀티모달 입력 → 행동 출력
- 대표:
- RT-2 (Google)
- PaLM-E
👉 휴머노이드 적용:
- “물건 집어”, “문 열어” 같은 고수준 명령 → 바로 행동 생성
(2) Generalist Policy / Foundation Model for Robotics
- 하나의 모델이 여러 작업 수행
- 대규모 데이터 기반
다른 표현:
- Robot Foundation Model
- Generalist Robot Policy
👉 핵심:
“하나의 모델로 다양한 태스크 처리”
(3) Behavior Cloning (BC)
- 인간/시연 데이터를 그대로 학습
- imitation learning
👉 특징:
- 구현 쉬움
- 일반화는 제한적
2) Reinforcement Learning (강화학습 계열)
(4) RL Policy / Control Policy
- 상태 → 행동을 결정하는 정책 π(a|s)
대표 알고리즘
- PPO (가장 많이 쓰임)
- SAC
- DDPG
👉 휴머노이드에서:
- 걷기 (locomotion)
- 균형 유지 (balance)
- 조작 (manipulation)
(5) Hierarchical RL (HRL)
- 고수준 + 저수준 분리
예:
- High-level: “걸어서 문까지 이동”
- Low-level: “각 관절 제어”
👉 휴머노이드에서 매우 중요
3) Control + Model 기반 접근
(6) MPC (Model Predictive Control)
- 미래 상태 예측 기반 최적 제어
👉 특징:
- 안정성 높음
- 물리 기반
(7) Whole-Body Control (WBC)
- 휴머노이드 핵심 용어
역할:
- 모든 관절을 동시에 제어
- 균형 + 접촉 + 힘 제어
👉 예:
- 서기, 걷기, 물건 들기
4) Planning + Reasoning 계열
(8) Task and Motion Planning (TAMP)
- 작업 계획 + 물리 움직임 결합
👉 예:
- “컵 잡고 → 테이블로 이동 → 내려놓기”
(9) World Model
- 환경을 내부적으로 모델링
👉 최근 트렌드:
- latent space dynamics
- simulation-free planning
5) 실제 시스템 구조 (중요)
휴머노이드는 보통 하나의 모델로 안 끝남:
[Language / Task Model]
↓
[High-level Planner]
↓
[Policy (RL / VLA / BC)]
↓
[Whole Body Controller (WBC)]
↓
[Actuators]
👉 즉:
AI 모델 + 전통 제어가 계층적으로 결합
6) 핵심 용어 요약 (실무에서 많이 쓰는 것)
휴머노이드 맥락에서 가장 중요한 키워드:
- Policy (π)
- Locomotion Policy
- Manipulation Policy
- Whole-Body Control (WBC)
- MPC
- Behavior Cloning (BC)
- Reinforcement Learning (RL)
- VLA / Robot Foundation Model
7) 한 줄 정리
휴머노이드 제어 AI는 특정 단일 용어가 아니라
Policy + Control + Planning을 결합한 계층형 시스템으로 부른다.