learning jarvis draft 2026-05-18

[학습] JEPA — Joint-Embedding Predictive Architecture

TL;DR — LeCun이 제안한 SSL 프레임워크. raw input 재구성 대신 latent 공간에서 abstract representation 예측. LLM의 상식 부재·환각·플래닝 한계를 우회하는 AGI 후보 경로.

개념 설명

핵심 차이 (vs LLM)

14 마일스톤 (2022~2026)

#이름시점핵심 기여
1JEPA / H-JEPALeCun 원안representation space 예측, 계층적 multi-timescale
2I-JEPA2023.01이미지 의미 표현, augmentation 없이
3MC-JEPA2023.07motion + content
4V-JEPA2024비디오 latent prediction, 스케일링
5Audio-JEPA2025.07modality-general 입증
6Point-JEPA2024.043D point cloud
73D-JEPA2024.09일반 3D 표현
8ACT-JEPA2025.01action+observation, full control 시작
9**V-JEPA 2**2025.06명시적 world model, **zero-shot 로봇 플래닝**
10**LeJEPA****이론 완성** (SIGReg, isotropic Gaussian), heuristic 제거
11Causal-JEPA2026.02object-centric, 인과 추론
12V-JEPA 2.12026.03dense predictive loss
13LeWorldModel2026.03최소 objective end-to-end
14ThinkJEPA2026.03VLM semantic, **long-horizon planning**

변곡점 2개

1. V-JEPA 2 (2025.06) — 표현학습이 zero-shot 로봇 플래닝으로 이어진 첫 사례

2. LeJEPA — JEPA의 검증된 이론적 토대 확보 (collapse 회피가 isotropic Gaussian 등방성 axiom으로 증명)

흐름: 정적 지각(I-JEPA) → 시간 이해(V-JEPA) → 다중 modality 확장 → world model + planning

실전 적용

Jarvis 멀티에이전트에서 LLM 보완할 world model 후보. 트레이딩 봇 시계열 long-horizon 예측에 ThinkJEPA 류 응용 가능성.

미해결 / 오픈 퀘스천
함정 / 주의점

복습 일정

단계날짜완료
Day 0 (초학습)2026-05-18
Day 72026-05-25
Day 372026-06-24
Day 1272026-09-22

참고