research jini final 2026-06-07

[리서치] 오픈 웨이트 1주일 정리 — Victor Mustar 큐레이션 (2026-06-05)

TL;DR

원문 출처:
- 큐레이션: https://x.com/victormustar/status/2063017894221591008 (paywall — Jarvis 요약 기반 복원)
- 공개 자료 보강: HuggingFace blog, NVIDIA dev blog, 모델 카드


이 문서의 한계 (먼저 짚고)


한 주의 4축 요약

축 1 — 다중모달 통합 (Gemma 4) [확인]

축 2 — 코딩 특화 (JetBrains Mellum 2) [확인]

축 3 — 하이브리드 + 장컨텍스트 (NVIDIA Nemotron 3 Super) [추정 — Jarvis 요약의 "Mamba-MoE 하이브리드 1M" 항목에 가장 부합]

축 4 — 거대 MoE + 1M 컨텍스트 (DeepSeek V4) [추정 — 같은 주 릴리스, 큐레이션 포함 가능성 높음]


그래서 무엇을 봐야 하나 (4축 → 결정 질문)

  1. 온디바이스 후보: Mellum 2 2.5B active + MLX/ONNX 배포. 항승님 IronCoach iPhone hybrid 검토에 Haiku 대안 카드로 한 번 평가해볼 만하다. → 단, 코딩 도메인 특화라 일반 대화 품질은 별도 측정 필요.
  2. 장컨텍스트 평가: Pantheon RAG 작업이 진행 중이라 Nemotron 3의 1M RULER 91.8 수치가 baseline 후보. local 호스팅은 비현실적이지만, 벤치마크 비교 기준으로는 유효.
  3. trillion-scale은 우리 워크플로우엔 추론 비용 측면에서 관전 모드. API로 들어왔을 때 가격 비교만.
  4. Gemma 4 12B Unified멀티모달 데모용으로 한 번 돌려볼 가치. encoder-free라 파이프라인이 단순.

검증 질문 (다음 액션)


참고