[학습] Karpathy LLM Wiki 패턴
TL;DR
LLM을 검색 도구가 아닌 지식 유지보수 담당자로 쓴다. 사람이 소스를 큐레이션하고 방향을 잡으면, LLM이 관련 페이지 10-15개를 동시에 업데이트한다. 대화가 사라지지 않고 지식으로 남는다.
출처: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
---
핵심 개념
기존 RAG(검색-보강-생성)와의 차이:
- RAG: 질문할 때마다 소스를 검색 → 일회성
- LLM Wiki: **persistent, compounding artifact** — 쌓일수록 강해짐. cross-reference가 이미 내재화됨
> "The wiki stays maintained because the cost of maintenance is near zero."
> 사람은 지루해서 포기하는 북마크 정리를 LLM은 지치지 않고 한다.
---
3계층 구조
Layer 1: Raw Sources (불변 원본)
- 아티클, 논문, 이미지 등 curated 입력 문서
- LLM이 읽기만 하고 수정하지 않음
Layer 2: The Wiki (LLM 관리 마크다운)
- 개념 페이지, 엔티티 요약, cross-reference
- LLM이 전적으로 소유하고 유지보수
Layer 3: Schema Document (CLAUDE.md 등)
- Wiki 구조, 컨벤션, 워크플로우 정의
- LLM을 "범용 챗봇"이 아닌 "체계적 유지관리자"로 만드는 장치
---
핵심 Operations
Ingest (소스 추가)
1. 소스 읽기
2. 관련 기존 페이지 10-15개 업데이트 (새 파일 생성보다 기존 업데이트 우선)
3. log.md에 이력 기록
4. 사용자가 강조할 부분 안내
Query (질문)
1. 위키 페이지 탐색
2. 인용과 함께 답변 합성
3. 가치 있는 통찰 → 위키 페이지로 영속화 (핵심)
Lint (건강 체크)
- 모순 감지
- stale 클레임 탐지
- orphan 페이지 발견
- 누락된 cross-reference 제안
- 새 조사 주제 제안
---
인덱싱 & 네비게이션
index.md
- 모든 페이지의 한 줄 요약 카탈로그
- 카테고리별 정리
- Ingest마다 LLM이 업데이트
log.md
- append-only 인제스트 이력
[날짜] ingested: X → updated Y, Z 페이지- Unix 툴로 파싱 가능한 타임라인
---
왜 작동하는가
LLM의 강점:
- **15개 파일을 한 번에 업데이트** 가능 (사람은 못함)
- 지루해하지 않음
- 일관성 유지를 잊지 않음
Vannevar Bush의 Memex(1945) 개념의 실현:
- "개인화된 큐레이션 지식 + 연상적 연결"
- Bush가 해결 못 한 "누가 유지보수하나" 문제를 LLM이 해결
---
커뮤니티가 발견한 함정
| 문제 | 설명 | 해결 방향 |
|---|---|---|
| **Duplicate** | 같은 개념이 다른 이름으로 추출됨 | 병합 워크플로우 |
| **Flat hierarchy** | 중요도 구분 없는 페이지 나열 | 멀티 티어 메모리 구조 |
| **Relationship collapse** | 링크가 "related" 하나로 축소 | 관계 타입 명시 (contains / contradicts / similar) |
---
우리 시스템 현황 (2026-05-20 기준)
✅ 구현 완료
| Karpathy 패턴 | 우리 구현 | 티켓 |
|---|---|---|
| Schema Document | CLAUDE.md auto memory 섹션 | — |
| Ingest (Update-before-create) | HAN-28 | Done |
| MEMORY.md 섹션화 (index.md 역할) | HAN-23 | Done |
| Cross-reference (See also) | HAN-29 | Done |
| Lint 0단계 (/wrap-up stale 체크) | HAN-27 | Done |
| Raw Sources 수집 | Karpathy Twitter 모니터링, HAN-48 | Done |
🔲 진행 중 / 계획
| Karpathy 패턴 | 우리 계획 | 티켓 |
|---|---|---|
| The Wiki 콘텐츠 축적 | hangman-docs/learning/ 적극 사용 | HAN-116~120 |
| index.html | learning/index.html | HAN-119 Urgent |
| Query → Wiki 피드백 루프 | 대화 결과 위키화 | HAN-126 Urgent |
| log.md | 인제스트 이력 | HAN-30 Backlog |
| Lint 고도화 | 중복 감지 + 클러스터링 | HAN-127/129 High |
| Relationship typing | See also 타입 구분 | HAN-128 High |
| Obsidian Graph View | 지식 시각화 | HAN-131 High |
| Web Clipper | URL → learning/ 자동 저장 | HAN-130 High |
| Spaced repetition 알림 | 복습 날짜 Slack 알림 | HAN-125 Urgent |
❌ 가장 큰 갭
Query → Wiki 피드백 루프가 없음 — 지금은 대화가 사라짐. HAN-126이 핵심.
---
참고
- source: Karpathy LLM Wiki Gist https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
- extends: [픽셀이 텍스트보다 나은 LLM 입력](2026-05-20-pixels-as-llm-input.md)
- related: [Thariq HTML 문서 효과성](../research/2026-05-20-claude-code-tools-and-html-docs.md)