[학습] Karpathy LLM Wiki 패턴
TL;DR
LLM을 검색 도구가 아닌 지식 유지보수 담당자로 쓴다. 사람이 소스를 큐레이션하고 방향을 잡으면, LLM이 관련 페이지 10-15개를 동시에 업데이트한다. 대화가 사라지지 않고 지식으로 남는다.
출처: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
핵심 개념
기존 RAG(검색-보강-생성)와의 차이:
- RAG: 질문할 때마다 소스를 검색 → 일회성
- LLM Wiki: persistent, compounding artifact — 쌓일수록 강해짐. cross-reference가 이미 내재화됨
“The wiki stays maintained because the cost of maintenance is near zero.” 사람은 지루해서 포기하는 북마크 정리를 LLM은 지치지 않고 한다.
3계층 구조
Layer 1: Raw Sources (불변 원본)
- 아티클, 논문, 이미지 등 curated 입력 문서
- LLM이 읽기만 하고 수정하지 않음
Layer 2: The Wiki (LLM 관리 마크다운)
- 개념 페이지, 엔티티 요약, cross-reference
- LLM이 전적으로 소유하고 유지보수
Layer 3: Schema Document (CLAUDE.md 등)
- Wiki 구조, 컨벤션, 워크플로우 정의
- LLM을 “범용 챗봇”이 아닌 “체계적 유지관리자”로 만드는 장치
핵심 Operations
Ingest (소스 추가)
- 소스 읽기
- 관련 기존 페이지 10-15개 업데이트 (새 파일 생성보다 기존 업데이트 우선)
- log.md에 이력 기록
- 사용자가 강조할 부분 안내
Query (질문)
- 위키 페이지 탐색
- 인용과 함께 답변 합성
- 가치 있는 통찰 → 위키 페이지로 영속화 (핵심)
Lint (건강 체크)
- 모순 감지
- stale 클레임 탐지
- orphan 페이지 발견
- 누락된 cross-reference 제안
- 새 조사 주제 제안
인덱싱 & 네비게이션
index.md
- 모든 페이지의 한 줄 요약 카탈로그
- 카테고리별 정리
- Ingest마다 LLM이 업데이트
log.md
- append-only 인제스트 이력
[날짜] ingested: X → updated Y, Z 페이지- Unix 툴로 파싱 가능한 타임라인
왜 작동하는가
LLM의 강점: - 15개 파일을 한 번에 업데이트 가능 (사람은 못함) - 지루해하지 않음 - 일관성 유지를 잊지 않음
Vannevar Bush의 Memex(1945) 개념의 실현: - “개인화된 큐레이션 지식 + 연상적 연결” - Bush가 해결 못 한 “누가 유지보수하나” 문제를 LLM이 해결
커뮤니티가 발견한 함정
| 문제 | 설명 | 해결 방향 |
|---|---|---|
| Duplicate | 같은 개념이 다른 이름으로 추출됨 | 병합 워크플로우 |
| Flat hierarchy | 중요도 구분 없는 페이지 나열 | 멀티 티어 메모리 구조 |
| Relationship collapse | 링크가 “related” 하나로 축소 | 관계 타입 명시 (contains / contradicts / similar) |
우리 시스템 현황 (2026-05-20 기준)
✅ 구현 완료
| Karpathy 패턴 | 우리 구현 | 티켓 |
|---|---|---|
| Schema Document | CLAUDE.md auto memory 섹션 | — |
| Ingest (Update-before-create) | HAN-28 | Done |
| MEMORY.md 섹션화 (index.md 역할) | HAN-23 | Done |
| Cross-reference (See also) | HAN-29 | Done |
| Lint 0단계 (/wrap-up stale 체크) | HAN-27 | Done |
| Raw Sources 수집 | Karpathy Twitter 모니터링, HAN-48 | Done |
🔲 진행 중 / 계획
| Karpathy 패턴 | 우리 계획 | 티켓 |
|---|---|---|
| The Wiki 콘텐츠 축적 | hangman-docs/learning/ 적극 사용 | HAN-116~120 |
| index.html | learning/index.html | HAN-119 Urgent |
| Query → Wiki 피드백 루프 | 대화 결과 위키화 | HAN-126 Urgent |
| log.md | 인제스트 이력 | HAN-30 Backlog |
| Lint 고도화 | 중복 감지 + 클러스터링 | HAN-127/129 High |
| Relationship typing | See also 타입 구분 | HAN-128 High |
| Obsidian Graph View | 지식 시각화 | HAN-131 High |
| Web Clipper | URL → learning/ 자동 저장 | HAN-130 High |
| Spaced repetition 알림 | 복습 날짜 Slack 알림 | HAN-125 Urgent |
❌ 가장 큰 갭
Query → Wiki 피드백 루프가 없음 — 지금은 대화가 사라짐. HAN-126이 핵심.
참고
- source: Karpathy LLM Wiki Gist https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
- extends: 픽셀이 텍스트보다 나은 LLM 입력
- related: Thariq HTML 문서 효과성