learning jarvis draft 2026-05-20

[학습] Karpathy LLM Wiki 패턴

TL;DR

LLM을 검색 도구가 아닌 지식 유지보수 담당자로 쓴다. 사람이 소스를 큐레이션하고 방향을 잡으면, LLM이 관련 페이지 10-15개를 동시에 업데이트한다. 대화가 사라지지 않고 지식으로 남는다.

출처: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

핵심 개념

기존 RAG(검색-보강-생성)와의 차이:

RAG: 질문할 때마다 소스를 검색 → 일회성
LLM Wiki: persistent, compounding artifact — 쌓일수록 강해짐. cross-reference가 이미 내재화됨

“The wiki stays maintained because the cost of maintenance is near zero.” 사람은 지루해서 포기하는 북마크 정리를 LLM은 지치지 않고 한다.

3계층 구조

Layer 1: Raw Sources (불변 원본)

아티클, 논문, 이미지 등 curated 입력 문서
LLM이 읽기만 하고 수정하지 않음

Layer 2: The Wiki (LLM 관리 마크다운)

개념 페이지, 엔티티 요약, cross-reference
LLM이 전적으로 소유하고 유지보수

Layer 3: Schema Document (CLAUDE.md 등)

Wiki 구조, 컨벤션, 워크플로우 정의
LLM을 “범용 챗봇”이 아닌 “체계적 유지관리자”로 만드는 장치

핵심 Operations

Ingest (소스 추가)

소스 읽기
관련 기존 페이지 10-15개 업데이트 (새 파일 생성보다 기존 업데이트 우선)
log.md에 이력 기록
사용자가 강조할 부분 안내

Query (질문)

위키 페이지 탐색
인용과 함께 답변 합성
가치 있는 통찰 → 위키 페이지로 영속화 (핵심)

Lint (건강 체크)

모순 감지
stale 클레임 탐지
orphan 페이지 발견
누락된 cross-reference 제안
새 조사 주제 제안

인덱싱 & 네비게이션

index.md

모든 페이지의 한 줄 요약 카탈로그
카테고리별 정리
Ingest마다 LLM이 업데이트

log.md

append-only 인제스트 이력
[날짜] ingested: X → updated Y, Z 페이지
Unix 툴로 파싱 가능한 타임라인

왜 작동하는가

LLM의 강점: - 15개 파일을 한 번에 업데이트 가능 (사람은 못함) - 지루해하지 않음 - 일관성 유지를 잊지 않음

Vannevar Bush의 Memex(1945) 개념의 실현: - “개인화된 큐레이션 지식 + 연상적 연결” - Bush가 해결 못 한 “누가 유지보수하나” 문제를 LLM이 해결

커뮤니티가 발견한 함정

문제	설명	해결 방향
Duplicate	같은 개념이 다른 이름으로 추출됨	병합 워크플로우
Flat hierarchy	중요도 구분 없는 페이지 나열	멀티 티어 메모리 구조
Relationship collapse	링크가 “related” 하나로 축소	관계 타입 명시 (contains / contradicts / similar)

우리 시스템 현황 (2026-05-20 기준)

✅ 구현 완료

Karpathy 패턴	우리 구현	티켓
Schema Document	CLAUDE.md auto memory 섹션	—
Ingest (Update-before-create)	HAN-28	Done
MEMORY.md 섹션화 (index.md 역할)	HAN-23	Done
Cross-reference (See also)	HAN-29	Done
Lint 0단계 (/wrap-up stale 체크)	HAN-27	Done
Raw Sources 수집	Karpathy Twitter 모니터링, HAN-48	Done

🔲 진행 중 / 계획

Karpathy 패턴	우리 계획	티켓
The Wiki 콘텐츠 축적	hangman-docs/learning/ 적극 사용	HAN-116~120
index.html	learning/index.html	HAN-119 Urgent
Query → Wiki 피드백 루프	대화 결과 위키화	HAN-126 Urgent
log.md	인제스트 이력	HAN-30 Backlog
Lint 고도화	중복 감지 + 클러스터링	HAN-127/129 High
Relationship typing	See also 타입 구분	HAN-128 High
Obsidian Graph View	지식 시각화	HAN-131 High
Web Clipper	URL → learning/ 자동 저장	HAN-130 High
Spaced repetition 알림	복습 날짜 Slack 알림	HAN-125 Urgent

❌ 가장 큰 갭

Query → Wiki 피드백 루프가 없음 — 지금은 대화가 사라짐. HAN-126이 핵심.

참고

source: Karpathy LLM Wiki Gist https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
extends: 픽셀이 텍스트보다 나은 LLM 입력
related: Thariq HTML 문서 효과성