| Tier | 주제 | 권 | p/권 |
|---|---|---|---|
| T1 | HW & ISA 실리콘→instruction | V01~V04 | 15~20 |
| T2 | Kernel 패턴 알고리즘→GPU | V05~V08 | 15~22 |
| T3 | 수치 bit→양자화 | V09~V10 | 14~18 |
| T4 | Compiler source→PTX | V11~V14 | 18~24 |
| T5 | 분산/서빙 multi-GPU→engine | V15~V17 | 18~22 |
| T6 | 방법론 프로파일링 | V18 | 14~16 |
V01 (PMPP)
│
┌────┼──────────────┐
▼ ▼ ▼
V02 V05 V09
(HW) (prim) (numerics)
│ │ │
▼ │ ▼
V03 │ V10
(PTX) │ (quant)
│ │
▼ │
V04 │
(Hop) │
│ │
└──┬─┘
▼
V06 → V07 → V08
GEMM attn LLM
│ │ │
└──┬──┴─────┘
▼
V11→V12→V13→V14
Triton MLIR Ind XLA/TVM
│
└→ V15 (분산)
│
├→ V16 (infer)
└→ V17 (train)
V18 — 모든 권 뒤에
| 기존 | 18권 내 매핑 |
|---|---|
pmpponebook.html17p | V01이 확장 대체 |
cudalearning_단권화_v2.html20p | V02/V03/V04/V06/V07/V11/V15/V18에 분산 |
기존 두 권은 "프론티어 스냅샷"으로 보존.