QA 컴퓨터구조 심화

컴퓨터구조 심화

빠른 컴퓨터를 감으로 만들지 않고, 숫자로 밀어붙이는 법

성능 튜닝은 “느낌상 빠름”을 “몇 배, 몇 와트, 몇 달러”로 바꾸는 일입니다.

이 노트는 어떤 포지션인가요?

이 페이지는 Hennessy와 Patterson의 Computer Architecture: A Quantitative Approach 흐름을 따라가되, 원문을 그대로 옮기지 않고 한국어 학습용으로 다시 설명한 심화 해설 노트입니다. 입문 컴퓨터구조가 “CPU가 명령어를 어떻게 실행하나”를 묻는다면, 여기서는 한 발 더 나가서 “그 설계가 진짜 빠른가, 전기는 얼마나 먹는가, 비용 대비 성능은 어떤가”를 묻습니다.

말투는 기존 컴퓨터 구조 노트처럼 조금 가볍게 잡았습니다. 숫자는 진지하게 보고, 설명은 숨 좀 쉬면서 갑니다. 아키텍처가 회의록처럼 굳어지면 읽는 사람도 캐시 미스 납니다.

챕터 선택

1장은 반드시 먼저 읽는 편이 좋습니다. 나머지는 관심사대로 들어가도 되지만, 메모리 계층을 먼저 잡아두면 ILP, DLP, TLP가 훨씬 덜 휘청입니다.

Chapter 1

정량 설계와 분석

성능 공식, 벤치마크, 암달의 법칙, 전력/에너지, 신뢰성을 숫자로 다룹니다.

읽기
Chapter 2

메모리 계층 설계

AMAT, 캐시 미스, 프리패치, 블로킹, TLB까지 빠른 척의 기술을 봅니다.

읽기
Chapter 3

명령어 수준 병렬성

파이프라인, 동적 스케줄링, 리네이밍, 분기 예측과 추측 실행을 다룹니다.

읽기
Chapter 4

데이터 수준 병렬성

벡터, SIMD, GPU, 워프 발산, coalescing, 루프라인 모델로 계산 덩어리를 봅니다.

읽기
Chapter 5

스레드 수준 병렬성

멀티코어, 동기화, 캐시 일관성, 메모리 일관성과 false sharing을 정리합니다.

읽기
Chapter 6

창고 규모 컴퓨터

데이터센터를 하나의 컴퓨터처럼 보고 tail latency, 전력, 비용, 장애를 다룹니다.

읽기

읽는 순서 추천

  1. 1장에서 성능을 숫자로 말하는 습관을 잡습니다.
  2. 2장에서 메모리 병목 감각을 챙깁니다. 대부분의 성능 드라마는 여기서 시작합니다.
  3. 3-5장은 병렬성 3종 세트입니다. 한 코어, 많은 데이터, 많은 스레드 순서로 보세요.
  4. 6장은 관점을 칩 밖으로 확장합니다. 건물 하나가 컴퓨터가 되는 순간입니다.
한 줄 안내

이 심화 트랙의 주문은 하나입니다. “어디가 병목인가?” 이 질문을 계속 들고 다니면, 성능 그래프가 갑자기 덜 무섭고 조금 더 수다스러워집니다.