대규모 병렬 프로세서 프로그래밍

GPU와 CUDA로 시작해서, 병렬 알고리즘 패턴, 성능 최적화, 그리고 클러스터 스케일까지. 23개 챕터를 따라가면 SM, 워프, 코얼레싱 같은 단어가 더 이상 외계어로 들리지 않게 됩니다.

총 챕터

23 챕터

언어

한국어 + CUDA C/C++

선수 지식

C/C++ 기본기

실행 환경

정적 HTML, 서버 불필요

읽는 순서 안내

왼쪽 사이드바에서 챕터를 클릭하세요. 키보드 ↑/↓ 또는 j/k로도 이동할 수 있어요. 네 파트로 나뉘어 있고, 처음 읽는 분이라면 1→6번까지 순서대로 보시는 걸 추천드려요.

왜 병렬이어야 하는지부터, CUDA C로 첫 커널을 띄우고, GPU 안에서 스레드가 어떻게 줄지어 일하는지, 메모리 계층을 어떻게 활용해 성능을 끌어올리는지까지. 가장 중요한 토대.

컨볼루션, 스텐실, 히스토그램, 리덕션, 스캔, 머지. 이 여섯 가지는 거의 모든 병렬 알고리즘의 골격이에요. 하나씩 익히면 새로운 문제도 패턴 조합으로 보이기 시작합니다.

정렬, 희소 행렬, 그래프 탐색, 딥러닝, 의료 영상, 분자 시뮬레이션. 진짜 문제에서 패턴들이 어떻게 합쳐지는지 보고, 마지막엔 “컴퓨테이셔널 씽킹” 자체를 정리.

여러 GPU/노드로 확장하는 MPI+CUDA, 커널이 커널을 부르는 동적 병렬성, 통합 메모리 같은 최신 기능, 그리고 마무리.

읽는 팁

코드는 가능한 한 노트북·콜랩 같은 곳에 옮겨서 직접 돌려보세요. 한 번 nvprof/Nsight로 들여다본 커널은 평생 안 잊혀집니다.

※ 본 자료는 교육 목적으로 작성된 원본 한국어 학습 노트입니다. 표준 GPU/병렬 컴퓨팅 커리큘럼의 토픽을 따라가지만 모든 설명·예제·비유는 저자(어시스턴트) 본인이 새로 쓴 것입니다.