강의 21

위계 정리

자원을 더 주면 정말 더 많은 일을 할 수 있는가에 대한 명백한 답, 그리고 그 한계

1. 자명해 보이지만 자명하지 않은 질문

"자원을 두 배로 늘려 주면 풀 수 있는 문제가 정말로 늘어날까?" 이 질문에 1초도 망설이지 않고 "그럼"이라 답하고 싶지만, 형식적으로 따지자면 그리 단순하지 않다. 시간 n²로는 풀 수 없는데 n³로는 풀리는 문제가 진짜 있어야 자원의 의미가 살아난다. 그런 문제가 존재한다는 것을 어떻게 보일까?

이 강의에서 만날 위계 정리(hierarchy theorem)들은 그 답이다. 시간을 늘리면 정말로 새로운 언어가 결정 가능해지고, 공간을 늘리면 정말로 새로운 언어가 인식 가능해진다. 다만 "얼마나 늘려야 하는가"의 양적 조건이 달려 있고, 함수가 적당히 잘 행동해야 한다.

정의 21.1 (시간/공간 구성 가능 함수). 함수 f: ℕ → ℕ가 시간 구성 가능(time-constructible)하다는 것은, 입력 1ⁿ에서 f(n)을 이진수로 출력하는 결정적 TM이 시간 O(f(n))에 존재함을 뜻한다(보통 f(n) ≥ n도 가정). 비슷하게 f가 공간 구성 가능(space-constructible)하다는 것은 f(n) ≥ log n이고 입력 1ⁿ에 대해 f(n)을 공간 O(f(n))으로 계산할 수 있는 TM이 있다는 것이다.

일상에서 만나는 거의 모든 "정상적인" 함수 — n², n log n, 2ⁿ 등 — 는 두 종류 모두에 들어간다. 구성 가능성은 시뮬레이터가 시계나 자처럼 자원 한도를 셀 수 있어야 한다는 기술적 요청이다.

2. 시간 위계 정리

정리 21.2 (시간 위계 정리). f, g: ℕ → ℕ가 시간 구성 가능하고 f(n) log f(n) = o(g(n))이라 하자. 그러면

TIME(f(n)) ⊊ TIME(g(n)).

"f를 한 단계 키워 g로 가면, 진짜로 더 많은 언어를 결정할 수 있다"는 정확한 형태다. 왜 단순히 f(n) = o(g(n))이 아니라 f(n) log f(n)이 끼어드는지가 증명에서 자연스럽게 드러난다. 보편 시뮬레이터가 어떤 TM을 흉내 낼 때 log 인자만큼의 오버헤드가 든다는 사실이 그 출처다.

3. 증명의 핵심: 대각선화

증명의 도구는 칸토어가 실수의 비가산성을 보일 때 쓴 것과 본질이 같은 대각선화다. 우리는 g(n) 시간에는 결정 가능하지만 어떤 f(n)-시간 TM도 결정할 수 없는 언어를 손수 만든다.

다음 TM D를 정의하자. 입력 ⟨M⟩ — TM M의 인코딩 — 에 대해

입력 길이 n을 보고 g(n)을 시간 구성 가능성을 이용해 카운터에 적어 둔다.
M을 입력 ⟨M⟩ 위에 시뮬레이션하되, g(n) 시간이 지나기 전까지만 돌린다. 시계가 만료되면 시뮬레이션을 중단.
시간 안에 M이 멈췄고 받아들였다면 D는 거부; 멈췄고 거부했다면 D는 받아들임; 시간이 만료되었다면 거부.

핵심 두 사실.

사실 1. D는 시간 O(g(n))에 동작한다. 보편 시뮬레이션의 log 오버헤드 때문에 M의 한 단계가 시뮬레이션 시 O(log f(n)) 시간이 들어, 전체 비용이 O(f(n) log f(n)) ≤ O(g(n))으로 묶인다 — 정확히 정리의 가정 f log f = o(g)가 여기서 쓰인다.

사실 2. D를 결정하는 어떤 f(n)-시간 TM M₀도 존재하지 않는다. 만약 존재한다면, 충분히 큰 n에서 M₀의 동작이 g(n) 시간 안에 끝나도록 할 수 있다(f log f = o(g)). 입력 ⟨M₀⟩(또는 같은 언어를 결정하는 충분히 긴 인코딩)을 D에 넣으면, D의 정의에 의해 D(⟨M₀⟩) = ¬M₀(⟨M₀⟩). 그러나 M₀이 D를 결정한다면 D(⟨M₀⟩) = M₀(⟨M₀⟩). 모순. □

이름의 유래. D는 자기 자신과 동치인 인코딩에서 다른 답을 내도록 강제된다. "대각선 위에서 부정"이라는 칸토어의 트릭과 동일하다. 다만 칸토어는 가능한 함수의 집합 위에서, 우리는 가능한 TM의 집합 위에서. 같은 논증이 자원 한계라는 새로운 제약 아래에서 다시 빛난다는 점이 이 분야의 즐거움이다. 그리고 정직히 말해, 대각선화는 한 번 익히면 평생 써먹는다.

4. 공간 위계 정리

정리 21.3 (공간 위계 정리). f, g가 공간 구성 가능하고 f(n) = o(g(n))이라 하자(둘 다 ≥ log n). 그러면

SPACE(f(n)) ⊊ SPACE(g(n)).

시간 위계와 비교하면 조건이 깔끔하다. 그저 f(n) = o(g(n))이면 충분하고, log 오버헤드가 없다. 이유는 단순. 공간은 재사용이 자유로운 자원이라 공간 시뮬레이션의 오버헤드는 상수배에 그친다. 한 셀을 천 번 다시 쓰든 자원이 늘지 않는다. 시간은 그렇지 않다. 한 단계는 한 번이고, 시뮬레이터의 내부 데이터구조 검색에 log가 자연스레 따라붙는다.

공간 위계의 증명도 같은 골격이다. g(n) 공간 시계를 들고 ⟨M⟩ 위에서 M을 시뮬레이션하다가 공간을 초과하면 멈춘다. 결과를 뒤집어 출력. 마찬가지로 어떤 f(n)-공간 기계도 이 언어를 결정할 수 없다. 한 가지 추가 주의는 공간 한계 시뮬레이션에서 무한 루프를 피하기 위해 형태 수가 2^O(g(n))로 한정됨을 이용해 시계도 함께 도는 것 — 같은 형태가 두 번 나오면 정지로 간주.

5. 따름정리: 강력한 분리

위계 정리들은 추상적으로 보일 수 있으나, 곧장 구체적인 클래스 분리로 이어진다.

따름정리 21.4. P ⊊ EXPTIME.

증명. P = ⋃_k TIME(n^k) ⊆ TIME(2ⁿ) ⊆ EXPTIME = ⋃_k TIME(2^{n^k}). 시간 위계 정리로 TIME(2ⁿ) ⊊ TIME(2²ⁿ) ⊆ EXPTIME. 따라서 P ⊊ EXPTIME. □

따름정리 21.5. PSPACE ⊊ EXPSPACE.

이 두 분리는 직관적으로는 "그야 당연히 그렇겠지" 싶지만, 형식적인 증명을 위해서는 위계 정리의 대각선화가 반드시 필요하다는 사실을 짚어 두고 싶다. 추가로, P와 EXPTIME 사이를 채우는 클래스들 — NP, PSPACE — 가운데 어딘가에 진짜 ⊊가 일어난다는 것은 알지만, 어디인지는 모른다.

예 21.6. EXPTIME-완전 문제는 P에 들어가지 않는다. 만약 들어간다면 P = EXPTIME이 되어 위 따름정리에 모순. 그래서 EXPTIME-완전이라는 라벨은 "다항 시간으로는 절대 풀 수 없다"는 강력한 증명을 동반한다 — NP-완전이 누리지 못하는 형식적 자격이다.

6. 한계: 위계 정리로 풀리지 않는 것

위계 정리는 같은 자원 종류 안에서 양적 차이가 클 때만 분리를 보장한다. 여기서 자연스럽게 떠오르는 한계들.

자원 종류가 다르면 직접 적용 불가. P와 NP는 모두 다항 시간이지만, 비결정성이라는 정성적 차이를 가진다. 위계 정리는 결정적 시간 안에서의 양적 분리, 비결정적 시간 안에서의 양적 분리만 직접 말해 준다. 두 종류의 시간을 가로지르는 분리는 다른 도구가 필요하다 — 그리고 그 도구가 아직 없다.

같은 종류 안에서도 격차가 작으면 무력. P vs PSPACE는 양쪽이 모두 결정적이지만, P는 다항 시간을, PSPACE는 다항 공간을 다룬다. 다항 시간 ⇒ 다항 공간이지만 그 역은 미해결. 시간과 공간을 잇는 위계는 별도의 미해결 영역이다.

릴라티비제이션 장벽. 60년대 후반 Baker–Gill–Solovay는 oracle A를 잘 골라 P^A = NP^A를 만들 수도, P^B ≠ NP^B를 만들 수도 있음을 보였다. 위계 정리의 대각선화는 oracle 아래에서도 그대로 작동한다(시뮬레이션이 oracle을 그대로 통과). 따라서 P vs NP는 단순한 대각선화 논증으로는 풀 수 없다는 강력한 신호. 이것이 relativization barrier다. P와 NP 사이의 진짜 분리(혹은 등식)는 더 정교한 도구가 필요하다는 메시지로 받아들여진다.

위계 정리의 위치. 위계 정리는 복잡도 이론의 가장 단단한 기초석 중 하나다. 시간/공간이라는 자원이 진짜 의미를 가지며, 자원이 늘면 능력이 정말 늘어난다는 사실의 보증서. 그 위에 P, NP, PSPACE, EXPTIME 같은 큰 클래스가 쌓이고, 클래스 사이의 미해결 관계가 우리의 지적 지평을 정의한다. 위계 정리만으로는 P ≠ NP를 풀 수 없다는 그 한계가, 사실 우리가 어디서 더 깊이 파야 하는지를 말해 주는 안내판인 셈이다.

7. 마무리

이 강의에서는 자원의 의미를 정량적으로 굳혔다. 시간을 한 단계 늘리면 (log 인자를 감안하고) 진짜로 새 언어가 풀리고, 공간도 마찬가지다. 그 결과 P ⊊ EXPTIME, PSPACE ⊊ EXPSPACE 같은 가장 자연스러운 분리가 안전하게 손에 들어왔다. 동시에, P vs NP, P vs PSPACE 같은 작은 격차의 클래스 분리는 위계 정리의 손이 닿지 않는 영역임을 확인했다.

다음 강의 다리. 같은 자원 종류 안의 양적 분리에서 한 발 떼어, 환원의 구조와 전체 풍경을 한 번 더 정리하자. 다항 위계, 교대 튜링 기계, 회로 복잡도 — 다음 단계의 도구들이 그 풍경을 더 선명히 그려 줄 것이다.