콘텐츠로 이동

Appendix B: 선형대수와 Hilbert 공간의 기초

이전까지의 줄거리:

부록 A 에서는 복소수의 사칙연산·극형식·Euler의 공식·복소켤레 등 양자역학에서 불가결한 복소수의 기초를 정리했다. 본 Appendix에서는 그 복소수를 "성분"으로 갖는 벡터와 행렬의 세계——선형대수——를 구축하고, 양자역학의 무대인 Hilbert 공간으로 연결한다.

이 Appendix의 목표:

  • 양자역학의 수학적 언어인 선형대수를 고등학교 "벡터"·"행렬"의 연장선상에서 이해한다
  • 벡터 공간·내적·정규직교기저·선형 연산자·고유값 문제·에르미트 행렬·유니터리 행렬·텐서곱을 일통 다루고, 무한차원 Hilbert 공간으로의 확장에서 무엇이 달라지는지 파악한다
  • 이것들은 양자역학의 "문법"이며, 상태·관측량·시간 발전·복합계의 모든 것이 여기서 정비하는 도구로 기술된다

B.1 벡터 공간——"덧셈"과 "상수배"가 가능하면 무엇이든 벡터

🟡 리나: 고등학교에서는 "화살표"가 벡터였지요. 하지만 양자역학에서는 훨씬 넓은 의미로 벡터를 사용해요. 우선 "벡터 공간이란 무엇인가"를 가능한 한 구체적으로 정의해 볼게요.

🔵 카이: 화살표가 아닌 벡터라니 무슨 뜻이에요?

🟡 리나: 좋은 질문이에요. 결론부터 말하면, "덧셈"과 "상수배"가 가능하고, 몇 가지 자연스러운 규칙을 만족하는 것은 전부 벡터라고 부를 수 있어요. 화살표도 그렇고, 수의 조합도 그렇고, 사실 함수도 벡터가 될 수 있어요.

🟡 리나: 정확히 말하면, 집합 \(V\)벡터 공간이란 것은, \(V\)의 임의의 원소(벡터라고 부르는) \(\mathbf{u}, \mathbf{v}, \mathbf{w}\)와 스칼라 \(c, c_1, c_2\)(실수 또는 복소수)에 대해 다음 8가지 공리를 만족하는 것이에요.

표 B.1: 벡터 공간의 8가지 공리

번호 공리 의미
1 \(\mathbf{u} + \mathbf{v} \in V\) 덧셈의 결과도 \(V\)에 들어간다(닫혀 있다)
2 \(\mathbf{u} + \mathbf{v} = \mathbf{v} + \mathbf{u}\) 덧셈의 순서를 바꿔도 된다
3 \((\mathbf{u} + \mathbf{v}) + \mathbf{w} = \mathbf{u} + (\mathbf{v} + \mathbf{w})\) 덧셈의 결합법칙
4 \(\exists\, \mathbf{0}:\ \mathbf{u} + \mathbf{0} = \mathbf{u}\) 영벡터가 존재한다
5 \(\exists\, (-\mathbf{u}):\ \mathbf{u} + (-\mathbf{u}) = \mathbf{0}\) 역벡터가 존재한다
6 \(c\mathbf{u} \in V\) 상수배의 결과도 \(V\)에 들어간다
7 \(c_1(c_2 \mathbf{u}) = (c_1 c_2)\mathbf{u}\), \(1 \cdot \mathbf{u} = \mathbf{u}\) 상수배의 결합법칙과 스칼라 단위원
8 \(c_1(\mathbf{u}+\mathbf{v}) = c_1\mathbf{u} + c_1\mathbf{v}\), \((c_1+c_2)\mathbf{u} = c_1\mathbf{u} + c_2\mathbf{u}\) 분배법칙(2개)

🔵 카이: 우와, 8개나 있어요?

⚪ 메이: 하지만 하나하나 보면 고등학교 벡터에서 당연했던 것들뿐이네요. "덧셈 순서를 바꿔도 된다"든가 "영벡터가 있다"든가.

🟡 리나: 맞아요. 당연한 것을 명문화한 것뿐이에요. 하지만 이 공리만 만족하면 무엇이든 벡터 공간이라고 부를 수 있다는 것이 포인트예요. 스칼라가 복소수 \(\mathbb{C}\)일 때, 특히 복소 벡터 공간이라고 불러요. 양자역학에서 사용하는 것이 바로 이쪽이에요.

🟡 리나: 구체적인 예를 3가지 들어볼게요.

예 1: \(N\)개의 복소수를 세로로 나열한 것——\(\mathbb{C}^N\)

\[\mathbb{C}^N = \left\{ \begin{pmatrix} z_1 \\ z_2 \\ \vdots \\ z_N \end{pmatrix} \;\middle|\; z_k \in \mathbb{C} \right\} \tag{B.1}\]

덧셈은 성분별로, 상수배도 성분별로. 고등학교 벡터의 자연스러운 확장이에요.

예 2: \(N = 2\)인 경우——\(\mathbb{C}^2\)

\[\mathbb{C}^2 = \left\{ \begin{pmatrix} \xi \\ \eta \end{pmatrix} \;\middle|\; \xi, \eta \in \mathbb{C} \right\} \tag{B.2}\]

이것은 스핀 1/2의 상태 공간으로 제 5 장에서 등장해요. 2차원이지만 성분이 복소수이므로 실질적인 "자유도"는 4개예요.

🔵 카이: 헐, 겨우 2성분인데 자유도가 4개나 있군요.

🟡 리나: 예 3: 제곱적분 가능한 함수의 집합——\(L^2\)

\[L^2 = \left\{ f(x) \;\middle|\; \int_{-\infty}^{\infty} |f(x)|^2\, dx < \infty \right\} \tag{B.3}\]

"제곱적분 가능"이란, \(|f(x)|^2\)\(-\infty\)에서 \(+\infty\)까지 적분했을 때 유한한 값이 된다는 것——즉 함수가 먼 곳에서 충분히 빠르게 0에 가까워진다는 거예요. 예를 들어 \(f(x) = e^{-x^2}\)는 먼 곳에서 급속히 0에 가까워지므로 \(L^2\)에 들어가요. 반면 \(f(x) = \sin x\)는 먼 곳에서도 계속 진동해요. \(|\sin x|^2 = \sin^2 x\)는 0 이상 1 이하의 값을 계속 취하므로, 적분 구간을 넓힐수록 면적이 한없이 쌓여 가요. 좀 더 정량적으로 보면, 이배각 공식에서 도출되는 \(\sin^2 x = (1 - \cos 2x)/2\)를 사용하면 \(\int_0^{2\pi} \sin^2 x\, dx = \pi\)이므로, 한 주기당 \(\pi\)의 면적이 더해져요. 이 기여가 끝없이 반복되므로 \(\int_{-\infty}^{\infty} |\sin x|^2\, dx = \infty\)가 되어 \(L^2\)에 들어가지 않아요. 함수의 덧셈 \((f+g)(x) = f(x) + g(x)\)와 상수배 \((cf)(x) = c\,f(x)\)로 8가지 공리를 만족해요. 특히 "덧셈에 대해 닫혀 있는 것"——즉 \(f, g \in L^2\)이면 \(f + g \in L^2\)인 것——을 확인해 둘게요.

핵심이 되는 것은 다음 부등식이에요:

\[|f+g|^2 \leq 2(|f|^2 + |g|^2)\]

도출을 3단계로 보여줄게요.

Step 1(삼각부등식): 각 점 \(x\)에서의 함수값 \(f(x)\)\(g(x)\)는 복소수이므로, 복소수의 삼각부등식 \(|f(x)+g(x)| \leq |f(x)| + |g(x)|\)이 성립해요. 이것은 "두 복소수를 화살표로 더할 때, 돌아가는 길의 길이 \(|f(x)| + |g(x)|\)가 직행 길이 \(|f(x)+g(x)|\) 이상이 된다"는 기하학적 성질이에요. 이하에서는 각 점 \(x\)에서의 부등식임을 생략하고 \(|f+g| \leq |f| + |g|\)로 쓸게요.

Step 2(제곱하기): 양변을 제곱하면 \(|f+g|^2 \leq (|f|+|g|)^2 = |f|^2 + 2|f||g| + |g|^2\).

Step 3(교차항 평가): \(2|f||g| \leq |f|^2 + |g|^2\)를 사용해요. 이것은 \((|f|-|g|)^2 \geq 0\)을 전개하면 \(|f|^2 - 2|f||g| + |g|^2 \geq 0\)이므로 바로 나와요.

⚪ 메이: \((|f|-|g|)^2 \geq 0\)을 펼치기만 하면 교차항의 평가가 나오는군요. 심플해요.

🟡 리나: Step 2와 Step 3을 합치면 \(|f+g|^2 \leq 2(|f|^2 + |g|^2)\)를 얻어요. 양변을 적분하면

\[\int|f+g|^2\,dx \leq 2\left(\int|f|^2\,dx + \int|g|^2\,dx\right) < \infty\]

가 되어 \(f+g \in L^2\)가 보여져요. 이것이 파동함수가 사는 공간이에요.

🔵 카이: 함수가 벡터!?

🟡 리나: 그래요. "덧셈"과 "상수배"가 가능하고 공리를 만족하니까 훌륭한 벡터 공간이에요. 다만, \(\mathbb{C}^N\)유한차원, \(L^2\)무한차원이라는 큰 차이가 있어요. 이 Appendix에서는 주로 유한차원으로 이야기를 진행하고, 마지막에 무한차원에서 무엇이 달라지는지 정리할게요.

✅ 이해도 체크: 함수의 집합 \(L^2\)가 벡터 공간으로 간주될 수 있는 이유는 무엇인가요?

함수의 덧셈 \((f+g)(x) = f(x) + g(x)\)와 상수배 \((cf)(x) = c\,f(x)\)를 정의할 수 있고, 벡터 공간의 8가지 공리를 만족하기 때문이다. 화살표나 수의 조합뿐만 아니라, 함수도 "덧셈"과 "상수배"가 가능하면 벡터로 다룰 수 있다.

✅ 이해도 체크: "벡터 공간"의 정의에서 가장 본질적인 2가지 연산은 무엇인가요?

덧셈(벡터 간의 가법)과 스칼라배(벡터의 상수배). 이 2가지 연산에 대해 닫혀 있고, 8가지 공리를 만족하는 집합이 벡터 공간이다.


차원과 기저

🟡 리나: 벡터 공간 안에서 선형독립인 벡터의 최대 개수를 차원이라고 불러요.

🔵 카이: 선형독립이 뭐였죠.

🟡 리나: 벡터 \(\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_n\)선형독립이라 함은,

\[c_1 \mathbf{v}_1 + c_2 \mathbf{v}_2 + \cdots + c_n \mathbf{v}_n = \mathbf{0} \tag{B.4}\]

을 만족하는 스칼라의 조합이 \(c_1 = c_2 = \cdots = c_n = 0\)뿐인 것이에요. 즉 "어떤 벡터도 다른 벡터의 선형결합으로는 만들 수 없다"는 거예요. 반대로, 하나라도 다른 벡터의 조합으로 만들 수 있는 경우를 "선형종속"이라고 불러요.

⚪ 메이: 선형독립은 "어느 것도 불필요하지 않다", 선형종속은 "어느 하나가 다른 것으로 대체 가능하다"는 거네요.

🟡 리나: 맞아요. \(N\)차원 벡터 공간에서는 선형독립인 \(N\)개의 벡터 조합 \(\{\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_N\}\)을 선택하면, 공간의 임의의 벡터 \(\mathbf{v}\)

\[\mathbf{v} = \sum_{k=1}^{N} v_k \,\mathbf{e}_k \tag{B.5}\]

로 유일하게 쓸 수 있어요. 이 \(\{\mathbf{e}_k\}\)기저, \(v_k\)성분(전개계수)이라고 불러요.

✅ 이해도 체크: "선형독립"이란 어떤 의미인가요?

벡터의 조합 \(\mathbf{v}_1, \ldots, \mathbf{v}_n\)이 선형독립이란 것은, \(c_1 \mathbf{v}_1 + \cdots + c_n \mathbf{v}_n = \mathbf{0}\)을 만족하는 스칼라 조합이 \(c_1 = c_2 = \cdots = c_n = 0\)뿐인 것이다. 즉, 어떤 벡터도 다른 벡터의 선형결합으로 만들 수 없다.

📝 연습문제:


B.2 내적——벡터의 "길이"와 "각도"를 복소수의 세계에서 정의한다

🟡 리나: 벡터 공간만으로는 "길이"나 "직교"의 개념이 없어요. 이것들을 정의하기 위해 내적을 도입할게요.

🟡 리나: 여기서부터 양자역학에서 표준적으로 사용되는 Dirac (디랙) 표기법을 도입할게요. 왜 새로운 표기법이 필요하냐면, 앞으로 "벡터", "내적", "연산자의 작용"을 빈번하게 쓰는데, \(\mathbf{v}\)\(\mathbf{v} \cdot \mathbf{w}\)라는 쓰기 방식으로는 복소켤레가 어디에 걸리는지·연산자가 어느 쪽에 작용하는지가 보기 어렵기 때문이에요. Dirac 표기법은 그것을 한눈에 알 수 있게 해주는 편리한 "속기법"이에요.

🔵 카이: 아하, 복소켤레의 위치가 표기법으로 바로 알 수 있게 되는 거군요.

🟡 리나: 벡터를 \(|\psi\rangle\)로 쓰고 (ket)이라고 불러요. \(\psi\) 부분은 벡터를 구별하기 위한 라벨(이름)로, \(|v\rangle\)이든 \(|\alpha\rangle\)이든 뭐든 상관없어요——B.1에서 \(\mathbf{v}\)로 쓰던 것과 같은 벡터의 다른 표기법이에요. 여기서부터는 볼드체 \(\mathbf{v}\) 대신 이 Dirac 표기법 \(|\psi\rangle\)을 표준적으로 사용할게요. 그리고 내적을 계산하기 위해 "왼쪽에 놓는 상대"를 \(\langle\psi|\)로 쓰고 브라 (bra)라고 불러요. \(\mathbb{C}^N\)의 경우로 말하면, 켓이 세로벡터 \(\begin{pmatrix} z_1 \\ \vdots \\ z_N \end{pmatrix}\)이면, 대응하는 브라는 각 성분의 복소켤레를 가로로 나열한 행벡터 \(\begin{pmatrix} z_1^* & \cdots & z_N^* \end{pmatrix}\)예요. 즉 "켓 → 브라"의 변환은 "세로벡터를 가로로 눕히고, 각 성분의 복소켤레를 취하는" 조작이에요. 브라와 켓을 나란히 놓은 \(\langle\psi|\psi'\rangle\)이 내적을 나타내요——bracket(괄호)를 bra-c-ket으로 나눈 명명이에요.

🔵 카이: 그러면 B.1에서 \(\mathbf{v}\)라고 쓰던 걸 \(|v\rangle\)로 고쳐 쓰는 것뿐인 거예요? 그리고 \(\langle\psi|\)\(|\psi'\rangle\)을 붙이면 \(\langle\psi|\psi'\rangle\)이 되어 bracket(괄호)가 된다——그래서 bra-ket인 거군요. 왼쪽에 복소켤레가 들어가는 것이 표기법 자체에 내장되어 있으니까, 쓰기 실수를 안 하게 되는 거예요?

🟡 리나: 맞아요. 그러면 내적의 정의로 들어갈게요. 두 벡터 \(|\psi\rangle\)\(|\psi'\rangle\)에 대해 복소수를 하나 대응시키는 규칙 \(\langle\psi|\psi'\rangle\)내적이라고 불러요. 단, 다음 3가지 성질을 만족해야 해요.

(1) 양의 정치성(비음성):

\[\langle\psi|\psi\rangle \geq 0 \quad \text{(등호는 } |\psi\rangle = \mathbf{0} \text{일 때만)} \tag{B.6}\]

(2) 에르미트성(켤레대칭성):

\[\langle\psi'|\psi\rangle = \langle\psi|\psi'\rangle^* \tag{B.7}\]

(3) 제2 인수에 관한 선형성:

\[\langle\psi|\bigl(c_1|\psi_1\rangle + c_2|\psi_2\rangle\bigr) = c_1\langle\psi|\psi_1\rangle + c_2\langle\psi|\psi_2\rangle \tag{B.8}\]

🔵 카이: (1)의 "양의 정치성"이란, 요컨대 "자기 자신과의 내적은 반드시 0 이상이고, 0이 되는 것은 벡터 자체가 0일 때뿐"이라는 거예요?

🟡 리나: 맞아요. "길이의 제곱"이 음수가 되면 곤란하잖아요? 그래서 내적에는 "자기 자신과 내적을 취하면 반드시 0 이상"이라는 조건을 부과하는 거예요. 그리고 (2)의 "에르미트성"——

🔵 카이: (2)는 좌우를 바꾸면 복소켤레가 붙는다는 거예요?

🟡 리나: 그래요. 실수 벡터라면 \(\mathbf{a} \cdot \mathbf{b} = \mathbf{b} \cdot \mathbf{a}\)로 바꿔도 같지만, 복소수의 세계에서는 바꾸면 복소켤레가 붙어요. 이것이 실공간과 복소공간의 결정적인 차이예요.

🔵 카이: 어라, (2)와 (3)을 조합하면, 왼쪽(제1 인수)에 상수가 곱해져 있을 때는 어떻게 되나요?

🟡 리나: 좋은 질문이에요. 도출해 봅시다. \(\langle c\psi|\phi\rangle\)을 생각해 볼게요. 먼저 (2)의 에르미트성으로 좌우를 바꾸면

\[\langle c\psi|\phi\rangle = \langle\phi|c\psi\rangle^*\]

다음으로 (3)의 제2 인수의 선형성을 사용하면 \(\langle\phi|c\psi\rangle = c\langle\phi|\psi\rangle\)이므로

\[\langle c\psi|\phi\rangle = \bigl(c\langle\phi|\psi\rangle\bigr)^* = c^*\langle\phi|\psi\rangle^* = c^*\langle\psi|\phi\rangle\]

마지막 단계에서 다시 (2)를 사용했어요. 즉 제1 인수에 관해서는 반선형——상수를 밖으로 빼면 복소켤레가 붙어요. 2항의 선형결합에서도 같은 논리를 사용할 수 있어요. \(\langle c_1\psi_1 + c_2\psi_2|\psi\rangle\)을 생각하면, 먼저 에르미트성 (B.7)로 좌우를 바꾸어 \(\langle\psi|c_1\psi_1 + c_2\psi_2\rangle^*\)로 하고, 제2 인수의 선형성 (B.8)로 \(\bigl(c_1\langle\psi|\psi_1\rangle + c_2\langle\psi|\psi_2\rangle\bigr)^*\)로 하고, 각 항의 복소켤레를 취하면

\[\langle c_1\psi_1 + c_2\psi_2|\psi\rangle = c_1^*\langle\psi_1|\psi\rangle + c_2^*\langle\psi_2|\psi\rangle \tag{B.8a}\]

을 얻어요. 각 항에서 \(\langle c_i\psi_i|\psi\rangle = c_i^*\langle\psi_i|\psi\rangle\)을 사용한 것뿐이에요. 이것은 양자역학 계산에서 몇 번이고 사용하니까, 확실히 기억해 두세요.

⚪ 메이: 오른쪽은 순순히 상수가 나오지만, 왼쪽은 복소켤레가 붙는다——좌우의 취급이 비대칭이네요.

✅ 이해도 체크: 내적의 제1 인수(브라 쪽)에 스칼라 \(c\)가 곱해져 있을 때, 내적 밖으로 빼면 어떻게 되나요?

복소켤레 \(c^*\)가 붙는다. 즉 \(\langle c\psi|\phi\rangle = c^*\langle\psi|\phi\rangle\). 이것은 내적의 제1 인수에 관한 "반선형성"이라 불리며, 제2 인수의 선형성(\(c\)가 그대로 나옴)과는 비대칭이다.


구체적 예: \(\mathbb{C}^N\)의 내적

🟡 리나: \(\mathbb{C}^N\)의 경우, 내적은 자연스럽게 정의돼요. 두 벡터

\[|\psi\rangle = \begin{pmatrix} z_1 \\ z_2 \\ \vdots \\ z_N \end{pmatrix}, \quad |\psi'\rangle = \begin{pmatrix} z'_1 \\ z'_2 \\ \vdots \\ z'_N \end{pmatrix}\]

에 대해,

\[\langle\psi|\psi'\rangle = \sum_{k=1}^{N} z_k^* z'_k \tag{B.9}\]

🔵 카이: 고등학교 벡터의 내적 \(\mathbf{a} \cdot \mathbf{b} = a_1 b_1 + a_2 b_2 + \cdots\)와 비슷한데, 왼쪽에 복소켤레 \(z_k^*\)가 붙는군요.

🟡 리나: 그래요. 실수라면 \(z_k^* = z_k\)이니까 고등학교 내적과 일치해요. 복소수로 확장했을 때 복소켤레가 필요한 이유는, \(\langle\psi|\psi\rangle \geq 0\)을 보장하기 위해서예요.

\[\langle\psi|\psi\rangle = \sum_{k=1}^{N} z_k^* z_k = \sum_{k=1}^{N} |z_k|^2 \geq 0 \tag{B.10}\]

각 항 \(|z_k|^2\)가 비음이므로 합도 비음이에요. 만약 복소켤레를 붙이지 않으면, \(z_k^2\)는 음수도 허수도 될 수 있으므로 "길이의 제곱"으로 사용할 수 없어요.


노름·직교·규격화

🟡 리나: 내적이 정의되면, 3가지 중요한 개념이 자동으로 얻어져요.

노름(길이):

\[\| |\psi\rangle \| = \sqrt{\langle\psi|\psi\rangle} \tag{B.11}\]

직교:

\[\langle\psi|\psi'\rangle = 0 \quad \Longleftrightarrow \quad |\psi\rangle \text{와 } |\psi'\rangle \text{는 직교한다} \tag{B.12}\]

규격화:

\[\langle\psi|\psi\rangle = 1 \quad \Longleftrightarrow \quad |\psi\rangle \text{는 규격화되어 있다} \tag{B.13}\]

🔵 카이: 고등학교에서 "단위벡터"라고 부르던 게 "규격화된 벡터"라는 거예요?

🟡 리나: 바로 그래요. 임의의 영이 아닌 벡터 \(|\psi\rangle\)은,

\[\frac{|\psi\rangle}{\sqrt{\langle\psi|\psi\rangle}} \tag{B.14}\]

로 나누면 규격화할 수 있어요.

🟡 리나: 그리고 한 가지 더 중요한 부등식이 있어요. Schwarz (슈바르츠) 부등식:

\[|\langle\psi|\psi'\rangle|^2 \leq \langle\psi|\psi\rangle \cdot \langle\psi'|\psi'\rangle \tag{B.15}\]

고등학교에서 배운 Cauchy–Schwarz 부등식의 복소수 버전이에요. 등호가 성립하는 것은 \(|\psi\rangle\)\(|\psi'\rangle\)가 평행(한쪽이 다른 쪽의 상수배)일 때뿐이에요.

✅ 이해도 체크: 내적의 정의에서 제1 인수에 복소켤레가 붙는 이유는 무엇인가요?

\(\langle\psi|\psi\rangle = \sum_k |z_k|^2 \geq 0\)을 보장하기 위해서이다. 복소켤레를 붙이지 않으면 \(\langle\psi|\psi\rangle\)이 음수나 허수가 될 수 있으므로, "길이의 제곱"으로서 의미를 갖지 못한다.

📝 연습문제:


B.3 정규직교기저와 완전성 관계——임의의 벡터를 "성분 분해"한다

🟡 리나: 기저 중에서도 특히 편리한 것이 정규직교기저 (orthonormal basis)예요.

🟡 리나: 기저 \(\{|e_1\rangle, |e_2\rangle, \ldots, |e_N\rangle\}\)정규직교라 함은,

\[\langle e_j | e_k \rangle = \delta_{jk} \tag{B.16}\]

을 만족하는 것이에요. 여기서 \(\delta_{jk}\)는 Kronecker (크로네커) 델타:

\[\delta_{jk} = \begin{cases} 1 & (j = k) \\ 0 & (j \neq k) \end{cases} \tag{B.17}\]

🔵 카이: 즉 "길이 1이고, 서로 직교하는" 기저라는 거죠.

🟡 리나: 맞아요. 정규직교기저를 사용하면 성분 계산이 아주 간단해져요. 임의의 벡터 \(|\psi\rangle\)을 전개하면

\[|\psi\rangle = \sum_{k=1}^{N} c_k |e_k\rangle \tag{B.18}\]

전개계수 \(c_k\)는 양변에 왼쪽에서 \(\langle e_j|\)를 작용시키기만 하면 구해져요:

\[\langle e_j|\psi\rangle = \sum_{k=1}^{N} c_k \langle e_j|e_k\rangle = \sum_{k=1}^{N} c_k \,\delta_{jk} = c_j \tag{B.19}\]

⚪ 메이: 정규직교성 덕분에 합에서 \(k = j\)인 항만 살아남는 거네요.

🟡 리나: 그래요. 따라서

\[|\psi\rangle = \sum_{k=1}^{N} |e_k\rangle \langle e_k|\psi\rangle = \left(\sum_{k=1}^{N} |e_k\rangle\langle e_k|\right) |\psi\rangle \tag{B.20}\]

이것이 임의의 \(|\psi\rangle\)에 대해 성립하므로, 괄호 안의 내용은 항등 연산자 \(\hat{1}\)과 같아요:

\[\sum_{k=1}^{N} |e_k\rangle\langle e_k| = \hat{1} \tag{B.21}\]

🔵 카이: 오오, 임의의 벡터에서 성립하니까 \(\hat{1}\)이 되는 거군요.

🟡 리나: 이것을 완전성 관계 (completeness relation)라고 불러요. 양자역학에서 가장 자주 사용하는 항등식 중 하나예요. "임의의 벡터를 정규직교기저로 전개할 수 있다"는 것의 수학적 표현이에요.

🔵 카이: \(|e_k\rangle\langle e_k|\)는 켓과 브라를 나란히 놓은 건데요. 이건 뭐예요?

🟡 리나: 좋은 질문이에요. \(|e_k\rangle\langle e_k|\)사영 연산자 (projection operator)라고 불리는 것으로, 벡터를 \(|e_k\rangle\) 방향으로 "사영"하는 연산자예요. 자세한 것은 다음 절에서 다루겠지만, 지금은 "완전성 관계는 \(\hat{1}\)을 사영 연산자의 합으로 분해한 것"이라고 기억해 두세요.

✅ 이해도 체크: 정규직교기저를 사용하면, 벡터 \(|\psi\rangle\)의 전개계수 \(c_j\)는 어떻게 구할 수 있나요?

\(c_j = \langle e_j|\psi\rangle\). 정규직교성 \(\langle e_j|e_k\rangle = \delta_{jk}\) 덕분에, \(|\psi\rangle = \sum_k c_k |e_k\rangle\)의 양변에 왼쪽에서 \(\langle e_j|\)를 작용시키기만 하면 \(c_j\)를 추출할 수 있다.


Gram–Schmidt 직교화법

🟡 리나: 주어진 기저가 정규직교가 아닌 경우에도, Gram–Schmidt (그람·슈미트) 직교화법으로 정규직교기저로 변환할 수 있어요. 절차는 이래요.

선형독립인 벡터 \(\{|v_1\rangle, |v_2\rangle, \ldots, |v_N\rangle\}\)으로부터 정규직교계 \(\{|e_1\rangle, |e_2\rangle, \ldots, |e_N\rangle\}\)를 만들기:

Step 1: \(|v_1\rangle\)을 규격화한다.

\[|e_1\rangle = \frac{|v_1\rangle}{\||v_1\rangle\|} \tag{B.22}\]

Step 2: \(|v_2\rangle\)에서 \(|e_1\rangle\) 방향 성분을 빼고 규격화한다.

\[|w_2\rangle = |v_2\rangle - \langle e_1|v_2\rangle\, |e_1\rangle, \qquad |e_2\rangle = \frac{|w_2\rangle}{\||w_2\rangle\|} \tag{B.23}\]

Step \(k\): \(|v_k\rangle\)에서 이미 만든 \(|e_1\rangle, \ldots, |e_{k-1}\rangle\) 방향 성분을 전부 빼고 규격화한다.

\[|w_k\rangle = |v_k\rangle - \sum_{j=1}^{k-1} \langle e_j|v_k\rangle\, |e_j\rangle, \qquad |e_k\rangle = \frac{|w_k\rangle}{\||w_k\rangle\|} \tag{B.24}\]

🔵 카이: 매번 "지금까지 만든 정규직교 벡터에 대한 사영을 빼는" 거군요. 그런데, \(|w_k\rangle\)가 영벡터가 되어 버리는 일은 없나요?

🟡 리나: 좋은 질문이에요. \(|w_k\rangle = \mathbf{0}\)이 되는 것은, \(|v_k\rangle\)가 그 이전의 벡터 \(|v_1\rangle, \ldots, |v_{k-1}\rangle\)의 선형결합으로 쓸 수 있는 경우——즉 원래 벡터 조합이 선형독립이 아닌 경우예요. 선형독립인 조합에서 출발하면, 각 단계에서 \(|w_k\rangle \neq \mathbf{0}\)이 보장돼요.

⚪ 메이: 이렇게 하면 각 단계에서 새 벡터가 이전 벡터 전부와 직교하고, 마지막에 규격화하니까 노름도 1이 되네요.

✅ 이해도 체크: 완전성 관계 \(\sum_k |e_k\rangle\langle e_k| = \hat{1}\)의 물리적 의미는 무엇인가요?

정규직교기저 \(\{|e_k\rangle\}\)가 공간 전체를 "펼치고(span)" 있으며, 임의의 벡터를 이 기저로 완전히 전개할 수 있다는 것. 전개에 "누락"이 없다.

📝 연습문제:


B.4 선형 연산자와 행렬 표현——벡터를 다른 벡터로 변환한다

🟡 리나: 다음은 선형 연산자 (linear operator)예요. 벡터를 입력받아 다른 벡터를 출력하는 "변환 규칙"이에요.

🟡 리나: 연산자 \(\hat{A}\)선형이라 함은, 임의의 벡터 \(|\psi_1\rangle, |\psi_2\rangle\)와 복소수 \(c_1, c_2\)에 대해

\[\hat{A}\bigl(c_1|\psi_1\rangle + c_2|\psi_2\rangle\bigr) = c_1\,\hat{A}|\psi_1\rangle + c_2\,\hat{A}|\psi_2\rangle \tag{B.25}\]

가 성립하는 것이에요. "입력의 선형결합을 출력의 선형결합으로 바꾼다"——이것이 선형성의 의미예요.

🔵 카이: "모자"를 붙여서 \(\hat{A}\)로 쓰는 건 벡터와 구별하기 위해서예요?

🟡 리나: 그래요. 벡터는 \(|\psi\rangle\), 연산자는 \(\hat{A}\). 다만 맥락상 분명할 때는 모자를 생략하기도 해요.


행렬 표현

🟡 리나: 정규직교기저 \(\{|e_1\rangle, \ldots, |e_N\rangle\}\)를 선택하면, 선형 연산자 \(\hat{A}\)\(N \times N\) 행렬로 표현할 수 있어요.

\(\hat{A}\)행렬요소 (matrix element)를

\[A_{jk} = \langle e_j|\hat{A}|e_k\rangle \tag{B.26}\]

으로 정의해요. 그러면 \(\hat{A}\)는 행렬

\[\hat{A} \doteq \begin{pmatrix} A_{11} & A_{12} & \cdots & A_{1N} \\ A_{21} & A_{22} & \cdots & A_{2N} \\ \vdots & \vdots & \ddots & \vdots \\ A_{N1} & A_{N2} & \cdots & A_{NN} \end{pmatrix} \tag{B.27}\]

로 표현돼요. 기호 \(\doteq\)는 "이 기저에서의 행렬 표현이다"라는 의미로 사용해요. 보통 등호 \(=\)가 아니라 \(\doteq\)를 사용하는 이유는, 같은 연산자라도 기저를 바꾸면 행렬의 수치가 달라지기 때문——"연산자 그 자체"와 "어떤 기저를 선택했을 때의 행렬 표현"은 별개의 것이에요. 교과서에 따라서는 \(=\)\(\leftrightarrow\)를 사용하기도 하지만, 이 책에서는 \(\doteq\)로 통일할게요.

🔵 카이: \(\doteq\)는 처음 봤어요. 즉 "기저를 정하면 이 행렬이 된다"는 의미의 등호인 거군요. 그러면 기저를 바꾸면 행렬도 바뀌나요?

🟡 리나: 바뀌어요. 예를 들어 고등학교에서 배운 xyz 좌표를 45° 회전시키면, 같은 벡터라도 성분의 수치는 달라지잖아요? 그것과 마찬가지로, 기저를 바꾸면 행렬의 수치도 달라져요.

🔵 카이: 아, 지도의 도법 같은 거예요? 메르카토르 도법과 몰바이데 도법에서 대륙의 형태는 다르게 보이지만, 지구 자체는 변하지 않는 것처럼.

🟡 리나: 바로 그래요. 연산자 그 자체는 기저에 의존하지 않는 추상적 존재——행렬은 어디까지나 "어떤 기저에서의 표현"에 불과해요. 구체적으로 어떻게 달라지는지는 B.7에서 "유니터리 변환"으로 다룰게요. 이 \(\doteq\)는 본편에서도 행렬 표현을 쓸 때 사용하니까 기억해 두세요.

⚪ 메이: 즉 행렬의 겉모습은 기저에 따라 달라지지만, 연산자라는 추상적 존재 자체는 하나뿐인 거네요.

✅ 이해도 체크: 선형 연산자의 "행렬 표현"과 "연산자 그 자체"의 관계는 어떤 것인가요?

행렬 표현은 어떤 정규직교기저를 선택했을 때 연산자의 "표현"이며, 기저를 바꾸면 행렬도 달라진다. 그러나 연산자 그 자체는 기저에 의존하지 않는 추상적 존재이다. 좌표계를 바꿔도 벡터 자체는 변하지 않는 것과 같다.


연산자의 곱과 교환 관계

🟡 리나: 두 연산자 \(\hat{A}\)\(\hat{B}\) \(\hat{A}\hat{B}\)는 "먼저 \(\hat{B}\)를 작용시키고, 다음에 \(\hat{A}\)를 작용시킨다"는 의미예요. 행렬 표현에서는 행렬의 곱에 대응해요.

🔵 카이: 행렬의 곱은 어떻게 계산해요?

🟡 리나: 먼저 구체적인 수치로 감을 잡아봅시다. \(A = \begin{pmatrix} 1 & 2 \\ 0 & 3 \end{pmatrix}\), \(B = \begin{pmatrix} 1 & 0 \\ 1 & 1 \end{pmatrix}\)일 때, \(AB\)의 각 성분을 순서대로 계산해 볼게요. 규칙은 "결과의 \((j, k)\) 성분은, 왼쪽 행렬의 제 \(j\) 행과 오른쪽 행렬의 제 \(k\) 열을 성분별로 곱해서 더한 것"이에요. 예를 들어 왼쪽 위 성분은, \(A\)의 제1행 \((1, 2)\)\(B\)의 제1열 \(\begin{pmatrix} 1 \\ 1 \end{pmatrix}\)의 내적으로 \(1 \cdot 1 + 2 \cdot 1 = 3\). \((1,2)\) 성분은 \(A\)의 제1행 \((1, 2)\)\(B\)의 제2열 \(\begin{pmatrix} 0 \\ 1 \end{pmatrix}\)의 내적으로 \(1 \cdot 0 + 2 \cdot 1 = 2\).

🔵 카이: 아, 패턴이 보여요. \((2,1)\)\(A\)의 제2행 \((0, 3)\)\(B\)의 제1열 \(\begin{pmatrix} 1 \\ 1 \end{pmatrix}\)\(0 \cdot 1 + 3 \cdot 1 = 3\), \((2,2)\)\(A\)의 제2행과 \(B\)의 제2열로 \(0 \cdot 0 + 3 \cdot 1 = 3\)이네요. 그러니까 \(AB = \begin{pmatrix} 3 & 2 \\ 3 & 3 \end{pmatrix}\).

🟡 리나: 맞아요. 일반적인 \(2 \times 2\)의 경우는 \(\begin{pmatrix} a & b \\ c & d \end{pmatrix}\begin{pmatrix} e & f \\ g & h \end{pmatrix} = \begin{pmatrix} ae+bg & af+bh \\ ce+dg & cf+dh \end{pmatrix}\)이고, \(N \times N\) 행렬 \(A\)\(B\)의 곱이라면 \((j, k)\) 성분은 \(\sum_{l=1}^N A_{jl} B_{lk}\)예요.

🔵 카이: 그렇군요, 행과 열의 내적을 모든 위치에서 계산하는 거네요. 그런데 왜 이런 규칙이 되는 거예요? 갑자기 떨어진 것처럼 보이는데요.

🟡 리나: 좋은 질문이에요. 사실 이 규칙은 갑자기 떨어진 게 아니라, "연산자의 곱"이라는 추상적 개념을 행렬로 표현하면 자연스럽게 나오는 거예요. 생각해 봐요——연산자 \(\hat{A}\hat{B}\)는 "먼저 \(\hat{B}\)를 작용시키고, 다음에 \(\hat{A}\)를 작용시키는" 조작이잖아요. 이 조작을 행렬요소 \(\langle e_j|\hat{A}\hat{B}|e_k\rangle\)로 계산하고 싶어요. 하지만 \(\hat{A}\)\(\hat{B}\)가 직접 붙어 있으면 분해할 수 없어요. 그래서 B.3에서 도입한 완전성 관계를 사용하는 거예요. \(\hat{A}\)\(\hat{B}\) 사이에 \(\hat{1} = \sum_l |e_l\rangle\langle e_l|\)을 삽입해요. \(\hat{1}\)은 항등 연산자——즉 무엇에 작용시켜도 바꾸지 않는 연산자——이므로, \(\hat{A}\hat{B} = \hat{A}\,\hat{1}\,\hat{B}\)예요. 수의 세계에서 \(a \times 1 \times b = ab\)인 것과 같아요. "사이에 1을 끼워도 값은 변하지 않지만, \(\hat{1}\)\(\sum_l |e_l\rangle\langle e_l|\)로 고쳐 쓸 수 있어서 합으로 분해할 수 있다"——이것이 완전성 관계를 삽입하는 테크닉의 본질이에요. 실제로 해봅시다:

\[(\hat{A}\hat{B})_{jk} = \langle e_j|\hat{A}\hat{B}|e_k\rangle = \langle e_j|\hat{A}\,\hat{1}\,\hat{B}|e_k\rangle = \sum_{l=1}^{N} \langle e_j|\hat{A}|e_l\rangle\langle e_l|\hat{B}|e_k\rangle = \sum_{l=1}^{N} A_{jl}\, B_{lk} \tag{B.28}\]

이것이 바로 "제 \(j\) 행과 제 \(k\) 열의 내적"의 일반형이에요. 즉 행렬의 곱 규칙은 완전성 관계로부터 자연스럽게 도출되는 거예요.

🔵 카이: 아, 행렬의 곱 규칙이 갑자기 떨어진 게 아니라 완전성 관계에서 나오는 거군요! 사이에 끼운 \(|e_l\rangle\)을 전부 합산하면서 "행과 열의 내적"이 자연스럽게 나타나는……. 그런데 잠깐만요. 만약 기저가 공간 전체를 펼치지 못한다면——즉 완전성 관계가 성립하지 않는다면——사이에 끼우는 \(\hat{1}\)이 진짜 항등 연산자가 아니게 되니까 이 도출 자체가 무너지는 거 아닌가요?

🟡 리나: 예리하네요. 맞아요. 완전성 관계는 "기저가 공간을 다 펼치고 있다"는 것의 표현이니까, 그것이 무너지면 사이에 끼우는 \(\hat{1}\)이 진짜 항등 연산자가 되지 않아요. 그래서 정규직교 완전계를 사용하는 것이 대전제예요.

⚪ 메이: 즉, \(\hat{1}\)을 끼워도 값은 변하지 않지만, \(\sum_l |e_l\rangle\langle e_l|\)로 고쳐 쓸 수 있어서 합으로 분해된다——그래서 행렬의 곱 규칙이 자연스럽게 나오는 거네요.

🔵 카이: 그런데, \(\hat{A}\hat{B}\)\(\hat{B}\hat{A}\)는 같은 결과가 되나요? 수의 곱셈이라면 \(3 \times 5 = 5 \times 3\)이지만, 행렬은 순서가 다르면 "지나가는 길"이 달라질 것 같은데요.

🟡 리나: 좋은 질문이에요. 일반적으로 \(\hat{A}\hat{B} \neq \hat{B}\hat{A}\)예요. 연산자의 곱은 순서가 중요해요. 이 "순서의 차이"를 정량화하는 것이 교환자 (commutator):

\[[\hat{A}, \hat{B}] \equiv \hat{A}\hat{B} - \hat{B}\hat{A} \tag{B.29}\]

\([\hat{A}, \hat{B}] = 0\)일 때 "\(\hat{A}\)\(\hat{B}\)는 교환한다 (commute)"라고 말해요.

🔵 카이: 수의 곱셈은 \(ab = ba\)로 순서를 바꿔도 되지만, 행렬이나 연산자는 반드시 그렇지는 않군요. 하지만, 교환하지 않는 것이 물리적으로 무엇을 의미하는지는 아직 감이 안 와요.

🟡 리나: 좋은 감각이에요. 사실 양자역학에서는 교환하지 않는 연산자 쌍이 본질적인 역할을 해요. "두 물리량을 동시에 정확히 측정할 수 없다"는 불확정성 원리가 바로 교환 관계에서 도출되는 거예요(제 8 장에서 자세히 다룰게요).

✅ 이해도 체크: 두 연산자 \(\hat{A}, \hat{B}\)가 "교환한다"란 어떤 뜻인가요?

\([\hat{A}, \hat{B}] = \hat{A}\hat{B} - \hat{B}\hat{A} = 0\), 즉 작용시키는 순서를 바꿔도 결과가 달라지지 않는 것.


에르미트 켤레(수반 연산자)

🟡 리나: 연산자에는 "뒤집기"에 해당하는 조작이 있어요. 수의 세계에서 복소켤레 \(z \to z^*\)가 있듯이, 연산자의 세계에도 "켤레"가 있어요. 이것이 에르미트 켤레예요.

🟡 리나: 연산자 \(\hat{A}\)에 대해, 임의의 벡터 \(|\psi\rangle, |\phi\rangle\)에 대해

\[\langle\phi|\hat{A}^\dagger|\psi\rangle = \langle\psi|\hat{A}|\phi\rangle^* \tag{B.30}\]

를 만족하는 연산자 \(\hat{A}^\dagger\)를, \(\hat{A}\)에르미트 켤레 (Hermitian conjugate) 또는 수반 연산자 (adjoint)라고 불러요. 말로 표현하면 "왼쪽에 \(\langle\phi|\), 오른쪽에 \(|\psi\rangle\)를 놓고 \(\hat{A}^\dagger\)를 끼운 내적"은 "왼쪽에 \(\langle\psi|\), 오른쪽에 \(|\phi\rangle\)를 놓고 \(\hat{A}\)를 끼운 내적의 복소켤레"와 같다——즉 연산자에 대거를 붙이는 대신, 브라와 켓을 교환하고 복소켤레를 취해도 같은 값이 얻어진다는 거예요.

🔵 카이: 대거 \(\dagger\)를 붙이면 좌우의 벡터가 바뀌고 복소켤레가 붙는다——내적의 에르미트성 (B.7)과 비슷한 구조네요.

🟡 리나: 행렬 표현에서는, 에르미트 켤레는 "전치하고 복소켤레를 취하는" 조작에 대응해요:

\[(\hat{A}^\dagger)_{jk} = A_{kj}^* \tag{B.31}\]

⚪ 메이: 행과 열을 교환하고(전치), 추가로 각 성분의 복소켤레를 취하는 거네요.

🟡 리나: 에르미트 켤레의 중요한 성질을 정리해 둘게요.

\[(\hat{A}^\dagger)^\dagger = \hat{A} \tag{B.32}\]
\[(c\hat{A})^\dagger = c^*\hat{A}^\dagger \tag{B.33}\]
\[(\hat{A} + \hat{B})^\dagger = \hat{A}^\dagger + \hat{B}^\dagger \tag{B.34}\]
\[(\hat{A}\hat{B})^\dagger = \hat{B}^\dagger \hat{A}^\dagger \tag{B.35}\]

🔵 카이: 마지막 식, 순서가 반대가 되네요!

🟡 리나: 그래요. 양말과 구두를 신는 순서와 벗는 순서가 반대인 것과 같아요. 곱의 에르미트 켤레는 순서가 뒤집혀요. 이것은 매우 자주 사용하니까 기억해 두세요.

✅ 이해도 체크: 연산자의 곱 \(\hat{A}\hat{B}\)의 에르미트 켤레 \((\hat{A}\hat{B})^\dagger\)는 어떻게 되나요?

\((\hat{A}\hat{B})^\dagger = \hat{B}^\dagger \hat{A}^\dagger\). 곱의 에르미트 켤레에서는 순서가 반전된다.

📝 연습문제:


B.5 고유값과 고유벡터——연산자의 "특별한 방향"을 찾다

🟡 리나: 선형 연산자(선형 변환) \(\hat{A}\)를 작용시키면, 일반적으로는 벡터의 방향도 크기도 달라져요. 하지만 특별한 벡터에서는 방향이 바뀌지 않고 크기만 고유값 \(a\)배가 돼요. 수식으로 쓰면

\[\hat{A}|a\rangle = a|a\rangle \tag{B.36}\]

이때 \(a\)고유값 (eigenvalue), \(|a\rangle\)고유벡터 (eigenvector)라고 불러요. 그림 B.1「선형 변환에서 고유벡터의 기하학적 의미」를 보세요. 일반적인 벡터 \(|v\rangle\)\(\hat{A}\)를 작용시키면 방향도 크기도 달라져 버려요. 하지만 고유벡터 \(|a\rangle\)만은 특별해서, 방향이 유지되고 크기만 \(a\)배로 변화하는 것을 알 수 있어요.

선형 변환에서 고유벡터의 기하학적 의미

그림 B.1: 선형 변환에서 고유벡터의 기하학적 의미. 선형 변환 \(\hat{A}\)에 대해 일반적인 벡터 \(|v\rangle\)은 방향과 크기 모두 달라진다. 그러나 고유벡터 \(|a\rangle\)은 방향이 유지되고 크기만 고유값 \(a\)배로 변화한다.

🔵 카이: 그림 B.1「선형 변환에서 고유벡터의 기하학적 의미」를 보니까, 일반 벡터는 방향도 크기도 변하지만, 고유벡터만은 방향이 유지되고 늘어나거나 줄어들기만 하는 거군요. 그런데, 고유값 \(a\)가 음수면 방향이 반전되잖아요? 그래도 "방향이 변하지 않는다"라고 해도 되나요?

🟡 리나: 예리하네요. 정확히 말하면, 고유값이 음수면 방향이 반전돼요——하지만 "같은 직선 위에 머무른다"는 의미에서 "방향이 변하지 않는다"라고 말하는 거예요. 일반 벡터는 완전히 다른 방향으로 날아가 버리지만, 고유벡터는 원래의 직선 위에 머물러요. 이 "같은 직선 위"라는 성질이 본질이에요.

🟡 리나: 맞아요. \(\hat{A}\)를 곱하면 \(a\)배가 될 뿐이에요. 양자역학에서는 고유값이 "측정에서 얻어지는 값"에, 고유벡터가 "측정 후의 상태"에 대응해요(제 12 장에서 자세히 다룰게요).


고유값을 구하는 방법——특성 방정식

🟡 리나: 고유값 방정식 (B.36)은

\[(\hat{A} - a\hat{1})|a\rangle = 0 \tag{B.37}\]

로 고쳐 쓸 수 있어요. 이것은 \(|a\rangle\)을 미지수로 하는 연립 1차 방정식으로, 우변이 전부 0——이런 것을 동차 연립 1차 방정식이라고 불러요. \(|a\rangle = \mathbf{0}\)(전 성분이 0)은 항상 해이지만, 고유벡터로서 의미가 있는 것은 \(|a\rangle \neq \mathbf{0}\)인 경우예요.

🔵 카이: 0이 아닌 해가 존재하기 위한 조건이 있나요?

🟡 리나: 좋은 질문이에요. 여기서 중요한 정리가 있어요: 동차 연립방정식이 0 이외의 해를 갖는 것은, 계수 행렬의 행렬식이 0일 때에 한한다. 순서대로 설명할게요. 먼저 역행렬의 개념을 도입할게요. 수의 세계에서 \(3 \times \frac{1}{3} = 1\)처럼 "곱하면 1이 되는 짝"이 있잖아요? 이 \(\frac{1}{3}\)\(3\)의 역수라고 부르죠. 행렬에서도 마찬가지로, 행렬 \(M\)에 대해 \(M^{-1}M = MM^{-1} = \hat{1}\)을 만족하는 행렬 \(M^{-1}\)이 존재할 때, \(M^{-1}\)\(M\)역행렬 (inverse matrix)이라고 불러요. 여기서 \(\hat{1}\)은 항등 연산자——B.3의 완전성 관계에서 나왔던 것과 같은 것으로, 행렬 표현에서는 단위행렬 (identity matrix) \(I_N\)이라고 쓰기도 해요. \(2 \times 2\)라면 \(\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\), 일반적인 \(N \times N\)이라면 대각 성분이 전부 1이고 나머지가 0인 행렬이에요. 어떤 벡터에 작용시켜도 바꾸지 않는 행렬——즉 \(I_N \begin{pmatrix} v_1 \\ \vdots \\ v_N \end{pmatrix} = \begin{pmatrix} v_1 \\ \vdots \\ v_N \end{pmatrix}\)이에요.

🔵 카이: 즉 역행렬은 "행렬의 나눗셈" 같은 거예요?

🟡 리나: 그래요, 좋은 이미지예요. 역행렬이 존재하면, \(M|a\rangle = \mathbf{0}\)의 양변에 왼쪽에서 \(M^{-1}\)을 곱해서 \(|a\rangle = M^{-1}\mathbf{0} = \mathbf{0}\)밖에 나오지 않아요(왜 \(M^{-1}\mathbf{0} = \mathbf{0}\)이냐면, 행렬 곱의 정의 \((AB)_{jk} = \sum_l A_{jl}B_{lk}\)에서 영벡터의 성분은 전부 0이므로, 어떤 행과의 내적을 취해도 0이 되기 때문이에요). 즉 역행렬이 있으면 "자명한 해밖에 없다"는 거예요.

🔵 카이: 그러면, 0이 아닌 고유벡터가 존재하려면 역행렬이 존재하면 안 된다는 거네요.

🟡 리나: 맞아요. 그리고 "역행렬이 존재하지 않는다"는 것을 판정하는 것이 행렬식 (determinant)이에요. 먼저 행렬식이 무엇인지 설명할게요. \(2 \times 2\) 행렬 \(M = \begin{pmatrix} a & b \\ c & d \end{pmatrix}\)행렬식

\[\det\begin{pmatrix} a & b \\ c & d \end{pmatrix} = ad - bc\]

로 정의되는 양이에요. 기하학적으로는, \(M\)의 2개의 열벡터 \(\begin{pmatrix} a \\ c \end{pmatrix}\)\(\begin{pmatrix} b \\ d \end{pmatrix}\)가 이루는 평행사변형의 부호 붙은 넓이와 같아요.

🔵 카이: 넓이가 0이라는 건 두 벡터가 같은 방향을 향하고 있다는 거예요?

🟡 리나: 맞아요. 두 열벡터가 평행——즉 한쪽이 다른 쪽의 상수배——라는 거예요. 이때 행렬 \(M\)은 2차원 평면의 모든 벡터를 1개의 직선 위로 짓눌러 버려요. 짓눌린 후에는 "원래 어디에 있었는지"를 복원할 수 없으므로 역행렬이 존재하지 않아요. 그리고 짓눌리는 방향——즉 \(M\)을 곱하면 0이 되는 방향——이 존재하므로, \(M|a\rangle = \mathbf{0}\)에 0이 아닌 해 \(|a\rangle\)이 허용되는 거예요.

⚪ 메이: "넓이 0 ⇔ 짓눌린다 ⇔ 역행렬 없음"——기하학적 이미지로 전부 연결되네요.

🟡 리나: 정리하면, 행렬식이 0 ⇔ 역행렬이 존재하지 않는다 ⇔ 0이 아닌 해가 허용된다. 따라서 고유값 방정식 \((\hat{A} - a\hat{1})|a\rangle = 0\)이 0이 아닌 해를 갖는 조건은

\[\det(\hat{A} - a\hat{1}) = 0 \tag{B.38}\]

예요.

이것은 고등학교 기하에서 "행렬의 2개 열벡터 \(\begin{pmatrix} p \\ r \end{pmatrix}\)\(\begin{pmatrix} q \\ s \end{pmatrix}\)가 이루는 평행사변형의 부호 붙은 넓이"에 해당해요. 넓이가 0 = 두 벡터가 평행 = 행렬이 짓눌려 있다, 라는 이미지예요.

\(3 \times 3\)의 경우는 좀 길어지지만, 제1행을 따라 전개하는 방법을 설명할게요. \(2 \times 2\)의 행렬식이 "2개의 열벡터가 이루는 평행사변형의 넓이"였던 것과 마찬가지로, \(3 \times 3\)의 행렬식은 "3개의 열벡터가 이루는 평행육면체의 부피"에 대응해요. 부피가 0이면 3개의 벡터가 같은 평면 위에 있다——즉 행렬이 3차원 공간을 2차원으로 짓누르고 있다——이므로, \(2 \times 2\) 때와 같은 논리로 역행렬이 존재하지 않아요. 계산 방법으로는, 제1행의 각 성분 \(a, b, c\)에 대해 "그 성분이 속하는 행과 열을 제외한 \(2 \times 2\) 부분 행렬의 행렬식"을 계산하고, \(+, -, +\)의 교대 부호로 곱해서 더하는 거예요. 구체적으로 쓰면:

  • \(a\)의 기여: \(a\)의 행(제1행)과 열(제1열)을 가리면 \(\begin{pmatrix} e & f \\ h & i \end{pmatrix}\)가 남는다 → \(+a(ei - fh)\)
  • \(b\)의 기여: \(b\)의 행(제1행)과 열(제2열)을 가리면 \(\begin{pmatrix} d & f \\ g & i \end{pmatrix}\)가 남는다 → \(-b(di - fg)\)
  • \(c\)의 기여: \(c\)의 행(제1행)과 열(제3열)을 가리면 \(\begin{pmatrix} d & e \\ g & h \end{pmatrix}\)가 남는다 → \(+c(dh - eg)\)

정리하면

\[\det\begin{pmatrix} a & b & c \\ d & e & f \\ g & h & i \end{pmatrix} = +a(ei - fh) - b(di - fg) + c(dh - eg)\]

부호가 \(+, -, +\)로 교대하는 것은 \((j,k)\) 성분의 부호가 \((-1)^{j+k}\)로 결정되기 때문이에요(제1행이면 \((-1)^{1+1} = +\), \((-1)^{1+2} = -\), \((-1)^{1+3} = +\)). 이 절차를 여인수 전개 (cofactor expansion)라고 불러요(「일반상대론」편의 부록 A에서도 등장했죠). 이 책에서 다루는 범위에서는 \(2 \times 2\)\(3 \times 3\)을 계산할 수 있으면 충분해요.

🟡 리나: 이 (B.38)을 특성 방정식 (characteristic equation)이라고 불러요.

🔵 카이: 음, 행렬식이 0이 아니면 안 되는 이유는……행렬식이 0이 아니면 역행렬이 존재해서, \(|a\rangle = (\hat{A} - a\hat{1})^{-1} \mathbf{0} = \mathbf{0}\)밖에 안 나오기 때문인 거죠? 그런데, 행렬식이 0이 되는 \(a\)의 값은 항상 찾을 수 있나요?

🟡 리나: 전반은 맞아요. 역행렬이 존재하면 방정식의 해가 \(\mathbf{0}\)으로 한정되어 버려요. 그래서 "0이 아닌 고유벡터가 존재"하려면 역행렬이 존재하지 않아야——즉 행렬식이 0이어야——해요. 후반 질문도 좋은 질문이에요. \(N \times N\) 행렬이면 \(\det(\hat{A} - a\hat{1}) = 0\)\(a\)\(N\)차 방정식이 되므로, 복소수 범위에서는 반드시 \(N\)개의 해(고유값)가 존재해요. 이것은 대수학의 기본정리라 불리는 수학 정리의 귀결이에요——고등학교에서 "2차 방정식은 판별식이 음수여도 복소수 범위에서는 반드시 2개의 해를 갖는다"고 배웠잖아요? 그것을 \(N\)차로 일반화한 것으로, 증명은 고급이지만 결론만 사용하면 충분해요. 즉 "\(N \times N\) 행렬에는 중복을 포함해서 반드시 \(N\)개의 고유값이 있다"고 기억해 두세요.


구체적 예: Pauli (파울리) 행렬 \(\sigma_z\)

🟡 리나: 2차원의 구체적 예로 연습해 봅시다. 제 5 장이나 제 17 장에서 등장하는 Pauli 행렬 중 하나

\[\hat{\sigma}_z \doteq \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} \tag{B.39}\]

의 고유값과 고유벡터를 구해 보세요.

🔵 카이: 특성 방정식은

\[\det\begin{pmatrix} 1 - a & 0 \\ 0 & -1 - a \end{pmatrix} = (1-a)(-1-a) = 0\]

이므로 \(a = +1\)\(a = -1\)이네요.

🔵 카이: \(a = +1\)일 때 \((\hat{\sigma}_z - \hat{1})|a\rangle = 0\)을 풀면

\[\begin{pmatrix} 0 & 0 \\ 0 & -2 \end{pmatrix} \begin{pmatrix} \xi \\ \eta \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \end{pmatrix}\]

이므로 \(\eta = 0\). 규격화하면 \(|+\rangle = \begin{pmatrix} 1 \\ 0 \end{pmatrix}\)이네요. \(a = -1\)도 같은 식으로 하면……\(\begin{pmatrix} 2 & 0 \\ 0 & 0 \end{pmatrix}\begin{pmatrix} \xi \\ \eta \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \end{pmatrix}\)이므로 \(\xi = 0\)이고 \(|-\rangle = \begin{pmatrix} 0 \\ 1 \end{pmatrix}\)이네요.

🔵 카이: 아, 두 고유벡터의 내적을 계산하면 \(\langle +|-\rangle = 1 \cdot 0 + 0 \cdot 1 = 0\)으로 직교하네요. 다른 고유값의 고유벡터는 항상 직교하나요?

🟡 리나: 좋은 관찰이에요. 사실 에르미트 행렬의 경우에는 반드시 직교한다는 것을 증명할 수 있어요. 다음 절에서 증명할게요. 그리고 이 \(|+\rangle\)\(|-\rangle\)은 스핀 1/2의 "위 방향"과 "아래 방향" 상태에 대응해요.

🔵 카이: 에르미트가 아닌 행렬이면 직교하지 않을 수도 있나요?

🟡 리나: 있어요. 에르미트가 아닌 행렬에서는 고유값이 복소수가 되기도 하고, 고유벡터가 직교하는 보장도 없어요. 그래서 "에르미트이다"라는 조건이 물리적으로 중요한 거예요. 다음 절에서 자세히 봅시다.

✅ 이해도 체크: \(N \times N\) 행렬의 고유값은 최대 몇 개인가요?

중복을 포함해서 \(N\)개. 특성 방정식이 \(a\)\(N\)차 방정식이기 때문이다.


B.6 에르미트 행렬——측정값이 실수가 되는 이유

🟡 리나: 양자역학에서 가장 중요한 행렬 클래스가 에르미트 행렬 (Hermitian matrix)이에요.

🟡 리나: 연산자 \(\hat{A}\)에르미트(또는 자기수반)라 함은,

\[\hat{A}^\dagger = \hat{A} \tag{B.40}\]

즉, 에르미트 켤레를 취해도 자기 자신으로 돌아오는 연산자예요. 행렬요소로 말하면

\[A_{jk}^* = A_{kj} \tag{B.41}\]

대각 성분은 실수, 비대각 성분은 서로 복소켤레가 돼요.

🔵 카이: 왜 에르미트 행렬이 양자역학에서 중요한 거예요?

🟡 리나: 2가지 결정적인 이유가 있어요.


정리 1: 에르미트 연산자의 고유값은 실수

🟡 리나: 증명해 봅시다. \(\hat{A}|a\rangle = a|a\rangle\)에서, 양변에 왼쪽에서 \(\langle a|\)를 곱하면:

\[\langle a|\hat{A}|a\rangle = a\langle a|a\rangle \tag{B.42}\]

한편, 에르미트 켤레의 정의 (B.30)에서 \(|\psi\rangle = |\phi\rangle = |a\rangle\)으로 놓으면((B.30)의 좌변 \(\langle\phi|\hat{A}^\dagger|\psi\rangle\)와 우변 \(\langle\psi|\hat{A}|\phi\rangle^*\) 모두에서 \(|\psi\rangle = |\phi\rangle = |a\rangle\)으로 놓는 거예요)

\[\langle a|\hat{A}^\dagger|a\rangle = \langle a|\hat{A}|a\rangle^*\]

을 얻어요. 여기서 에르미트성 \(\hat{A}^\dagger = \hat{A}\)를 좌변에 사용하면

\[\langle a|\hat{A}|a\rangle = \langle a|\hat{A}|a\rangle^* \tag{B.43}\]

따라서 \(\langle a|\hat{A}|a\rangle\)은 실수(복소켤레를 취해도 변하지 않으니까)예요. (B.42)로부터 \(\langle a|\hat{A}|a\rangle = a\langle a|a\rangle\)에서, 좌변은 실수, \(\langle a|a\rangle > 0\)도 실수이므로 \(a\)도 실수예요. \(\square\)

🔵 카이: 오오, 에르미트성을 사용하는 것만으로 고유값이 실수임을 보일 수 있군요.

🟡 리나: 즉, 측정값은 반드시 실수여야 하므로, 관측량을 나타내는 연산자는 에르미트여야 한다——이것이 에르미트성을 요청하는 물리적 이유예요.

⚪ 메이: 그렇구나, "고유값 = 측정값"이고, 에르미트이면 고유값이 실수가 되는 것이 보장된다는 논리네요.


정리 2: 다른 고유값에 속하는 고유벡터는 직교한다

🟡 리나: \(\hat{A}|a\rangle = a|a\rangle\)\(\hat{A}|a'\rangle = a'|a'\rangle\)에서 \(a \neq a'\)로 놓을게요.

\[\langle a'|\hat{A}|a\rangle = a\langle a'|a\rangle \tag{B.44}\]

한편, \(\hat{A}|a'\rangle = a'|a'\rangle\)의 양변의 에르미트 켤레를 취해요. "등식의 에르미트 켤레를 취한다"란, 양변을 내적의 "왼쪽에 놓을 수 있는 형태"——즉 브라 형태——로 고쳐 쓰는 조작이에요("켓 등식을 브라 등식으로 변환한다"라고도 해요). 규칙을 먼저 말하면, 일반적으로 등식 \(\hat{X}|\alpha\rangle = c|\beta\rangle\)의 에르미트 켤레는 \(\langle\alpha|\hat{X}^\dagger = c^*\langle\beta|\)가 돼요. 무슨 일이 일어나는지 보면: 켓 \(|\alpha\rangle\)이 브라 \(\langle\alpha|\)로, 연산자 \(\hat{X}\)에 대거 \(\dagger\)가 붙고, 스칼라 \(c\)가 복소켤레 \(c^*\)가 돼요——이것은 (B.33)과 (B.35)의 조합이에요. 직관적으로는 "내적의 좌우를 바꾸면 복소켤레가 붙는다" (B.7)의 연산자 버전이라고 생각하면 돼요.

🔵 카이: 잠깐만요. "켓 등식을 브라 등식으로 변환한다"는 건, 구체적으로 어떤 조작인 거예요? 양변을 전치하고 복소켤레를 취하는 이미지예요?

🟡 리나: 좋은 질문이에요. 행렬 표현으로 생각하면 바로 그래요——열벡터의 등식을 행벡터의 등식으로 고쳐 쓰는 건, 전치하고 복소켤레를 취하는 조작이에요. 하지만 추상적인 연산자의 언어로는 다음과 같이 확인할 수 있어요. 임의의 벡터 \(|\gamma\rangle\)과의 내적을 생각하면, \(\hat{X}|\alpha\rangle = c|\beta\rangle\)의 양변에 왼쪽에서 \(\langle\gamma|\)를 곱해 \(\langle\gamma|\hat{X}|\alpha\rangle = c\langle\gamma|\beta\rangle\). 에르미트 켤레의 정의 (B.30)에 의해 \(\langle\gamma|\hat{X}|\alpha\rangle = \langle\alpha|\hat{X}^\dagger|\gamma\rangle^*\)이므로, 복소켤레를 취하면 \(\langle\alpha|\hat{X}^\dagger|\gamma\rangle = c^*\langle\beta|\gamma\rangle\). 이것이 임의의 \(|\gamma\rangle\)에서 성립하므로 \(\langle\alpha|\hat{X}^\dagger = c^*\langle\beta|\)를 얻어요.

이것을 \(\hat{A}|a'\rangle = a'|a'\rangle\)에 적용하면 \(\langle a'|\hat{A}^\dagger = a'^*\langle a'|\)를 얻어요. 에르미트성 \(\hat{A}^\dagger = \hat{A}\)와 정리 1(\(a'\)는 실수이므로 \(a'^* = a'\))에 의해

\[\langle a'|\hat{A} = a'\langle a'|\]

이것을 오른쪽에서 \(|a\rangle\)에 작용시키면

\[\langle a'|\hat{A}|a\rangle = a'\langle a'|a\rangle \tag{B.45}\]

(B.44)와 (B.45)를 빼면

\[(a - a')\langle a'|a\rangle = 0 \tag{B.46}\]

\(a \neq a'\)이므로 \(\langle a'|a\rangle = 0\). \(\square\)

🔵 카이: 고유값이 다르면 자동으로 직교하는군요! 그러면, 같은 고유값을 가진 벡터가 여러 개 있으면 어떻게 되나요? 그것도 직교하나요?

🟡 리나: 좋은 질문이에요. 같은 고유값을 갖는 여러 개의 고유벡터——이것을 축퇴 (degeneracy)라고 불러요——는 자동으로는 직교하지 않아요. 하지만 Gram–Schmidt 직교화법을 사용하면 직교화할 수 있으므로, 최종적으로는 에르미트 연산자의 고유벡터로 정규직교기저를 구성할 수 있어요.

✅ 이해도 체크: 에르미트 연산자의 다른 고유값에 속하는 고유벡터가 직교함을 증명할 때, 핵심 단계는 무엇인가요?

\(\langle a'|\hat{A}|a\rangle\)을 2가지 방법으로 계산하고(오른쪽에 작용시켜 \(a\langle a'|a\rangle\), 왼쪽에 작용시켜 \(a'\langle a'|a\rangle\)), 차를 구하면 \((a - a')\langle a'|a\rangle = 0\)을 얻는다. \(a \neq a'\)이므로 \(\langle a'|a\rangle = 0\)(직교)이 도출된다.


정리 3(대각화): 에르미트 행렬은 유니터리 변환으로 대각화할 수 있다

🟡 리나: 에르미트 행렬 \(\hat{A}\)의 정규직교인 고유벡터 \(\{|a_1\rangle, |a_2\rangle, \ldots, |a_N\rangle\}\)를 기저로 선택하면, \(\hat{A}\)의 행렬 표현은

\[\hat{A} \doteq \begin{pmatrix} a_1 & 0 & \cdots & 0 \\ 0 & a_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_N \end{pmatrix} \tag{B.47}\]

대각 성분에 고유값이 나열돼요. 이것을 대각화 (diagonalization)라고 불러요.

🟡 리나: 양자역학에서는 이 정리를 스펙트럼 분해 (spectral decomposition)의 형태로 쓰는 경우가 많아요:

\[\hat{A} = \sum_{k=1}^{N} a_k |a_k\rangle\langle a_k| \tag{B.48}\]

완전성 관계 (B.21)의 \(|e_k\rangle\langle e_k|\) 앞에 고유값 \(a_k\)가 "가중치"로 붙은 형태예요.

⚪ 메이: 즉 연산자를 "고유값 × 사영 연산자"의 합으로 분해한 거네요.

🟡 리나: 바로 그래요. 이것이 양자역학 측정의 수학적 기반이 돼요.

✅ 이해도 체크: 에르미트 연산자의 스펙트럼 분해란 무엇인가요?

에르미트 연산자 \(\hat{A}\)\(\hat{A} = \sum_k a_k |a_k\rangle\langle a_k|\)로 쓰는 것. 고유값 \(a_k\)와 대응하는 사영 연산자 \(|a_k\rangle\langle a_k|\)의 합으로 분해하는 표현으로, 양자역학의 측정 이론의 수학적 기반이 된다.


구체적 예: Pauli 행렬은 모두 에르미트

🟡 리나: 확인해 봅시다.

\[\hat{\sigma}_x \doteq \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}, \quad \hat{\sigma}_y \doteq \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix}, \quad \hat{\sigma}_z \doteq \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} \tag{B.49}\]

🔵 카이: \(\hat{\sigma}_x\)는 전치해도 같고 성분이 실수이니까 \(\hat{\sigma}_x^\dagger = \hat{\sigma}_x\). \(\hat{\sigma}_y\)는 전치하면 \((1,2)\) 성분이 \(i\), \((2,1)\) 성분이 \(-i\)가 되지만, 추가로 복소켤레를 취하면 원래대로 돌아와요. \(\hat{\sigma}_z\)는 대각행렬이고 성분이 실수이니까 자명해요. 전부 에르미트네요.

🟡 리나: 완벽해요. 고유값은 모두 \(\pm 1\)로 실수예요. 스핀 각운동량 \(S_i = (\hbar/2)\sigma_i\)의 고유값 \(\pm\hbar/2\)가 실수인 것과 대응하고 있어요.

✅ 이해도 체크: 에르미트 연산자의 고유값이 실수임을 증명할 때 사용하는 에르미트성의 정의식은 무엇인가요?

\(\hat{A}^\dagger = \hat{A}\). 이에 의해 \(\langle a|\hat{A}|a\rangle = a\langle a|a\rangle\)의 좌변이 \(a^*\langle a|a\rangle\)으로도 쓸 수 있으므로, \(a = a^*\)(실수)가 도출된다.


B.7 유니터리 행렬——확률을 보존하는 변환

🟡 리나: 다음으로 중요한 것이 유니터리 행렬 (unitary matrix)이에요.

\[\hat{U}^\dagger \hat{U} = \hat{U}\hat{U}^\dagger = \hat{1} \tag{B.50}\]

\(\hat{U}^\dagger = \hat{U}^{-1}\)(역행렬이 에르미트 켤레와 같다).

🔵 카이: 에르미트 행렬은 \(\hat{A}^\dagger = \hat{A}\)이고, 유니터리 행렬은 \(\hat{U}^\dagger = \hat{U}^{-1}\). 비슷하지만 다르네요.

🟡 리나: 좋은 비교예요. 에르미트는 "자기 자신과 같다", 유니터리는 "역행렬과 같다". 물리적 역할도 달라요. 에르미트 연산자는 관측량을 나타내고, 유니터리 연산자는 상태의 변환(시간 발전이나 기저 변환)을 나타내요.


유니터리 변환의 중요한 성질

🟡 리나: 유니터리 변환이 물리에서 중요한 이유는, 내적을 보존하기 때문이에요.

\(|\psi'\rangle = \hat{U}|\psi\rangle\), \(|\phi'\rangle = \hat{U}|\phi\rangle\)으로 놓으면

\[\langle\phi'|\psi'\rangle = \langle\phi|\hat{U}^\dagger \hat{U}|\psi\rangle = \langle\phi|\hat{1}|\psi\rangle = \langle\phi|\psi\rangle \tag{B.51}\]

⚪ 메이: 내적이 변하지 않는다는 것은 노름도 보존된다는 거네요. \(\langle\psi'|\psi'\rangle = \langle\psi|\psi\rangle\).

🟡 리나: 맞아요. 즉 규격화 조건 \(\langle\psi|\psi\rangle = 1\)이 변환 후에도 유지돼요.

🔵 카이: 규격화가 유지되는 건 알겠는데, 그게 물리적으로는 어떤 의미가 있나요?

🟡 리나: 좋은 질문이에요. 양자역학에서는 \(|\langle\phi|\psi\rangle|^2\)가 확률과 관계돼요(자세한 건 제 5 장에서 다룰게요). 내적이 보존된다는 것은, 유니터리 변환이 확률을 보존하는 변환이라는 거예요.


기저 변환으로서의 유니터리 행렬

🟡 리나: 어떤 정규직교기저 \(\{|e_k\rangle\}\)에서 다른 정규직교기저 \(\{|e'_k\rangle\}\)로의 변환은, 유니터리 행렬 \(\hat{U}\)

\[|e'_k\rangle = \hat{U}|e_k\rangle \tag{B.52}\]

로 쓸 수 있어요. (B.52)의 에르미트 켤레를 취하면

\[\langle e'_k| = \langle e_k|\hat{U}^\dagger \tag{B.53}\]

이때, 연산자 \(\hat{A}\)의 새 기저에서의 행렬요소는

\[A'_{jk} = \langle e'_j|\hat{A}|e'_k\rangle = \langle e_j|\hat{U}^\dagger\, \hat{A}\, \hat{U}|e_k\rangle \tag{B.54}\]

여기서 (B.53)과 (B.52)를 대입했어요. 이것을 행렬의 언어로 쓰면 닮음 변환 (similarity transformation):

\[\hat{A}' \doteq \hat{U}^\dagger \hat{A}\, \hat{U} \tag{B.55}\]

예요. 여기서 \(\hat{A}'\)는 연산자 \(\hat{A}\)의 새 기저 \(\{|e'_k\rangle\}\)에서의 행렬 표현을 의미해요.

🔵 카이: 연산자를 다른 기저에서 보려면, 양쪽에서 유니터리 행렬로 끼우는 거군요.

🟡 리나: 닮음 변환에서 변하지 않는 양이 있어요. 대각합 (trace, 대각 성분의 합)과 행렬식 (determinant), 그리고 고유값이에요.

\[\mathrm{tr}(\hat{A}') = \mathrm{tr}(\hat{A}), \qquad \det(\hat{A}') = \det(\hat{A}) \tag{B.56}\]

🔵 카이: 고유값이 기저에 의존하지 않는 건 안심이 되네요. 측정값이 좌표계 선택에 따라 바뀌면 곤란하니까요.

🟡 리나: 맞아요. 물리량의 측정 결과는 관측자의 "기저 선택"에 의존하지 않는다——이것이 유니터리 변환의 물리적 의미예요.

✅ 이해도 체크: 유니터리 변환(닮음 변환)에서 변하지 않는 행렬의 양 3가지를 들어보세요.

대각합(대각 성분의 합), 행렬식, 고유값. 이것들은 기저 선택에 의존하지 않는 불변량으로, 물리량의 측정 결과가 관측자의 기저 선택에 의존하지 않음을 보장한다.


구체적 예: \(S_z\) 기저에서 \(S_x\) 기저로의 변환

🟡 리나: 제 5 장에서 다룰 스핀의 예를 미리 살펴볼게요. \(S_z\)의 고유벡터 \(|+\rangle = \begin{pmatrix} 1 \\ 0 \end{pmatrix}\), \(|-\rangle = \begin{pmatrix} 0 \\ 1 \end{pmatrix}\)에서 \(S_x\)의 고유벡터

\[|+\rangle_x = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix}, \quad |-\rangle_x = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ -1 \end{pmatrix}\]

로의 변환 행렬은

\[\hat{U} = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix} \tag{B.57}\]

🔵 카이: 확인해 볼게요. 성분이 전부 실수이니까 복소켤레를 취해도 변하지 않죠. 그리고 행과 열을 바꿔도 같은 형태니까……\(\hat{U}^\dagger = \hat{U}\)라는 거예요?

🟡 리나: 그래요. 이 행렬은 실수 성분이고, 또한 행과 열을 바꿔도 같은 형태(대칭행렬)이므로 \(\hat{U}^\dagger = \hat{U}\)예요. 따라서 유니터리 조건 \(\hat{U}^\dagger \hat{U} = \hat{1}\)\(\hat{U}^2 = \hat{1}\)과 같은 것이 돼요. 실제로 계산하면 \(\frac{1}{2}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix} = \frac{1}{2}\begin{pmatrix} 2 & 0 \\ 0 & 2 \end{pmatrix} = \hat{1}\). 확실히 유니터리예요.

⚪ 메이: 제곱하면 단위행렬로 돌아간다는 건, 2번 변환하면 원래로 돌아간다는 거네요.

🟡 리나: 참고로, 이 행렬은 우연히 에르미트이면서 유니터리라는 특수한 케이스예요. 일반적인 유니터리 행렬은 \(\hat{U}^\dagger \neq \hat{U}\)인 경우가 많으니까, "유니터리 = 에르미트"라고 생각하면 안 돼요. 그리고 에르미트이면서 유니터리라는 것은, 2번 작용시키면 원래로 돌아오는 변환이기도 해요.

🔵 카이: \(\hat{U}|+\rangle = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 \\ 1 \end{pmatrix} = |+\rangle_x\)도 맞네요. 그런데, 왜 "열벡터로 새 기저를 나열하면" 변환 행렬이 되는 거예요?

🟡 리나: 좋은 질문이에요. 행렬과 벡터의 곱을 떠올려 봐요. 행렬 \(\hat{U}\)\(|e_1\rangle = \begin{pmatrix} 1 \\ 0 \end{pmatrix}\)를 곱하면, 결과는 \(\hat{U}\)제1열 그 자체가 되잖아요? 마찬가지로 \(|e_2\rangle = \begin{pmatrix} 0 \\ 1 \end{pmatrix}\)를 곱하면 제2열이 나와요. 따라서 \(\hat{U}|e_k\rangle = |e'_k\rangle\)이라는 정의 (B.52)는, "\(\hat{U}\)의 제 \(k\) 열 = 새 기저의 제 \(k\) 벡터 \(|e'_k\rangle\)의 성분"이라는 거예요. 즉 열벡터로 새 기저가 나열되는 거예요.

🔵 카이: 아, 그렇구나. \(\begin{pmatrix} 1 \\ 0 \end{pmatrix}\)를 곱하면 제1열만 "선택"되니까, 열에 변환 후 기저가 들어 있는 거군요.

✅ 이해도 체크: 유니터리 변환이 "확률을 보존한다"란 어떤 뜻인가요?

유니터리 변환은 내적을 보존한다(\(\langle\phi'|\psi'\rangle = \langle\phi|\psi\rangle\)). 양자역학에서는 \(|\langle\phi|\psi\rangle|^2\)가 전이 확률에 대응하므로, 유니터리 변환 전후로 확률이 변하지 않는다.

📝 연습문제:

  • 식 (B.57)의 \(\hat{U}\)를 사용하여 \(\hat{U}^\dagger \hat{\sigma}_x \hat{U}\)를 계산하고, 결과가 대각행렬 \(\begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}\)이 됨을 확인하시오(힌트: 이 \(\hat{U}\)\(\hat{U} = \hat{U}^\dagger = \hat{U}^{-1}\)을 만족한다. \(\hat{U}\)의 열벡터는 \(\hat{\sigma}_x\)의 고유벡터이므로, \(\hat{U}^\dagger \hat{\sigma}_x \hat{U}\)\(\hat{\sigma}_x\)를 고유기저에서 표현한 행렬——즉 고유값 \(+1, -1\)이 대각에 나열된 행렬——을 준다) → 문제 A-1. 유니타리 행렬에 의한 기저 변환과 행렬 표현의 변환 법칙

B.8 텐서곱——2개의 계를 합친다

🟡 리나: 양자역학에서는, 2개의 독립적인 계를 합친 "복합계"를 다루는 경우가 많아요. 예를 들어 2개 전자의 스핀이나, 입자의 위치와 스핀. 이때 사용하는 것이 텐서곱 (tensor product)이에요.

🔵 카이: 텐서곱이 뭐예요?

🟡 리나: 직관적으로 말하면, "계 1의 상태"와 "계 2의 상태"를 쌍으로 묶어 하나의 상태로 간주하는 조작이에요. 예를 들어 동전의 앞뒤(2가지)와 주사위의 눈(6가지)을 동시에 고려하면, 조합은 \(2 \times 6 = 12\)가지가 되잖아요? 텐서곱은 이 "조합"을 벡터 공간의 언어로 정식화한 거예요.

⚪ 메이: 조합의 수가 곱셈이 되는 거네요.

🟡 리나: 수학적으로 쓰면, 계 1의 상태가 사는 벡터 공간(내적 포함——이것을 Hilbert 공간이라고 불러요, B.9에서 다시 정의할게요. 지금은 "내적이 정의된 벡터 공간"이라고 생각해 두세요)을 \(\mathcal{H}_1\)(차원 \(N_1\))로 쓸게요. \(\mathcal{H}\)는 Hilbert 공간을 나타내는 표준적인 기호예요. 마찬가지로 계 2의 것을 \(\mathcal{H}_2\)(차원 \(N_2\))로 해요. 복합계의 Hilbert 공간은

\[\mathcal{H} = \mathcal{H}_1 \otimes \mathcal{H}_2 \tag{B.58}\]

로 쓰고, 차원은 \(N_1 \times N_2\)가 돼요. 기호 \(\otimes\)는 "텐서곱"을 나타내요.

🟡 리나: 계 1이 상태 \(|\psi\rangle \in \mathcal{H}_1\), 계 2가 상태 \(|\phi\rangle \in \mathcal{H}_2\)일 때, 복합계의 상태는

\[|\psi\rangle \otimes |\phi\rangle \tag{B.59}\]

로 써요. 줄여서 \(|\psi\rangle|\phi\rangle\)이나 \(|\psi, \phi\rangle\)로도 써요.


텐서곱의 계산 규칙

🟡 리나: 텐서곱은 다음 규칙을 따라요.

(1) 선형성:

\[(c_1|\psi_1\rangle + c_2|\psi_2\rangle) \otimes |\phi\rangle = c_1|\psi_1\rangle \otimes |\phi\rangle + c_2|\psi_2\rangle \otimes |\phi\rangle \tag{B.60}\]
\[|\psi\rangle \otimes (c_1|\phi_1\rangle + c_2|\phi_2\rangle) = c_1|\psi\rangle \otimes |\phi_1\rangle + c_2|\psi\rangle \otimes |\phi_2\rangle \tag{B.61}\]

(2) 내적:

\[\bigl(\langle\psi'| \otimes \langle\phi'|\bigr)\bigl(|\psi\rangle \otimes |\phi\rangle\bigr) = \langle\psi'|\psi\rangle \cdot \langle\phi'|\phi\rangle \tag{B.62}\]

각 계의 내적을 따로 계산해서 곱하면 돼요.


행렬의 텐서곱(Kronecker 곱)

🟡 리나: 행렬 표현에서는, 텐서곱은 Kronecker (크로네커) 곱으로 나타내요. \(m \times n\) 행렬 \(A\)\(p \times q\) 행렬 \(B\)의 Kronecker 곱은 \(mp \times nq\) 행렬:

\[A \otimes B = \begin{pmatrix} A_{11}B & A_{12}B & \cdots \\ A_{21}B & A_{22}B & \cdots \\ \vdots & \vdots & \ddots \end{pmatrix} \tag{B.63}\]

🟡 리나: 구체적 예를 봅시다. \(\mathcal{H}_1 = \mathcal{H}_2 = \mathbb{C}^2\)

\[|+\rangle \otimes |+\rangle = \begin{pmatrix} 1 \\ 0 \end{pmatrix} \otimes \begin{pmatrix} 1 \\ 0 \end{pmatrix} = \begin{pmatrix} 1 \cdot \begin{pmatrix} 1 \\ 0 \end{pmatrix} \\[6pt] 0 \cdot \begin{pmatrix} 1 \\ 0 \end{pmatrix} \end{pmatrix} = \begin{pmatrix} 1 \\ 0 \\ 0 \\ 0 \end{pmatrix} \tag{B.64}\]

🔵 카이: 2차원 × 2차원 = 4차원이 되는 거군요.

⚪ 메이: 2개의 스핀 1/2 계를 합치면 4차원 공간이 되는 거네요.


얽힘 상태

🟡 리나: 텐서곱 공간 안에는 \(|\psi\rangle \otimes |\phi\rangle\) 형태로 쓸 수 없는 벡터가 존재해요. 예를 들어

\[|\Psi\rangle = \frac{1}{\sqrt{2}}\bigl(|+\rangle \otimes |-\rangle - |-\rangle \otimes |+\rangle\bigr) \tag{B.65}\]

🔵 카이: 이건 \(|\psi\rangle \otimes |\phi\rangle\) 형태로 분해할 수 없나요?

🟡 리나: 할 수 없어요. 귀류법으로 보여줄게요. 만약 \(|\Psi\rangle = (a|+\rangle + b|-\rangle) \otimes (c|+\rangle + d|-\rangle)\)로 쓸 수 있다고 가정해요. 전개하면

\[ac|+\rangle|+\rangle + ad|+\rangle|-\rangle + bc|-\rangle|+\rangle + bd|-\rangle|-\rangle\]

(B.65)와 계수를 비교해 보세요.

🔵 카이: 음, \(|+\rangle|+\rangle\)의 계수는 (B.65)에서 0이니까 \(ac = 0\). \(|+\rangle|-\rangle\)의 계수는 \(1/\sqrt{2}\)이니까 \(ad = 1/\sqrt{2}\). \(|-\rangle|+\rangle\)\(-1/\sqrt{2}\)이니까 \(bc = -1/\sqrt{2}\). \(|-\rangle|-\rangle\)은 0이니까 \(bd = 0\).

🔵 카이: \(ac = 0\)이니까 \(a = 0\)이거나 \(c = 0\)이잖아요. 그런데 \(a = 0\)이면 \(ad = 0\)이 되어 \(1/\sqrt{2}\)과 안 맞고……\(c = 0\)이어도 \(bc = 0\)이 되어 \(-1/\sqrt{2}\)과 안 맞고……어라, 어느 쪽이든 모순이 되네요?

🟡 리나: 맞아요. 어느 경우든 모순이 생기므로 텐서곱 형태로는 쓸 수 없다——즉 얽힘 상태예요. "각 부분계에 독립적인 상태를 할당할 수 없다"는 것이 얽힘의 본질이에요.

⚪ 메이: 귀류법으로 "분해할 수 있다고 가정하면 반드시 모순이 생긴다"는 것을 보인 거네요.

🟡 리나: 이처럼, 텐서곱 형태로 분해할 수 없는 상태를 얽힘 상태 (entangled state)라고 불러요. 제23–24장에서 자세히 다루겠지만, 양자역학의 가장 놀라운 특징 중 하나예요.

✅ 이해도 체크: 얽힘 상태란 어떤 상태인가요?

복합계의 상태 벡터가, 각 부분계의 상태 벡터의 텐서곱 \(|\psi\rangle \otimes |\phi\rangle\) 형태로 분해할 수 없는 상태를 말한다. 예를 들어 \(\frac{1}{\sqrt{2}}(|+\rangle \otimes |-\rangle - |-\rangle \otimes |+\rangle)\)은 얽힘 상태이다.

✅ 이해도 체크: 2개의 2차원 Hilbert 공간의 텐서곱 공간의 차원은 몇인가요?

\(2 \times 2 = 4\) 차원.

📝 연습문제:


B.9 무한차원 Hilbert 공간으로의 확장——함수도 벡터가 된다

🟡 리나: 여기까지 유한차원 \(\mathbb{C}^N\)에서 이야기를 진행했지만, 파동함수를 다루는 제 7 장 이후에서는 무한차원의 Hilbert 공간이 필요해요. 여기서 다시 정의해 둘게요. Hilbert 공간이란 "내적이 정의되어 있고, 또한 완비인 벡터 공간"이에요.

🔵 카이: "완비"가 뭐예요?

🟡 리나: 직관적으로 말하면, "한없이 가까워지는 점열의 도착점이, 확실히 그 공간 안에 있다"는 거예요. 예를 들어 유리수 열 \(1, 1.4, 1.41, 1.414, \ldots\)\(\sqrt{2}\)에 가까워지지만, \(\sqrt{2}\)는 유리수가 아니므로 유리수 집합은 "완비가 아니"에요. 실수 집합이라면 \(\sqrt{2}\)도 포함되므로 완비예요. 벡터 공간에서도 마찬가지로, "점점 가까워지는 벡터 열의 극한이 확실히 그 공간에 들어 있다"는 것을 완비성이라고 불러요. 유한차원의 \(\mathbb{C}^N\)은 자동으로 완비이므로, B.2에서 내적을 정의한 시점에서 이미 Hilbert 공간이었어요. 무한차원에서는 "완비인지 아닌지"가 비자명하지만, \(L^2\)는 완비임이 증명되어 있으므로 Hilbert 공간이에요.

⚪ 메이: 유한차원이면 자동으로 완비이지만, 무한차원에서는 증명이 필요하다——여기가 미묘한 점이네요.

🟡 리나: 마지막으로, 유한차원에서 무한차원으로 이행할 때 "무엇이 달라지는가"를 정리해 둘게요.


함수공간 \(L^2\)는 Hilbert 공간

🟡 리나: B.1에서 다뤘던 제곱적분 가능 함수의 공간 \(L^2\)를 다시 Hilbert 공간으로 정식화할게요.

두 함수 \(f(x)\)\(g(x)\)의 내적을

\[\langle f|g\rangle = \int_{-\infty}^{\infty} f(x)^* g(x)\, dx \tag{B.66}\]

으로 정의해요. 이것은 (B.6)–(B.8)의 3가지 성질을 모두 만족해요.

🔵 카이: 유한차원의 \(\sum_k z_k^* z'_k\)\(\int f^* g\, dx\)로 치환된 것뿐이네요.

🟡 리나: 그 직관은 맞아요. 합 \(\sum\)이 적분 \(\int\)으로, 성분 \(z_k\)가 함수값 \(f(x)\)에 대응해요. 하지만 이 "치환"에 의해 몇 가지 미묘한 문제가 발생해요.


유한차원과 무한차원의 대응표

🟡 리나: 대응 관계를 표로 정리할게요.

표 B.2: 유한차원과 무한차원의 대응 관계

유한차원 \(\mathbb{C}^N\) 무한차원 \(L^2\)
벡터 \(\lvert\psi\rangle = \sum_k c_k \lvert e_k\rangle\) 함수 \(f(x) = \sum_n c_n f_n(x)\) 또는 \(\int c(k) f_k(x)\, dk\)
성분 \(c_k = \langle e_k\lvert\psi\rangle\) 전개계수 \(c_n = \langle f_n\lvert f\rangle = \int f_n^* f\, dx\)
내적 \(\sum_k z_k^* z'_k\) 내적 \(\int f^* g\, dx\)
Kronecker 델타 \(\delta_{jk}\) Dirac의 델타 함수 \(\delta(x - x')\)
완전성 \(\sum_k \lvert e_k\rangle\langle e_k\rvert = \hat{1}\) 완전성 \(\sum_n \lvert f_n\rangle\langle f_n\rvert = \hat{1}\) 또는 \(\int \lvert x\rangle\langle x\rvert\, dx = \hat{1}\)
행렬 \(A_{jk}\) 적분핵 \(A(x, x')\)

주의점 1: 이산 스펙트럼과 연속 스펙트럼

🟡 리나: 유한차원에서는 고유값이 반드시 이산적(띄엄띄엄한 값)이었지만, 무한차원에서는 연속 스펙트럼이 나타날 수 있어요.

🔵 카이: 연속 스펙트럼이 뭐예요?

🟡 리나: 예를 들어 자유 입자의 운동량 연산자 \(\hat{p} = -i\hbar\, d/dx\)의 고유값은 임의의 실수 \(p\)를 취해요. 띄엄띄엄이 아니라 연속적이에요. 고유값 방정식 \(\hat{p}\,f_p(x) = p\,f_p(x)\)를 쓰면 \(-i\hbar\, df_p/dx = p\,f_p\), 즉 \(df_p/dx = (ip/\hbar)\,f_p\)예요. 이것은 "미분하면 자기 자신의 상수배가 되는 함수는 무엇인가?"라는 물음이에요. 고등학교에서 \(e^x\)를 미분하면 \(e^x\) 자신이 된다고 배웠잖아요. 일반적으로 \(e^{\alpha x}\)를 미분하면 \(\alpha e^{\alpha x}\)——즉 자기 자신의 \(\alpha\)배가 돼요. 그리고 "미분하면 자기 자신의 상수배가 되는 함수"는 지수함수밖에 없다는 것을 증명할 수 있어요. 따라서 \(df_p/dx = (ip/\hbar)f_p\)의 해는 \(f_p(x) \propto e^{ipx/\hbar}\)밖에 없어요.

🔵 카이: 에, 그러면 고유함수가 \(e^{ipx/\hbar}\)이고, \(p\)는 임의의 실수라는 거예요? 그건 무한히 퍼져 있는 파잖아요?

🟡 리나: 그래요. 규격화 상수는 델타 함수 규격화 (B.68)가 성립하도록 선택해야 해요. 결과만 쓰면

\[f_p(x) = \frac{1}{\sqrt{2\pi\hbar}}\, e^{ipx/\hbar} \tag{B.67}\]

예요. 이 함수는 보통 의미로는 규격화할 수 없어요(\(\int |f_p|^2\, dx = \infty\)). 대신 Dirac (디랙)의 델타 함수 \(\delta(p - p')\)를 사용한 델타 함수 규격화를 이용해요. 델타 함수란, 직관적으로는 "\(x = 0\)에서만 무한대로 날카로운 피크를 갖고 그 외에서는 0"인 특수한 함수로, \(\int_{-\infty}^{\infty} \delta(x)\, dx = 1\)을 만족하는 것——Kronecker 델타 \(\delta_{jk}\)의 연속 버전이라고 생각하면 돼요. 이미지로는, 폭 \(\epsilon\)에 높이 \(1/\epsilon\)인 직사각형을 생각해 봐요. 면적은 항상 1이지만, \(\epsilon \to 0\)으로 하면 폭이 0으로 찌그러지고 높이가 무한대로 늘어나요——그 극한이 델타 함수예요. \(\delta(p - p')\)는 "\(p = p'\)에서만 피크를 갖는" 버전이에요.

중요한 것은, 델타 함수의 본질적인 사용법은 "적분 안에서 다른 함수와 곱해서 사용한다"는 거예요. \(\int f(x)\,\delta(x - a)\,dx = f(a)\)——즉 "델타 함수는 적분 안에서 함수의 값을 \(x = a\)에서 뽑아낸다"는 거예요. 이것이 Kronecker 델타 \(\sum_k f_k\,\delta_{jk} = f_j\)의 연속 버전이에요. 엄밀한 정의는 부록 C에서 다루지만, 지금은 "\(p = p'\)이면 1에 해당하고, \(p \neq p'\)이면 0에 해당한다"는 이산 경우와의 유추로 이해해 두세요. 델타 함수 규격화란

\[\langle f_{p'}|f_p\rangle = \delta(p - p') \tag{B.68}\]

로 쓰이는 조건이에요. 이산 기저의 \(\langle e_j|e_k\rangle = \delta_{jk}\)에 대응하는 연속 버전이에요. "규격화"라고 하면서 \(p = p'\)일 때 \(\delta(0) = \infty\)가 되는 것은 이상하게 느낄 수 있지만, 이것은 "노름이 1"이라는 의미의 규격화가 아니라, "다른 고유값의 고유함수가 직교한다"는 것과 "같은 고유값의 고유함수끼리의 겹침 크기가 일정한 규약으로 맞춰져 있다"는 것을 나타내는 조건이에요. 이산 경우의 \(\delta_{jk}\)가 "\(j = k\)이면 1, \(j \neq k\)이면 0"이었던 것과 같은 역할을, 연속 경우에 \(\delta(p - p')\)가 하고 있는 거예요. 그리고 규격화 상수 \(1/\sqrt{2\pi\hbar}\)는, 이 (B.68)이 정확히 성립하도록 선택된 값이에요. 왜 이 값이 되는지는 부록 C에서 Fourier 변환을 배우면 자연스럽게 도출할 수 있어요.

🔵 카이: 음, "이 상수로 (B.68)이 성립한다"고 말씀하셔도, 실제로 \(\int f_{p'}^* f_p\, dx\)를 계산해서 \(\delta(p - p')\)가 나오는 걸 보지 않으면 찝찝한데요……

🟡 리나: 그 기분 잘 알아요. 실제 계산에는 Fourier 변환 공식이 필요하고, 그건 부록 C에서 정비해요. 거기서 "다른 운동량의 평면파를 곱해서 전 공간에서 적분하면 델타 함수가 나온다"는 항등식을 도출하니까, 그것을 사용하면 (B.68)을 확인할 수 있어요. 지금은 "검증은 Appendix C로 미룬다"고 생각해 두세요.

🔵 카이: 알겠어요. 계산으로 확인할 수 있다니 안심이에요.

⚪ 메이: 이산 스펙트럼에서는 Kronecker 델타 \(\delta_{jk}\), 연속 스펙트럼에서는 Dirac 델타 \(\delta(p - p')\). 합 \(\sum\)이 적분 \(\int\)으로 치환되는 것과 같은 패턴이네요.


주의점 2: 고유함수계의 완전성

🟡 리나: 유한차원에서는, 에르미트 행렬의 고유벡터가 완전계를 이룬다는 것을 정리로 증명할 수 있어요. 하지만 무한차원에서는, 이것이 일반적으로는 증명할 수 없어요.

🔵 카이: 왜 무한차원이면 증명할 수 없게 되나요?

🟡 리나: 직관적으로 말하면, 유한차원에서는 특성 방정식이 \(a\)\(N\)차 방정식이 되잖아요? 복소수 범위에서 \(N\)차 방정식은 반드시 \(N\)개의 근을 가져요——이것은 "대수학의 기본정리"라 불리는 수학 정리예요. 고등학교에서 "2차 방정식은 근의 공식으로 반드시 2개의 해를 구할 수 있다"고 배운 것을, \(N\)차로 일반화한 것이라고 생각하면 돼요. 에르미트 행렬의 경우는, 나아가 "고유벡터가 정규직교 완전계를 이룬다"는 것이 보장돼요(B.6의 정리 3에서 봤죠). 그래서 유한차원의 에르미트 행렬에서는 완전성이 자동으로 성립하는 거예요.

🔵 카이: 그렇구나, 유한차원에서는 "\(N\)차 방정식에 \(N\)개의 해"로 전부 찾을 수 있어서 괜찮았군요.

🟡 리나: 하지만 무한차원에서는 "몇 차 방정식"이라는 개념 자체가 없어지고, 연산자의 정의역 문제도 있어서, 고유벡터가 공간 전체를 펼치는지 여부는 연산자마다 개별적으로 조사해야 해요. 물리에서 등장하는 "좋은" 연산자에 대해서는 성립하는 경우가 많지만, 일반론으로서는 보장되지 않아요.

🔵 카이: 그러면 어떻게 하나요?

🟡 리나: 양자역학에서는, 관측량에 대응하는 에르미트 연산자의 고유함수는 완전계를 이룬다는 것을 공리(요청)로 채택해요. 이것은 수학적으로 증명하는 대상이 아니라, 물리 모델의 출발점으로 받아들이는 가정이에요.

⚪ 메이: 유한차원에서는 정리로 증명할 수 있었던 것이, 무한차원에서는 공리로 요청해야 한다——그만큼 무한차원은 다루기가 어렵다는 거네요.

✅ 이해도 체크: 무한차원 Hilbert 공간에서 에르미트 연산자의 고유함수가 완전계를 이루는 것은 어떻게 보장되나요?

유한차원과 달리 일반적으로는 수학적으로 증명할 수 없다. 양자역학에서는 "관측량에 대응하는 에르미트 연산자의 고유함수는 완전계를 이룬다"는 것을 공리(요청)로 채택한다.


주의점 3: 연산자의 정의역

🟡 리나: 무한차원에서는, 연산자가 "모든 벡터에 작용할 수 있다"고 할 수 없어요. 예를 들어 미분 연산자 \(\hat{p} = -i\hbar\, d/dx\)는 미분 가능하지 않은 함수에는 작용할 수 없어요. 연산자가 작용할 수 있는 벡터의 집합을 정의역 (domain)이라고 불러요.

🔵 카이: 유한차원에서는 신경 쓰지 않아도 됐나요?

🟡 리나: 유한차원에서는 행렬이 모든 벡터에 작용할 수 있으므로, 정의역 문제는 발생하지 않아요. 하지만 무한차원에서는, 연산자가 "에르미트인지 아닌지"를 판정할 때 정의역을 신중하게 지정해야 해요. 엄밀히 말하면, 자기수반 (self-adjoint)과 에르미트 (Hermitian)는 무한차원에서는 서로 다른 개념으로, 물리적으로 올바른 것은 자기수반 쪽이에요.

🔵 카이: 그러면 이 책에서는 어느 쪽을 사용하나요?

🟡 리나: 많은 물리 교과서와 마찬가지로, 「양자역학」편에서도 통상적인 물리 계산에서 문제가 되지 않는 범위에서는 "에르미트"와 "자기수반"을 구별하지 않고 사용해요. 다만, 이런 미묘한 점이 있다는 것은 머릿속 한구석에 넣어 두세요.


정리: 유한차원에서 배운 것은 무한차원에서도 사용할 수 있다

🟡 리나: 안심해도 되는 것은, 유한차원에서 배운 개념들——내적, 정규직교기저, 완전성 관계, 에르미트 연산자, 유니터리 연산자——이 무한차원에서도 기본적으로 같은 형태로 사용할 수 있다는 거예요. 차이점은

  1. \(\sum\)이 적분 \(\int\)으로 치환되는 경우가 있다
  2. 연속 스펙트럼에서는 델타 함수 규격화를 사용한다
  3. 연산자의 정의역에 주의가 필요하다

이 3가지를 의식해 두면, 제 7 장 이후의 파동함수 논의에 매끄럽게 들어갈 수 있어요.

🔵 카이: 3가지만 조심하면 된다니, 어떻게든 될 것 같아요.

✅ 이해도 체크: 유한차원 Hilbert 공간과 무한차원 Hilbert 공간의 가장 큰 차이는 무엇인가요? 3가지를 들어보세요.

(1) 이산 스펙트럼뿐만 아니라 연속 스펙트럼이 나타날 수 있다. (2) 연속 스펙트럼의 고유함수는 보통 의미로 규격화할 수 없으며, Dirac 델타 함수를 사용한 델타 함수 규격화를 이용한다. (3) 연산자의 정의역에 주의가 필요하며, "에르미트"와 "자기수반"의 구별이 생길 수 있다.


이 Appendix의 정리

🟡 리나: 이 Appendix에서 다룬 내용을, 양자역학과의 대응으로 정리해 둘게요.

표 B.3: 수학 개념과 양자역학의 대응 정리

수학 개념 양자역학에서의 역할 등장하는 장
복소 벡터 공간 양자 상태가 사는 공간 제 4 장
내적 \(\langle\phi\lvert\psi\rangle\) 확률진폭 제 4 장
정규직교기저 측정의 기저 제 5 장
완전성 관계 상태의 전개, 확률의 합이 1 제 5 장
에르미트 연산자 관측량(위치, 운동량, 에너지 등) 제 8 장, 제 11 장
고유값·고유벡터 측정값·측정 후의 상태 제 5 장, 제 12 장
유니터리 연산자 시간 발전, 기저 변환 제 6 장, 제 13 장
텐서곱 복합계의 상태 공간 제 18 장, 제 23 장제 24 장

🔵 카이: 전부 연결되어 있군요.

🟡 리나: 그래요. 선형대수는 양자역학의 "문법"이에요. 이 Appendix의 내용을 참조하면서 본편을 읽어 나가세요.


다음 장 예고

🟡 리나: 부록 C에서는, Fourier 해석과 \(\delta\) 함수를 다룰게요. 이 Appendix에서 "합 \(\sum\)이 적분 \(\int\)으로 치환된다"고 했는데, 그 구체적인 메커니즘이 Fourier 변환이에요. 연속 스펙트럼의 고유함수 전개나, 운동량 표현과 위치 표현의 가교에 불가결한 도구를 정비할게요.

🔵 카이: 델타 함수의 정체도 알 수 있나요?

🟡 리나: 알 수 있어요. 델타 함수는 "보통 함수가 아니"지만, Fourier 변환의 언어로 자연스럽게 이해할 수 있어요. 기대해 주세요.

연습문제

📝 연습문제:


참고문헌

  • J. J. Sakurai, J. Napolitano, Modern Quantum Mechanics (3rd ed.), Cambridge University Press — Ch.1의 수학적 틀 부분. Dirac 표기법, 연산자, 고유값 문제, 기저 변환의 정식화를 참조했다.
  • D. J. Griffiths, D. F. Schroeter, Introduction to Quantum Mechanics (3rd ed.), Cambridge University Press — Ch.3(형식론)의 Hilbert 공간 정의, 에르미트 연산자 정리의 증명, 연속 스펙트럼의 취급을 참조했다.
  • 清水明『新版 量子論の基礎——その本質のやさしい理解のために』サイエンス社 — Ch.3의 복소 Hilbert 공간 구성, 내적의 공리, Pauli 행렬의 고유값 문제, 사선의 개념을 참조했다.