콘텐츠로 이동

Appendix D 군론과 대칭성의 기초


이전 줄거리: 부록 C 에서는 텐서와 미분기하학의 기초를 배웠다. 계량 텐서, 공변 미분, 곡률 텐서라는 도구들은 시공간의 기하학적 구조를 기술하기 위한 것이었다. 그러나 물리학에는 기하학뿐 아니라 「대칭성」이라는 또 하나의 강력한 원리가 있다. 표준모형의 힘은 모두 게이지 대칭성에서 태어나고, 끈이론에서도 Virasoro 대수나 초대칭성이 본질적인 역할을 한다. 대칭성을 수학적으로 다루는 언어——군론——을 여기서 정비하자.

이 장의 목표

  • 「대칭성」을 수학적으로 기술하는 도구인 군론의 기초를, 정삼각형의 회전이라는 구체적인 예에서 출발하여 이해한다
  • 군의 정의, Lie 군(\(U(1)\), \(SU(2)\), \(SU(3)\)), Lie 대수와 생성원의 교환 관계, 표현의 개념, Noether의 정리, 게이지 대칭성과 공변 미분, 대칭성의 자발적 깨짐까지를 한 번에 다룬다
  • 이를 통해 제 9 장(표준모형의 게이지 군), 제 16 장(Virasoro 대수), 제 17 장(초대칭성)의 논의를 수학적으로 따라갈 수 있게 된다

🟡 리나: 제 9 장에서 「\(SU(3) \times SU(2) \times U(1)\)」이 나왔을 때 「그게 뭐지?」라고 생각한 사람은 여기부터 읽어 봐. 정삼각형의 회전이라는 친숙한 예에서 시작하니까, 긴장하지 않아도 괜찮아요.


D.1 왜 군론을 배우는가 — 대칭성은 물리의 언어

🟡 리나: 물리학에서 대칭성의 역할은 압도적으로 커요. 제 2 장에서 Maxwell이 전기와 자기를 통일한 이야기를 떠올려 봐. 제 9 장에서는 표준모형의 3가지 힘이 「게이지 대칭성」에서 태어나는 것을 봤잖아요.

🔵 카이: 대칭성을 「요구하는」 것만으로 힘의 형태가 결정된다니, 대단한 이야기인데. 그런데 「대칭성」이 구체적으로 뭐야? 「예쁜 모양」 정도의 의미?

🟡 리나: 좋은 질문이야. 직관적으로는 「어떤 조작을 해도 물리가 변하지 않는다」는 것이에요. 하지만 「변하지 않는다」를 정확하게 정의하려면 수학적인 언어가 필요해요. 그것이 바로 군론(group theory)이에요.

⚪ 메이: 즉, 대칭성을 「감각」이 아니라 「수식」으로 다루기 위한 도구라는 뜻이네요.

🟡 리나: 맞아요. 그리고 군론을 사용하면 다음과 같은 것이 가능해져요:

  1. 대칭성으로부터 보존법칙을 도출한다(Noether의 정리)
  2. 대칭성으로부터 힘의 형태를 결정한다(게이지 원리)
  3. 입자를 대칭성으로 분류한다(표현론)
  4. 대칭성이 깨지는 메커니즘을 기술한다(자발적 대칭성 깨짐)

🔵 카이: 4가지나 있어? 대칭성이 그렇게 만능인 거야……?

🟡 리나: 끈이론에서도 Virasoro 대수(제 16 장), 초대칭성 대수(제 17 장), 쌍대성 군(제 18 장)과, 군론은 곳곳에 등장해요.

✅ 이해도 체크: 군론을 사용함으로써 가능해지는 것을 2가지 들어 보세요.

예를 들어, (1) 대칭성으로부터 보존법칙을 도출한다(Noether의 정리), (2) 대칭성으로부터 힘의 형태를 결정한다(게이지 원리). 그 외에 「입자를 대칭성으로 분류한다(표현론)」「대칭성이 깨지는 메커니즘을 기술한다(자발적 대칭성 깨짐)」도 정답.

✅ 이해도 체크: 대칭성을 수학적으로 기술하기 위한 언어(도구)는 무엇이라 불리나요?

군론(group theory).


D.2 군이란 무엇인가 — 「조작의 모임」

먼저 구체적인 예에서 — 정삼각형의 회전

🟡 리나: 갑자기 정의를 봐도 잡히지 않으니까, 구체적인 예에서 시작하자.

정삼각형을 중심을 축으로 회전시킨다(그림 D.1「정삼각형의 회전 대칭성」). 삼각형이 「원래와 같아 보이는」 회전은 몇 가지가 있을까?

정삼각형의 회전 대칭성

그림 D.1: 정삼각형의 회전 대칭성. 그림 D_1: 정삼각형을 중심축 주위로 회전시켰을 때, 원래와 같아 보이는 조작은 \(e\)(0°), \(r\)(120°), \(r^2\)(240°)의 3가지.

  • 회전하지 않음(0°)——이것을 \(e\)라고 쓴다
  • 120° 회전——이것을 \(r\)이라고 쓴다
  • 240° 회전(= 120°를 2번)——이것을 \(r^2\)이라고 쓴다

360° 회전은 원래대로 돌아오므로 \(e\)와 같다. 즉 「삼각형을 원래와 같아 보이게 하는 회전」은 \(\{e, r, r^2\}\)의 3가지.

🔵 카이: 3가지밖에 없어? 원이면 무한히 있을 텐데.

🟡 리나: 맞아, 그것이 「이산군」과 「연속군」의 차이야. 나중에 연속군으로 나아갈게. 먼저 이 3가지 조작의 성질을 살펴보자.

✅ 이해도 체크: 정삼각형을 중심축 주위로 회전시켰을 때, 「원래와 같아 보이는」 회전 조작은 몇 가지인가요?

3가지. 0°회전(\(e\)), 120°회전(\(r\)), 240°회전(\(r^2\)). 360°회전은 0°회전과 같으므로 세지 않는다.

이 3가지 조작에는 재미있는 성질이 있다:

  1. 2개의 조작을 연달아 해도, 결과는 3가지 중 하나가 된다. 예를 들어 \(r\) 다음에 \(r\)을 하면 \(r^2\). \(r\) 다음에 \(r^2\)를 하면 \(e\)(원래로 돌아옴). 3가지 밖으로 나가지 않는다
  2. 3개를 연달아 할 때, 묶는 방법을 바꿔도 결과는 같다. \((r \cdot r) \cdot r = r^2 \cdot r = e\)\(r \cdot (r \cdot r) = r \cdot r^2 = e\)는 같다
  3. 「아무것도 하지 않는」 조작 \(e\)가 있다. \(e\) 다음에 무엇을 해도, 무엇 다음에 \(e\)를 해도, 결과는 변하지 않는다
  4. 어떤 조작에도 「원래로 되돌리는」 조작이 있다. \(r\)을 되돌리는 것은 \(r^2\)(\(r\) 다음에 \(r^2\)를 하면 \(e\)). \(r^2\)를 되돌리는 것은 \(r\)

⚪ 메이: 4가지 성질이 깔끔하게 갖춰져 있네요. 이것이 「군」의 조건이 되는 거죠.

곱셈표로 만들면:

표 D.1: 순환군 Z₃의 곱셈표

\(\cdot\) \(e\) \(r\) \(r^2\)
\(e\) \(e\) \(r\) \(r^2\)
\(r\) \(r\) \(r^2\) \(e\)
\(r^2\) \(r^2\) \(e\) \(r\)

정의 — 구체적인 예에서 추출하기

🟡 리나: 위의 4가지 성질을 일반화한 것이 군(group)의 정의야. 「조작의 모임」 \(G\)와, 조작을 연달아 수행하는 규칙 \(\cdot\)의 조합이 다음 4가지 조건을 만족할 때, \((G, \cdot)\)를 군이라고 불러요:

  1. 닫힘성(closure): 조작 \(a\) 다음에 조작 \(b\)를 수행한 결과 \(a \cdot b\)\(G\)에 포함된 조작이다
  2. 정삼각형의 예: \(r \cdot r = r^2 \in \{e, r, r^2\}\) ✓ — 3가지 밖으로 나가지 않음
  3. 결합법칙(associativity): \((a \cdot b) \cdot c = a \cdot (b \cdot c)\) — 3개의 조작을 연달아 할 때, 묶는 방법을 바꿔도 결과는 같다
  4. 정삼각형의 예: \((r \cdot r) \cdot r = r \cdot (r \cdot r) = e\)
  5. 항등원(identity): 「아무것도 하지 않는」 조작 \(e\)가 존재한다(\(e \cdot a = a \cdot e = a\)
  6. 정삼각형의 예: 0° 회전 \(e\)
  7. 역원(inverse): 어떤 조작 \(a\)에도 「원래로 되돌리는」 조작 \(a^{-1}\)이 존재한다(\(a \cdot a^{-1} = e\)
  8. 정삼각형의 예: \(r\)의 역원은 \(r^2\)\(r \cdot r^2 = e\))✓

정삼각형의 회전 \(\{e, r, r^2\}\)\(\mathbb{Z}_3\)(위수 3의 순환군)이라고 불린다.

⚪ 메이: 4가지 조건 중 하나라도 빠지면 군이 아닌 거네요.

🔵 카이: 결합법칙이란, 요컨대 「계산 순서를 신경 쓰지 않아도 된다」는 거지? 덧셈에서 \((1+2)+3 = 1+(2+3)\) 같은 거.

🟡 리나: 예로서는 맞아. 다만 정확히 말하면, 결합법칙은 「3개의 괄호 묶는 방법을 바꿔도 결과가 같다」는 것이야. 「순서를 신경 쓰지 않아도 된다」고 하면 「교환법칙」(\(a \cdot b = b \cdot a\))과 혼동하기 쉬우니까 주의해. 교환법칙은 「2개의 순서 교환」으로, 결합법칙과는 별개야. 교환법칙은 군의 조건에 들어가 있지 않아. 예를 들어 자연수 \(\{1, 2, 3, \ldots\}\)와 덧셈은 군이 아니야. \(3 + ? = 0\)을 만족하는 자연수가 없으니까, 역원 조건이 깨져 있어.

✅ 이해도 체크: 자연수 \(\{1, 2, 3, \ldots\}\)와 덧셈의 조합이 군이 되지 않는 이유는 무엇인가요?

역원이 존재하지 않기 때문이다. 예를 들어 \(3 + ? = 0\)을 만족하는 자연수가 없다. 군의 4가지 조건 중 역원 조건이 깨져 있다.

왜 「조작」인가

🟡 리나: 군을 「수의 모임」이 아니라 「조작의 모임」으로 생각하는 것이 포인트야. 물리학에서 대칭성이란 「어떤 조작을 해도 물리가 변하지 않는」 것이에요. 그 「조작」의 전체가 군을 이루는 거야. 정삼각형의 예에서 말하면, 「120° 회전해도 삼각형이 같아 보이는」 것이 대칭성이고, 그 대칭 조작의 전체 \(\{e, r, r^2\}\)가 군이에요.

📝 연습문제:

✅ 이해도 체크: 군의 정의를 구성하는 4가지 조건을 들어 보세요.

닫힘성(closure), 결합법칙(associativity), 항등원(identity)의 존재, 역원(inverse)의 존재.

✅ 이해도 체크: 정삼각형의 회전군 \(\{e, r, r^2\}\)에서 \(r\)의 역원은 무엇인가요?

\(r^2\). \(r \cdot r^2 = e\)(항등원으로 돌아감)이므로.


D.3 연속군(Lie 군) — 물리학의 주역

🟡 리나: 정삼각형의 회전은 「이산적」(120° 단위)이었어. 하지만 원을 회전시킨다면 임의의 각도로 회전할 수 있어. 이처럼 매개변수로 연속적으로 라벨이 붙는 군을 Lie 군(리 군)이라고 불러요. 물리학에서 가장 중요한 군은 거의 전부 Lie 군이에요.

\(U(1)\): 원의 회전 — 전자기력의 대칭성

복소수 \(e^{i\theta}\)(\(\theta\)는 실수)의 전체를 생각한다. 절댓값은 항상 1(\(|e^{i\theta}| = 1\))이므로, 복소평면 위의 단위원 위의 회전을 나타낸다.

복소평면 위의 단위원과 U(1)

그림 D.2: 복소평면 위의 단위원과 U(1). 그림 D_2: \(e^{i\theta}\)는 복소평면의 단위원 위의 점을 나타낸다. 각도 \(\theta\)를 바꾸면 원 위를 연속적으로 움직인다.

군의 조건을 확인하자:

닫힘성: 두 원소의 곱을 계산한다.

\[e^{i\theta_1} \cdot e^{i\theta_2} = e^{i(\theta_1 + \theta_2)}\]

우변은 \(e^{i\theta}\)의 형태(\(\theta = \theta_1 + \theta_2\))이므로 \(U(1)\)에 포함된다. ✓

결합법칙: 3개의 원소에 대해,

\[(e^{i\theta_1} \cdot e^{i\theta_2}) \cdot e^{i\theta_3} = e^{i(\theta_1 + \theta_2)} \cdot e^{i\theta_3} = e^{i(\theta_1 + \theta_2 + \theta_3)}\]
\[e^{i\theta_1} \cdot (e^{i\theta_2} \cdot e^{i\theta_3}) = e^{i\theta_1} \cdot e^{i(\theta_2 + \theta_3)} = e^{i(\theta_1 + \theta_2 + \theta_3)}\]

양자는 같다. ✓

항등원: \(\theta = 0\)으로 하면 \(e^{i \cdot 0} = 1\). 임의의 원소 \(e^{i\theta}\)에 대해 \(1 \cdot e^{i\theta} = e^{i\theta}\). ✓

역원: \(e^{i\theta}\)의 역원은 \(e^{-i\theta}\). 확인하면,

\[e^{i\theta} \cdot e^{-i\theta} = e^{i(\theta - \theta)} = e^0 = 1\]

매개변수는 \(\theta\) 하나뿐 → 1차원 Lie 군.

🔵 카이: 오, 4가지 조건 전부 한 번에 확인되는구나. 단순하다.

✅ 이해도 체크: \(U(1)\)의 원소 \(e^{i\theta}\)가 군의 항등원이 되는 것은 \(\theta\)가 얼마일 때인가요? 또한, \(e^{i\theta}\)의 역원은 무엇인가요?

\(\theta = 0\)일 때 \(e^{i \cdot 0} = 1\)이 항등원. \(e^{i\theta}\)의 역원은 \(e^{-i\theta}\)(곱하면 \(e^0 = 1\)로 돌아감).

🔵 카이: \(U(1)\)의 「\(U\)」는 뭐야?

🟡 리나: Unitary(유니터리)의 머리글자야. \(1 \times 1\) 유니터리 행렬은 \(|u|^2 = 1\)을 만족하는 복소수, 즉 \(e^{i\theta}\)인 거지. 그래서 \(U(1)\)은 「\(1 \times 1\) 유니터리 행렬의 군」이에요.

📝 연습문제:

물리에서의 역할(제 9 장): 양자역학의 파동함수 \(\psi\)에 대해 \(\psi \to e^{i\theta}\psi\)라는 위상 변환을 생각한다. 이 변환으로 물리가 변하지 않는 것(\(|\psi|^2\)가 불변)을 요구하면, 광자가 자동적으로 나타나고 전자기력이 도출된다. 이것이 게이지 원리(D.7절에서 자세히 도출한다).

\(SO(2)\)\(SO(3)\): 회전군

🟡 리나: \(U(1)\)은 복소수의 위상 회전이었는데, 더 친숙한 「공간의 회전」도 군을 이루어요.

\(SO(2)\): 2차원 회전

2차원 평면에서 벡터 \((x, y)\)를 각도 \(\theta\)만큼 회전시키는 행렬은:

\[R(\theta) = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}\]

이것은 \(2 \times 2\) 직교행렬(\(R^T R = I\))이고 행렬식이 1(\(\det R = 1\)). 이런 행렬의 전체가 \(SO(2)\).

닫힘성을 확인하자. 두 회전의 합성은:

\[R(\theta_1) R(\theta_2) = \begin{pmatrix} \cos\theta_1 & -\sin\theta_1 \\ \sin\theta_1 & \cos\theta_1 \end{pmatrix} \begin{pmatrix} \cos\theta_2 & -\sin\theta_2 \\ \sin\theta_2 & \cos\theta_2 \end{pmatrix}\]

행렬의 곱을 계산하면(덧셈정리를 사용하여):

\[= \begin{pmatrix} \cos(\theta_1+\theta_2) & -\sin(\theta_1+\theta_2) \\ \sin(\theta_1+\theta_2) & \cos(\theta_1+\theta_2) \end{pmatrix} = R(\theta_1 + \theta_2)\]

결과는 다시 \(SO(2)\)의 원소. ✓

🔵 카이: 어라, \(SO(2)\)\(U(1)\)도, 매개변수가 1개이고 「각도를 더하는」 구조잖아? 뭔가 비슷한데.

🟡 리나: 좋은 점을 알아챘네. 실은 \(SO(2)\)\(U(1)\)은 군으로서 동형(구조가 같음)이야. \(e^{i\theta} \leftrightarrow R(\theta)\)라는 대응이 있어.

⚪ 메이: 즉, 겉모습은 「복소수의 위상 회전」과 「평면의 회전행렬」로 다르지만, 군으로서의 곱셈 구조는 완전히 같다는 뜻이네요.

✅ 이해도 체크: \(SO(2)\)\(U(1)\)은 어떤 관계에 있나요?

군으로서 동형(구조가 같음). \(e^{i\theta} \leftrightarrow R(\theta)\)라는 대응이 있어서, 겉모습은 「복소수의 위상 회전」과 「평면의 회전행렬」로 다르지만, 군의 곱셈 구조는 완전히 같다.

\(SO(3)\): 3차원 회전

3차원 공간의 회전은 \(3 \times 3\) 직교행렬(\(R^T R = I\), \(\det R = 1\))로 표현된다. 매개변수는 3개(예를 들어 Euler 각 \(\alpha, \beta, \gamma\)).

중요한 성질: \(SO(3)\)은 비가환. 즉, 회전 순서가 중요하다.

🔵 카이: 책을 들고서, 먼저 \(x\)축 주위로 90° 돌리고, 다음에 \(z\)축 주위로 90° 돌리는 것과, 반대 순서로 하는 것은 결과가 다르잖아(그림 D.3「SO(3) 회전의 비가환성」).

SO(3) 회전의 비가환성

그림 D.3: SO(3) 회전의 비가환성. 그림 D_3: 3차원 공간에서의 회전은 순서를 바꾸면 결과가 달라진다(비가환). 책을 \(x\)축 주위로 90°→\(z\)축 주위로 90°와 역순으로 돌린 결과는 다르다.

🟡 리나: 맞아. 이것을 수식으로 쓰면 \(R_x(\pi/2) R_z(\pi/2) \neq R_z(\pi/2) R_x(\pi/2)\). 이 「순서가 중요하다」는 성질이 비가환군의 본질이며, Yang-Mills 이론(「장의 양자론」편 「장의 양자론」편 제 17 장 참조)의 출발점이 돼요.

\(SU(2)\): 약한 힘의 대칭성

\(2 \times 2\) 유니터리 행렬(\(U^\dagger U = I\))이면서 행렬식이 1(\(\det U = 1\))인 것 전체.

🔵 카이: 「유니터리」가 뭐였지?

🟡 리나: 행렬의 역행렬이 전치한 후 복소 켤레를 취한 것(\(U^{-1} = U^\dagger\))과 같은 것이야. 복소수 성분을 가진 벡터 \(\mathbf{v} = (v_1, v_2)\)의 「길이의 제곱」을 \(|v_1|^2 + |v_2|^2\)로 정의했을 때, 유니터리 행렬을 곱해도 이 길이가 변하지 않아. 실수 벡터의 길이 \(\sqrt{x^2 + y^2}\)가 직교행렬(회전행렬)로 보존되는 것과 같은 발상으로, 복소수로 확장한 거야.

매개변수는 3개 → 3차원 Lie 군.

🔵 카이: 왜 3개인지 어떻게 알아?

🟡 리나: 세어 보자. \(2 \times 2\) 복소행렬은 8개의 실수 매개변수를 가져(각 성분이 복소수이고, 실부와 허부로 2개씩, 4개 성분으로 \(2 \times 4 = 8\)). 유니터리 조건 \(U^\dagger U = I\)는 몇 개의 실수 조건을 부과할까?

🔵 카이: \(U^\dagger U\)\(2 \times 2\) 행렬이니까, 4개의 성분이 각각 \(I\)의 성분과 같다는 조건으로……4개의 복소수 등식, 즉 8개의 실수 조건?

🟡 리나: 얼핏 그렇게 보이지. 하지만 실은 \(U^\dagger U\)에는 특별한 성질이 있어. \((U^\dagger U)^\dagger = U^\dagger (U^\dagger)^\dagger = U^\dagger U\)이므로, \(U^\dagger U\)에르미트 행렬(\(H^\dagger = H\)을 만족하는 행렬)이야. 에르미트 행렬의 성분에는 제약이 있으니까, 4개의 등식이 모두 독립적이지는 않아.

🔵 카이: 에르미트이면 뭐가 달라지는데?

🟡 리나: 에르미트 행렬은 대각 성분이 실수(\(H_{ii}^* = H_{ii}\))이고, 비대각 성분은 \(H_{ji} = H_{ij}^*\)로 서로 결정돼. 즉, 상삼각 부분(\(i < j\)인 성분)을 정하면 하삼각 부분은 자동으로 정해지니까, 독립적인 비대각 성분은 상삼각의 \(n(n-1)/2\)개의 복소수뿐이야.

🔵 카이: 아, 하삼각은 상삼각의 복소 켤레로 정해지니까, 자유롭게 선택할 수 있는 것은 절반뿐이라는 거구나.

🟡 리나: 맞아. \(n \times n\)의 경우, 대각에 \(n\)개의 실수, 비대각에 독립적인 \(n(n-1)/2\)개의 복소수(= \(n(n-1)\)개의 실수)가 있으므로, 에르미트 행렬의 독립적인 실수 성분은 \(n + n(n-1) = n^2\)개. 「\(n \times n\) 에르미트 행렬 \(=\) 단위행렬」이라는 등식은, 좌변의 \(n^2\)개의 독립적인 실수 성분이 각각 단위행렬의 대응하는 성분(대각이 1, 비대각이 0)과 같다는 조건이므로, \(n^2\)개의 독립적인 실수 등식이 돼. \(2 \times 2\)이면 \(2^2 = 4\)개. 8개가 아니라 4개야.

⚪ 메이: 그렇구나, 에르미트 성질 덕분에 조건의 수가 절반 이하로 줄어드는 거네요.

🔵 카이: 잠깐, 에르미트이면 조건이 4개가 되는 건 알겠어. 근데 「\(\det U = 1\)로 1개 줄어든다」는 건, 행렬식 조건이 실수 1개분이라는 거야? 행렬식은 복소수 아니야?

🟡 리나: 좋은 의문이야. 유니터리 행렬의 행렬식은 자동적으로 \(|\det U| = 1\)을 만족해(즉 \(\det U = e^{i\theta}\) 형태이고, 절댓값은 반드시 1). 그래서 \(\det U = 1\)은 「\(\theta = 0\)」이라는 1개의 실수 조건을 추가로 부과하는 것뿐이야. 따라서 \(8 - 4 = 4\), 추가로 \(4 - 1 = 3\).

⚪ 메이: 즉, 8개의 실수 매개변수에서 유니터리 조건으로 4개, 행렬식 조건으로 1개 빼면 나머지가 3개라는 뜻이네요.

🟡 리나: 맞아요. \(SU(2)\)의 일반적인 원소는 다음과 같이 쓸 수 있어:

\[U = \begin{pmatrix} \alpha & -\beta^* \\ \beta & \alpha^* \end{pmatrix}, \quad |\alpha|^2 + |\beta|^2 = 1\]

여기서 \(\alpha, \beta\)는 복소수. 행렬식을 계산하면(\(2 \times 2\) 행렬 \(\begin{pmatrix}a&b\\c&d\end{pmatrix}\)의 행렬식은 \(ad - bc\)): \(\det U = \alpha \cdot \alpha^* - (-\beta^*) \cdot \beta = |\alpha|^2 + |\beta|^2 = 1\) ✓. \(\alpha\)\(\beta\)는 합쳐서 4개의 실수 매개변수를 가지지만, \(|\alpha|^2 + |\beta|^2 = 1\) 조건으로 1개 줄어드므로, 독립적인 실수 매개변수는 확실히 3개.

✅ 이해도 체크: \(SU(2)\)의 매개변수 수가 3이 되는 이유를, 조건의 수 세기로 설명해 보세요.

\(2 \times 2\) 복소행렬은 8개의 실수 매개변수를 가진다. 유니터리 조건 \(U^\dagger U = I\)로 4개의 실수 조건이 부과되고, \(\det U = 1\)로 추가로 1개 줄어든다. 따라서 \(8 - 4 - 1 = 3\).

📝 연습문제:

\(SU(2)\)\(SO(3)\)의 관계:

\(SU(2)\)\(SO(3)\)는 밀접하게 관련되어 있다. \(SU(2)\)의 두 원소 \(U\)\(-U\)\(SO(3)\)의 같은 원소에 대응한다(2대 1의 대응). 이것이 「스핀 \(1/2\) 입자는 \(360°\) 회전에서 부호가 바뀌고, \(720°\) 회전에서 원래로 돌아온다」는 신기한 성질의 수학적 기원(「양자역학」편 「양자역학」편 제 17 장 참조).

물리에서의 역할: - 3차원 공간 회전의 기술(스핀 \(1/2\) 입자의 변환 법칙) - 제 9 장의 약한 힘의 게이지 군(이쪽은 공간의 회전이 아니라, 입자의 내부 상태 변환)

이 둘은 같은 \(SU(2)\)라는 수학적 구조를 공유하지만, 물리적으로는 완전히 다른 대칭성이야. 같은 군이 다른 맥락에서 나타나는 것은 군론의 보편성의 표현이에요.

📝 연습문제:

\(SU(3)\): 강한 힘의 대칭성

\(3 \times 3\) 유니터리 행렬이면서 행렬식이 1인 것 전체. 매개변수 수를 세 보자:

\(3 \times 3\) 복소행렬은 \(3 \times 3 = 9\)개의 복소 성분을 가지고, 각 성분에 실부와 허부가 있으므로 \(2 \times 9 = 18\)개의 실수 매개변수를 가진다. 유니터리 조건 \(U^\dagger U = I\)\(3^2 = 9\)개의 실수 조건(\(SU(2)\) 때와 같은 논법: \(U^\dagger U\)는 에르미트 행렬이므로 독립적인 실수 성분은 \(n^2\)개). \(\det U = 1\)로 추가로 1개. 따라서 \(18 - 9 - 1 = 8\) 매개변수.

🔵 카이: \(SU(2)\) 때와 완전히 같은 세는 방법으로, 크기만 커진 거구나. 패턴이 보이기 시작했어.

물리에서의 역할(제 9 장): 쿼크는 「색」(빨강·초록·파랑)이라는 3가지 상태를 가진다. \(SU(3)\)는 이 3가지 색 사이의 변환이다. 색 변환으로 물리가 변하지 않는 것을 요구하면, 8종류의 글루온이 자동적으로 나타나고 강한 힘이 도출된다.

Lorentz 군 \(SO(1,3)\)

🟡 리나: 하나 더, 물리에서 중요한 군을 소개해 둘게. Lorentz 군 \(SO(1,3)\)는 Minkowski 계량 \(\eta_{\mu\nu} = \text{diag}(-1,+1,+1,+1)\)을 보존하는 변환의 군이야. 3개의 공간 회전과 3개의 부스트(속도 변환)로, 매개변수는 6개.

자세한 것은 「장의 양자론」편 「장의 양자론」편 부록 B(Lorentz 군과 Poincaré 군의 표현론)를 참조해. 본서에서는 제 5 장에서 Lorentz 불변성을 논의했어.

정리: 표준모형의 게이지 군

\[SU(3) \times SU(2) \times U(1)\]

표 D.2: 표준모형의 게이지 군과 매개 입자

매개변수 수 대응하는 힘 매개 입자의 수
\(SU(3)\) 8 강한 힘 8(글루온)
\(SU(2)\) 3 약한 힘 3(\(W^+, W^-, Z\))
\(U(1)\) 1 전자기력 1(광자)
%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart LR
    SM["표준모형의 게이지 군<br/>SU(3) × SU(2) × U(1)"] --> SU3["SU(3)<br/>8 매개변수"]
    SM --> SU2["SU(2)<br/>3 매개변수"]
    SM --> U1["U(1)<br/>1 매개변수"]
    SU3 --> G["강한 힘<br/>8 글루온"]
    SU2 --> W["약한 힘<br/>W⁺, W⁻, Z"]
    U1 --> P["전자기력<br/>광자 γ"]
    style SM fill:#f9f,stroke:#333
    style G fill:#fdd,stroke:#c33
    style W fill:#ddf,stroke:#33c
    style P fill:#dfd,stroke:#3c3

그림 D.4: 표준모형 게이지 군과 매개 입자의 대응

⚪ 메이: 매개 입자의 수와 매개변수 수가 딱 맞는 것은 우연이 아닌 거죠.

🟡 리나: 맞아요. 게이지 군의 각 매개변수(생성원)에 대응하여 1개의 매개 입자가 존재해요. 이것은 D.7절에서 보는 게이지 원리의 귀결이에요.

📝 연습문제:

✅ 이해도 체크: \(U(1)\)의 매개변수는 몇 개이고, 표준모형에서는 어떤 힘에 대응하나요?

매개변수는 1개(각도 \(\theta\))이고, 전자기력에 대응한다.

✅ 이해도 체크: \(SU(3)\)의 매개변수 수는 몇 개이고, 그에 대응하는 매개 입자는 무엇인가요?

매개변수 수는 8이고, 대응하는 매개 입자는 8종류의 글루온.


D.4 Lie 대수 — 「무한소 변환」의 대수

동기: 유한 변환에서 무한소 변환으로

🟡 리나: Lie 군의 원소(유한 변환)를 직접 다루는 것은 힘들어. 예를 들어 \(SU(2)\)의 원소는 \(2 \times 2\) 유니터리 행렬인데, 행렬 곱셈을 매번 하는 건 번거로워. 하지만 항등원 근방의 무한소 변환만 보면, 군 구조의 대부분을 알 수 있어.

🔵 카이: 왜 「근방」만으로 전체를 알 수 있어?

🟡 리나: 비유를 들어 볼게. 지구의 형태를 알고 싶을 때, 지구 전체를 한 번에 볼 필요는 없어. 자기 발밑 땅의 휘어진 정도(국소적 정보)를 조사하면, 지구가 구라는 것을 알 수 있어. Lie 대수는 「발밑의 휘어진 정도」에 해당해. 수학적으로는, 유한 변환은 무한소 변환의 「지수함수」로 복원할 수 있기 때문이야(그림 D.5「Lie군과 Lie대수의 관계」).

Lie군과 Lie대수의 관계

그림 D.5: Lie군과 Lie대수의 관계. 그림 D_4: Lie 군은 곡면과 같은 구조를 가지며, 항등원 \(e\)에서의 접공간이 Lie 대수에 대응한다. 생성원은 항등원에서의 「벗어남의 방향」(접벡터)이며, 지수함수(\(e^{i\theta^a T_a}\))로 유한 변환을 복원할 수 있다.

무한소 변환과 생성원의 정의

\(SO(2)\)의 회전행렬 \(R(\theta)\)\(\theta\)가 매우 작은 경우에 전개해 보자:

\[R(\theta) = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}\]

\(\theta \ll 1\)일 때, \(\cos\theta \approx 1 - \theta^2/2 \approx 1\), \(\sin\theta \approx \theta\)이므로:

\[R(\theta) \approx \begin{pmatrix} 1 & -\theta \\ \theta & 1 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} + \theta \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}\]

정리하면:

\[R(\theta) \approx I + \theta J, \quad J = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}\]

\(J\)\(SO(2)\)생성원(generator). 항등원으로부터의 「벗어남의 방향」을 지정하는 행렬이야.

⚪ 메이: 생성원 \(J\)로부터 유한한 회전 \(R(\theta)\)를 복원할 수 있나요?

🟡 리나: 가능해. 지수함수를 사용하면:

\[R(\theta) = e^{\theta J}\]

이것을 확인하자. 행렬의 지수함수는 Taylor 전개로 정의돼:

\[e^{\theta J} = I + \theta J + \frac{(\theta J)^2}{2!} + \frac{(\theta J)^3}{3!} + \cdots\]

\(J^2\)를 계산하면:

\[J^2 = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix} = \begin{pmatrix} -1 & 0 \\ 0 & -1 \end{pmatrix} = -I\]

따라서 \(J^3 = J^2 \cdot J = -J\), \(J^4 = J^2 \cdot J^2 = I\), ... 이것은 \(i^2 = -1\)의 패턴과 같다!

🔵 카이: 오, \(J\)를 반복해서 곱하면 \(I, J, -I, -J, I, \ldots\)로 순환하는구나. 허수 단위와 같은 구조야.

🟡 리나: 맞아. 전개를 정리하면:

\[e^{\theta J} = \left(1 - \frac{\theta^2}{2!} + \frac{\theta^4}{4!} - \cdots\right)I + \left(\theta - \frac{\theta^3}{3!} + \cdots\right)J\]
\[= (\cos\theta)\, I + (\sin\theta)\, J = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}\]

확실히 \(R(\theta)\)가 복원되었어.

✅ 이해도 체크: 생성원 \(J\)와 유한 변환 \(R(\theta)\)의 관계를 식으로 써 보세요.

\(R(\theta) = e^{\theta J}\). 유한 변환은 생성원의 지수함수로 복원할 수 있다. 행렬의 지수함수는 Taylor 전개 \(e^{\theta J} = I + \theta J + (\theta J)^2/2! + \cdots\)로 정의된다.

일반적인 Lie 군의 경우

일반적으로, Lie 군의 원소를 항등원 근방에서 전개하면:

\[U(\epsilon^1, \epsilon^2, \ldots, \epsilon^n) \approx I + i\epsilon^a T_a \qquad (\epsilon^a \ll 1)\]

여기서 \(\epsilon^a\)의 위 첨자 \(a\)는 거듭제곱이 아니라 「\(a\)번째 매개변수」를 나타내는 라벨(\(\epsilon^1, \epsilon^2, \ldots\)처럼 번호를 매긴 것). \(T_a\)(\(a = 1, 2, \ldots, n\))가 생성원. \(n\)은 군의 매개변수 수(군의 차원). \(i\epsilon^a T_a\)\(\sum_{a=1}^n i\epsilon^a T_a\)의 약기. 부록 C 에서 배운 Einstein의 축약 규칙(같은 첨자가 위와 아래에 나타나면 합을 취함)과 같은 정신으로, 반복 첨자는 합을 취한다.

::: {.callout-warning}

군의 내부 첨자 규약

군의 내부 공간 첨자(\(a, b, c\) 등)에서는 계량이 \(\delta_{ab}\)(단위행렬)이므로 위 첨자와 아래 첨자의 구별에 물리적 의미가 없다. 따라서 문헌에 따라서는 \(f_{abc}\)처럼 전부 아래 첨자로 쓰거나, \(\epsilon^a T_a\)처럼 위아래를 섞어서 쓰기도 한다. 본 장에서는 「반복 첨자가 나타나면(위아래 위치에 관계없이) 합을 취한다」는 느슨한 규약을 채택한다. 이것은 시공간의 첨자(\(\mu, \nu\) 등)에서 Minkowski 계량 \(\eta_{\mu\nu}\)를 사용하여 위아래를 엄밀히 구별하는 것과는 다른 규약이므로 주의하자. 헷갈리면 \(\sum\)을 명시해서 읽으면 문제없다. :::

🔵 카이: 잠깐, 왜 \(i\)가 앞에 붙어 있어?

🟡 리나: \(i\)를 앞에 붙이는 것은 물리의 관습으로 생성원을 에르미트로 만들기 위해서야. 왜 \(i\)로 에르미트가 되는지 확인하자: \(U \approx I + i\epsilon^a T_a\)가 유니터리(\(U^\dagger U = I\))이려면, \(U^\dagger = I - i\epsilon^a T_a^\dagger\)와의 곱이 \(I\)가 되어야 해. 1차 정밀도에서 \(U^\dagger U \approx I + i\epsilon^a(T_a - T_a^\dagger) = I\)이므로, \(T_a = T_a^\dagger\)(에르미트)가 필요해.

🔵 카이: 에르미트이면 뭐가 좋은 거야?

🟡 리나: 에르미트 행렬이란 \(T_a^\dagger = T_a\)(전치 후 복소 켤레를 취한 것이 원래와 같음)를 만족하는 행렬이야. 에르미트 행렬의 고유값은 반드시 실수가 돼.

🔵 카이: 고유값이 뭐였지? 행렬의 「무언가」가 실수이면 좋다는 거야?

🟡 리나: 고유값이란, 행렬 \(A\)에 대해 \(A\mathbf{v} = \lambda\mathbf{v}\)를 만족하는 스칼라 \(\lambda\)를 말해(\(\mathbf{v} \neq \mathbf{0}\)은 고유벡터라고 불림). 행렬을 벡터에 곱하면 일반적으로는 벡터의 방향도 크기도 변해. 하지만 특별한 벡터 \(\mathbf{v}\)에 대해서는 방향이 변하지 않고 크기만 \(\lambda\)배가 되지——그 배율 \(\lambda\)가 고유값이야. 예를 들어 \(2 \times 2\) 행렬 \(\begin{pmatrix}3&0\\0&1\end{pmatrix}\)에 벡터 \(\begin{pmatrix}1\\0\end{pmatrix}\)를 곱하면 \(\begin{pmatrix}3\\0\end{pmatrix}\)이 돼. 방향은 같고 크기가 3배——그래서 고유값은 3. 양자역학에서는 물리량(에너지나 스핀 등)의 측정에서 얻어지는 값이 대응하는 연산자의 고유값과 일치해. 그래서 고유값이 실수라는 것은 「측정 결과가 실수가 된다」는 것을 보장해 줘.

🔵 카이: 그렇구나, \(i\)를 붙임으로써 생성원이 에르미트가 되고, 그 고유값이 실수——즉 측정에서 나오는 값이 된다는 거구나.

🟡 리나: 맞아. 아까 \(SO(2)\)의 예에서는 \(R(\theta) \approx I + \theta J\)\(i\) 없이 썼어. 이것은 수학의 관습이야. 물리의 관습에 맞추려면, \(T = -iJ\)를 정의하여 \(R(\theta) = e^{i\theta T}\)로 쓰면 돼(\(iT = J\)이므로 \(e^{i\theta T} = e^{\theta J}\)로 같은 것). \(T\)가 에르미트인 것도 확인할 수 있어: \(J\)는 실행렬이면서 반대칭(\(J^T = -J\))이므로, \(T^\dagger = (-iJ)^\dagger = (-i)^* J^\dagger = i J^T = i(-J) = -iJ = T\) ✓(여기서 \((-i)^* = i\), \(J\)가 실행렬이므로 \(J^\dagger = J^T\), 그리고 \(J^T = -J\)(반대칭)을 사용했다).

이후로는 물리의 관습(\(i\) 포함)으로 통일할게. 즉, 일반적인 Lie 군의 원소를 \(U = e^{i\theta^a T_a}\)로 쓰고, 무한소에서는 \(U \approx I + i\epsilon^a T_a\)로 쓴다. 아까 \(SO(2)\)의 예로 말하면, \(R(\theta) = e^{\theta J} = e^{i\theta T}\)(\(T = -iJ\))로 다시 쓴 것이 물리의 관습에 대응해.

유한 변환은 지수함수로:

\[U(\theta^1, \ldots, \theta^n) = e^{i\theta^a T_a}\]

🔵 카이: 잠깐, \(\theta^a\)\(\theta\)\(a\)제곱이 아니야? 위에 써 있으니까 거듭제곱으로 보이는데.

🟡 리나: 헷갈리지, 여기서 \(\theta^a\)는 「\(a\)번째 매개변수」라는 뜻으로, 위 첨자는 단순한 라벨이야. 거듭제곱이 아니야. 그리고 \(\theta^a T_a = \sum_{a=1}^n \theta^a T_a\)는, 같은 첨자 \(a\)가 위 첨자(\(\theta^a\))와 아래 첨자(\(T_a\))에 나타나면 합을 취하는 약속——부록 C 에서 배운 Einstein의 축약 규칙과 같은 표기법을 군의 내부 공간 첨자에도 유용하고 있어. 시공간 첨자 \(\mu, \nu\)와는 별개이지만, 「반복 첨자는 합을 취한다」는 약속은 공통이야. 익숙해질 때까지는 \(\sum\)을 명시해서 읽어도 괜찮아.

⚪ 메이: 즉, \(\theta^a\)의 위 첨자 \(a\)는 거듭제곱이 아니라 라벨이고, 같은 첨자가 위아래에 나타나면 합을 취한다——부록 C 의 축약 규칙과 같은 약속이라는 뜻이네요.

✅ 이해도 체크: Lie 군의 원소를 항등원 근방에서 전개했을 때, 생성원 \(T_a\) 앞에 허수 단위 \(i\)를 붙이는 물리적 이유는 무엇인가요?

생성원을 에르미트(\(T_a^\dagger = T_a\))로 만들기 위해서. 에르미트 행렬의 고유값은 실수이므로, 생성원을 물리적 관측량(각운동량 등)과 대응시키기 쉬워진다.

교환 관계와 구조상수

🟡 리나: 여기서부터가 핵심이야. 생성원끼리의 교환 관계(commutation relation)가 Lie 대수를 정의해.

\[\boxed{[T_a, T_b] \equiv T_a T_b - T_b T_a = i f_{abc}\, T_c}\]

우변의 첨자 \(c\)에 대해서는 합을 취한다(\(if_{abc}T_c = i\sum_c f_{abc}T_c\), 앞서 말한 군의 내부 첨자 축약 규칙에 의해). \(f_{abc}\)구조상수(structure constants)——군의 「모양」을 결정하는 수치.

🔵 카이: 왜 교환 관계가 중요한 거야?

🟡 리나: 2개의 조작 \(A\)\(B\)를 「\(A\) 한 다음 \(B\)」와 「\(B\) 한 다음 \(A\)」로 결과가 다른지를 측정하는 것이 교환 관계야.

  • \([A, B] = 0\): 순서를 바꿔도 같다(가환)
  • \([A, B] \neq 0\): 순서가 중요하다(비가환)

\(U(1)\)은 가환(각도의 덧셈은 순서에 무관). \(SU(2)\)\(SU(3)\)는 비가환.

⚪ 메이: 즉, 교환 관계가 \(0\)이 아니면 비가환이고, 그 「어긋남의 정도」가 구조상수 \(f_{abc}\)로 수치화되어 있다는 뜻이네요.

🔵 카이: 그런데, 교환 관계는 「2개의 생성원 순서를 바꿨을 때의 어긋남」이잖아? 그것만으로 군의 전체상을 알 수 있다는 건, 뭔가 정보가 너무 적지 않아?

🟡 리나: 좋은 직관이야. 하지만 실은 충분해. 이유는 이래: 군의 임의의 원소는 \(e^{i\theta^a T_a}\)로 쓸 수 있어. 두 원소의 곱 \(e^{i\theta^a T_a} e^{i\phi^b T_b}\)를 계산할 때, 지수함수를 전개하면 \(T_a T_b\) 같은 생성원의 곱이 나와. \(T_a T_b = T_b T_a + [T_a, T_b]\)로 다시 쓸 수 있으니까, 교환 관계만 알고 있으면 모든 곱을 정리할 수 있어. 즉, 교환 관계가 생성원의 「곱셈 규칙」을 완전히 결정하고 있고, 그것이 군 전체의 정보를 담고 있는 거야.

✅ 이해도 체크: 교환 관계 \([T_a, T_b] = 0\)이 성립할 때, 두 조작에는 어떤 성질이 있나요?

조작의 순서를 바꿔도 결과가 같다(가환). \(T_a\)를 먼저 하고 \(T_b\)를 해도, 반대 순서로 해도 같은 결과가 된다.

구체적 계산: \(SU(2)\)의 Lie 대수

🟡 리나: \(SU(2)\)의 생성원을 구체적으로 계산해 보자. 생성원은 3개: \(T_i = \sigma_i / 2\)(\(\sigma_i\)는 Pauli 행렬).

\[\sigma_1 = \begin{pmatrix}0&1\\1&0\end{pmatrix}, \quad \sigma_2 = \begin{pmatrix}0&-i\\i&0\end{pmatrix}, \quad \sigma_3 = \begin{pmatrix}1&0\\0&-1\end{pmatrix}\]

\([T_1, T_2]\)를 계산해 보자. \(T_i = \sigma_i/2\)이므로:

\[[T_1, T_2] = T_1 T_2 - T_2 T_1 = \frac{1}{4}(\sigma_1 \sigma_2 - \sigma_2 \sigma_1)\]

\(\sigma_1 \sigma_2\)를 계산한다:

\[\sigma_1 \sigma_2 = \begin{pmatrix}0&1\\1&0\end{pmatrix}\begin{pmatrix}0&-i\\i&0\end{pmatrix} = \begin{pmatrix}i&0\\0&-i\end{pmatrix} = i\sigma_3\]

\(\sigma_2 \sigma_1\)을 계산한다:

\[\sigma_2 \sigma_1 = \begin{pmatrix}0&-i\\i&0\end{pmatrix}\begin{pmatrix}0&1\\1&0\end{pmatrix} = \begin{pmatrix}-i&0\\0&i\end{pmatrix} = -i\sigma_3\]

따라서:

\[[T_1, T_2] = \frac{1}{4}(i\sigma_3 - (-i\sigma_3)) = \frac{1}{4} \cdot 2i\sigma_3 = \frac{i\sigma_3}{2} = iT_3\]

🔵 카이: 오, 깔끔하게 \(iT_3\)가 나오는구나!

🟡 리나: 마찬가지 계산을 다른 조합에서도 하면, 일반적으로:

\[\boxed{[T_i, T_j] = i\varepsilon_{ijk}\, T_k}\]

여기서 \(\varepsilon_{ijk}\)는 Levi-Civita 기호(\(\varepsilon_{123} = 1\), 첨자의 짝수 치환에서 \(+1\), 홀수 치환에서 \(-1\), 같은 첨자가 2개 이상 포함되면 \(0\)). 짝수 치환·홀수 치환이란: \(123\)을 기준으로, 임의의 2개 첨자를 교환하는 조작을 반복하여 목표 배열에 도달할 때, 교환 횟수가 짝수이면 짝수 치환, 홀수이면 홀수 치환. 예를 들어 \(231\)\(123 \to 213\)(1과 2를 교환)\(\to 231\)(1과 3을 교환)으로 2번 교환으로 도달하므로 짝수 치환(\(\varepsilon_{231} = +1\)), \(132\)\(123 \to 132\)(2와 3을 교환)로 1번에 도달하므로 홀수 치환(\(\varepsilon_{132} = -1\)).

🟡 리나: 즉, \(SU(2)\)의 구조상수는 \(f_{ijk} = \varepsilon_{ijk}\). 그리고 이것은 각운동량의 교환 관계와 완전히 같은 형태야. 양자역학(「양자역학」편 「양자역학」편 제 15 장)에서 스핀의 교환 관계 \([J_i, J_j] = i\hbar\varepsilon_{ijk}J_k\)를 배운 사람은, 이미 \(SU(2)\)의 Lie 대수를 알고 있었던 거야(\(\hbar = 1\) 단위계에서). 참고로, \([T_1, T_2] = iT_3\), \([T_2, T_3] = iT_1\), \([T_3, T_1] = iT_2\)로 순환적으로 바뀌는 구조는, \(x, y, z\)축의 외적 \(\hat{x} \times \hat{y} = \hat{z}\)와 같은 패턴이야.

⚪ 메이: 그렇구나, 일반적인 정의 \([T_a, T_b] = if_{abc}T_c\)\(f_{abc}\)가, \(SU(2)\)에서는 구체적으로 \(\varepsilon_{ijk}\)가 되는 거네요. 외적과 같은 순환 구조이니까, \([T_1, T_2] = iT_3\)를 기억해 두면 나머지는 첨자를 돌리기만 하면 나와요.

🟡 리나: 그래. 이것이 \(SO(3)\) / \(SU(2)\)의 Lie 대수야. 양자역학의 각운동량 연산자 \(J_i\)(\(\hbar = 1\) 단위계에서 \(J_i = T_i\))도 완전히 같은 교환 관계를 만족해. 구체적으로 써 내면:

\[[T_1, T_2] = iT_3, \quad [T_2, T_3] = iT_1, \quad [T_3, T_1] = iT_2\]

✅ 이해도 체크: \(SU(2)\)의 구조상수 \(f_{ijk}\)는 무엇과 같은가요?

Levi-Civita 기호 \(\varepsilon_{ijk}\). \(\varepsilon_{123} = 1\)이고, 첨자의 짝수 치환에서 \(+1\), 홀수 치환에서 \(-1\), 같은 첨자가 포함되면 \(0\).

📝 연습문제:

구조상수의 성질

구조상수 \(f_{abc}\)에는 중요한 성질이 있다:

반대칭성: 교환 관계의 정의 \([T_a, T_b] = -[T_b, T_a]\)로부터,

\[f_{abc} = -f_{bac}\]

즉 처음 2개의 첨자를 교환하면 부호가 바뀐다.

Jacobi 항등식: 임의의 3개의 생성원에 대해,

\[[T_a, [T_b, T_c]] + [T_b, [T_c, T_a]] + [T_c, [T_a, T_b]] = 0\]

이것을 구조상수로 쓸 수도 있다(첨자가 복잡해지므로 여기서는 결과만 제시한다):

\[f_{abe}\, f_{ecd} + f_{bce}\, f_{ead} + f_{cae}\, f_{ebd} = 0\]

(첨자 \(e\)에 대해 합을 취한다. \(a, b, c, d\)는 자유 첨자.) 이 식을 직접 사용하는 장면은 본 장에서는 나오지 않지만, Jacobi 항등식은 Lie 대수가 수학적으로 모순 없이 정의되기 위한 정합성 조건이며, 게이지 이론이 물리적으로 정합적인 것(예를 들어 확률 보존)을 보장하는 데에도 중요한 역할을 한다.

✅ 이해도 체크: 구조상수 \(f_{abc}\)의 반대칭성이란 무엇인가요?

처음 2개의 첨자를 교환하면 부호가 바뀌는 것: \(f_{abc} = -f_{bac}\). 이것은 교환 관계의 정의 \([T_a, T_b] = -[T_b, T_a]\)로부터 직접 따른다.

Virasoro 대수(제16장 예고)

🟡 리나: 끈이론의 공형장론에서 등장하는 Lie 대수도 예고로 소개해 둘게. 여기서는 분위기만 파악하면 충분해.

끈의 세계면 위의 대칭성(공형 대칭성)을 기술하는 생성원 \(L_n\)(\(n\)은 정수)은 무한 개가 있다. 이들의 교환 관계는:

\[[L_m, L_n] = (m-n)L_{m+n} + \frac{c}{12}m(m^2-1)\delta_{m+n,0}\]

여기서 \(\delta_{m+n,0}\)는 Kronecker 델타(\(m + n = 0\)일 때 1, 그 외에는 0). 제1항 \((m-n)L_{m+n}\)은 「두 생성원의 교환 관계가 다른 생성원의 선형 결합이 된다」는 점에서 \(SU(2)\)\([T_i, T_j] = i\varepsilon_{ijk}T_k\)와 비슷한 구조. 다만 제2항은 새로운 것이야. \(c\)중심 전하라 불리는 상수로, 유한 차원 Lie 대수(\(SU(2)\) 등)에는 없는 특징이야. 이 항이 끈이론의 시공간 차원을 \(D = 26\)(보손 끈)이나 \(D = 10\)(초끈)으로 제한하는 원인이 돼. 자세한 것은 제 14 장, 제 16 장에서 배우게 돼.

🔵 카이: 무한 개의 생성원이라니, \(SU(2)\)의 3개와는 전혀 스케일이 다르구나……

🟡 리나: 그래. 그래서 끈이론은 풍부한 구조를 가지는 거야. 지금은 「이런 것이 있다」고 알아 두기만 하면 돼.

✅ 이해도 체크: Lie 대수를 정의하는 생성원 \(T_a\) 사이의 교환 관계 \([T_a, T_b] = if_{abc}T_c\)에 나타나는 \(f_{abc}\)는 무엇이라 불리나요?

구조상수(structure constants). 군의 「모양」을 결정하는 수치.

✅ 이해도 체크: \(SU(2)\)의 Lie 대수의 교환 관계는 양자역학의 어떤 물리량의 교환 관계와 같은가요?

각운동량(스핀)의 교환 관계와 완전히 같다. \([J_i, J_j] = i\varepsilon_{ijk}J_k\).


D.5 표현 — 군을 행렬로 「보기」

표현이란

🟡 리나: 군의 추상적인 원소를 구체적인 행렬로 「표현」하는 것. 같은 군이라도 다른 크기의 행렬로 표현할 수 있어.

🔵 카이: 같은 군인데 행렬 크기가 달라?

🟡 리나: 비유를 들어 볼게. 「회전」이라는 추상적 조작은 2차원 그림을 돌릴 수도 있고, 3차원 물체를 돌릴 수도 있어. 같은 「회전」이지만, 2차원이면 \(2 \times 2\) 행렬, 3차원이면 \(3 \times 3\) 행렬로 표현돼. 행렬 크기가 달라도 회전의 「구조」(교환 관계 등)는 같아.

수학적으로 말하면: 군 \(G\)표현이란, \(G\)의 각 원소 \(g\)에 행렬 \(D(g)\)를 대응시키는 사상으로, 군의 곱을 보존하는 것:

\[D(g_1) D(g_2) = D(g_1 \cdot g_2)\]

행렬의 크기 \(n\)을 표현의 차원이라 부른다.

✅ 이해도 체크: 군의 표현에서, 군의 곱을 보존한다는 것은 어떤 뜻인가요? 식으로 써 보세요.

\(D(g_1) D(g_2) = D(g_1 \cdot g_2)\). 군 원소의 곱에 대응하는 행렬이, 각각의 행렬의 곱과 같다는 것.

\(SU(2)\)의 표현과 스핀

\(SU(2)\)에는 각 스핀 양자수 \(j = 0, 1/2, 1, 3/2, 2, \ldots\)에 대해 \((2j+1)\)차원의 표현이 하나씩 존재한다.

%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart TD
    SU2["SU(2) 군"] --> j0["j = 0<br/>1×1 행렬<br/>스칼라 입자"]
    SU2 --> j12["j = 1/2<br/>2×2 행렬<br/>전자·쿼크"]
    SU2 --> j1["j = 1<br/>3×3 행렬<br/>W 보손"]
    SU2 --> j32["j = 3/2<br/>4×4 행렬<br/>gravitino"]
    SU2 --> jdots["..."]
    style SU2 fill:#fef,stroke:#636
    style j12 fill:#ffd,stroke:#aa0

그림 D.6: SU(2)군의 스핀 표현과 입자

표 D.3: SU(2)의 표현과 스핀 양자수

표현 차원 \((2j+1)\) 물리적 의미
\(j = 0\)(자명 표현) 1 스칼라(스핀 0)
\(j = 1/2\)(기본 표현) 2 스핀 \(1/2\)(전자, 쿼크)
\(j = 1\)(수반 표현, 아래서 정의) 3 스핀 \(1\)(\(W\) 보손)
\(j = 3/2\) 4 스핀 \(3/2\)(gravitino)

\(SU(2)\)의 수반 표현의 차원은 생성원의 수(= 3)와 같다. \(2j+1 = 3\)을 만족하는 것은 \(j = 1\)이므로, 수반 표현은 스핀 1의 표현과 일치한다.

기본 표현(\(j = 1/2\))에서, 생성원은 \(T_i = \sigma_i/2\)(\(2 \times 2\) 행렬).

수반 표현(\(j = 1\))에서, 생성원은 \(3 \times 3\) 행렬이고 그 성분은 구조상수 그 자체:

\[(T_a)_{bc} = -if_{abc}\]

왜 이 정의가 자연스러운가 하면, 교환 관계 \([T_a, T_b] = if_{abc}T_c\)는 「\(T_a\)\(T_b\)에 작용하여 \(T_c\) 방향으로 돌린다」로 읽을 수 있어. 즉 생성원 자체가, 다른 생성원을 「돌리는」 행렬로서 행동해——그 행렬 성분이 바로 구조상수 \(f_{abc}\)인 거야.

🔵 카이: 허, 구조상수가 그대로 행렬 성분이 되는 거구나. 뭔가 자기 참조적이어서 재밌다.

🟡 리나: 수반 표현의 차원은 생성원의 수와 같아(\(SU(2)\)이면 3, \(SU(3)\)이면 8). 이것이 「게이지장은 수반 표현에 속한다」→「매개 입자의 수 = 생성원의 수」라는 대응의 수학적 근거야.

\(SU(2)\)의 경우, \((T_i)_{jk} = -i\varepsilon_{ijk}\)가 된다. 즉 \(T_i\)라는 행렬의 \((j, k)\) 성분이 \(-i\varepsilon_{ijk}\)로 주어진다. 예를 들어 \(T_1\)\((2,3)\) 성분은, \(i=1, j=2, k=3\)을 대입하면 \((T_1)_{23} = -i\varepsilon_{123} = -i\)(\(\varepsilon_{123} = +1\)은 기본 순열). \((3,2)\) 성분은 \((T_1)_{32} = -i\varepsilon_{132} = +i\)(\(132\)\(123\)의 마지막 2개(\(2\)\(3\))를 교환한 것으로, 1번 교환 = 홀수 치환이므로 \(\varepsilon_{132} = -1\)). 대각 성분은? 예를 들어 \((T_1)_{11} = -i\varepsilon_{111}\). \(\varepsilon_{ijk}\)는 같은 첨자가 2개 이상 포함되면 0이므로, \((T_1)_{11} = 0\). 마찬가지로 \((T_1)_{12} = -i\varepsilon_{112} = 0\), \((T_1)_{13} = -i\varepsilon_{113} = 0\). 즉 \(T_1\)의 제1행과 제1열은 전부 0. 마찬가지로 전체 성분을 써 내면:

\[T_1 = \begin{pmatrix} 0&0&0 \\ 0&0&-i \\ 0&i&0 \end{pmatrix}, \quad T_2 = \begin{pmatrix} 0&0&i \\ 0&0&0 \\ -i&0&0 \end{pmatrix}, \quad T_3 = \begin{pmatrix} 0&-i&0 \\ i&0&0 \\ 0&0&0 \end{pmatrix}\]

이들이 \([T_i, T_j] = i\varepsilon_{ijk}T_k\)를 만족하는 것은 직접 계산으로 확인할 수 있다.

표준모형에서의 입자 분류

제 9 장의 표준모형에서, 각 입자는 게이지 군의 특정 표현에 속한다:

  • 왼손 쿼크: \(SU(3)\)의 기본 표현(3차원)이면서 \(SU(2)\)의 기본 표현(2차원)
  • 오른손 전자: \(SU(2)\)의 자명 표현(1차원, 즉 약한 힘을 느끼지 못함)
  • 글루온: \(SU(3)\)의 수반 표현(8차원)

🔵 카이: 허, 왼손 쿼크는 \(SU(3)\)에서 3차원, \(SU(2)\)에서 2차원……이라고, 입자마다 「어떤 표현에 속하는지」가 정해져 있구나.

🟡 리나: 맞아. 그리고 역으로 말하면, 대칭성이 입자를 분류하고 있어. 대칭성을 지정하면, 어떤 입자가 존재할 수 있는지가 제약돼. 이것이 군론이 물리에서 강력한 이유야.

⚪ 메이: 즉, 입자의 성질은 「어떤 군의 어떤 표현에 속하는가」라는 라벨로 정리할 수 있다는 뜻이네요.

✅ 이해도 체크: 표준모형에서 글루온은 \(SU(3)\)의 어떤 표현에 속하고, 그 차원은 얼마인가요?

수반 표현에 속하고, 차원은 8. 이것이 8종류의 글루온이 존재하는 이유.

📝 연습문제:

✅ 이해도 체크: 군의 「표현」이란 무엇인가요?

군의 추상적 원소를 구체적인 행렬로 실현하는 것. 같은 군이라도 다른 크기의 행렬로 표현할 수 있다.

✅ 이해도 체크: \(SU(2)\)의 기본 표현(\(2 \times 2\) 행렬)은 물리적으로 스핀 얼마의 입자에 대응하나요?

스핀 \(1/2\)의 입자(전자, 쿼크 등)에 대응한다.


D.6 대칭성과 보존법칙 — Noether의 정리 도출

정리의 주장

🟡 리나: 연속적인 대칭성에는 대응하는 보존량이 있다. 이것이 Noether의 정리야. 「양자역학」편 「양자역학」편 제 26 장과 「장의 양자론」편 「장의 양자론」편 제 3 장에서 이미 다뤘지만, 여기서는 장이론 버전의 도출을 꼼꼼히 해 볼게.

도출

\(\phi(x)\)작용(action)을 생각한다. 작용이란 장 운동의 「비용」을 나타내는 양이야. 고등학교 물리에서 「빛은 최단 경로를 지나간다」(Fermat의 원리)를 배웠을 수도 있는데, 같은 발상으로 자연계의 장은 「작용이 최소(정확히는 정류)가 되는 배위」를 선택해——이것이 최소작용의 원리. Newton의 운동방정식도 실은 이 원리에서 도출할 수 있어(「장의 양자론」편 「장의 양자론」편 제 3 장 참조). 작용은 라그랑지안 밀도 \(\mathcal{L}\)를 시공간 전체에서 적분한 것:

\[S = \int d^4x\, \mathcal{L}(\phi, \partial_\mu\phi)\]

여기서 \(\mathcal{L}\)는 장 \(\phi\)와 그 미분 \(\partial_\mu\phi\)(\(\mu = 0, 1, 2, 3\)으로, 시간 미분 \(\partial_0\phi = \partial\phi/\partial t\)와 공간 미분 \(\partial_i\phi\)의 4성분)의 함수. \(d^4x = dt\,dx\,dy\,dz\)는 4차원 시공간의 부피 요소. 작용을 최소로 하는 조건에서 도출되는 방정식이 Euler-Lagrange 방정식(운동방정식):

\[\frac{\partial\mathcal{L}}{\partial\phi} - \partial_\mu\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)} = 0\]

여기서 제2항은 \(\mu = 0, 1, 2, 3\)에 대해 합을 취한다(같은 첨자 \(\mu\)가 반복 출현하면 합을 취하는 약속). 전개하면 \(\partial_0\frac{\partial\mathcal{L}}{\partial(\partial_0\phi)} + \partial_1\frac{\partial\mathcal{L}}{\partial(\partial_1\phi)} + \partial_2\frac{\partial\mathcal{L}}{\partial(\partial_2\phi)} + \partial_3\frac{\partial\mathcal{L}}{\partial(\partial_3\phi)}\)라는 4개 항의 합. 예를 들어 \(\mu = 2\)의 항은 「\(\partial_2\phi\)\(\mathcal{L}\)를 미분하고, 그 결과를 다시 \(x^2\)로 미분한다」는 의미.

🔵 카이: 잠깐, \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\)는 「미분으로 미분한다」는 거야? 뭘 변수로 보는 건데?

🟡 리나: 좋은 질문이야. \(\mathcal{L}\)\(\phi\)\(\partial_\mu\phi\) 둘을 「독립 변수」로 받아들이는 함수라고 생각해. 예를 들어 \(f(x, y)\)\(x\)로 편미분할 때 \(y\)는 상수 취급하잖아? 그것과 같아서, \(\partial\mathcal{L}/\partial\phi\)는 「\(\partial_\mu\phi\)를 고정하고 \(\phi\)만 움직였을 때의 변화율」, \(\partial\mathcal{L}/\partial(\partial_\mu\phi)\)는 「\(\phi\)를 고정하고 \(\partial_\mu\phi\)만 움직였을 때의 변화율」이야. 표기는 기묘하게 보이지만, 하고 있는 것은 보통의 편미분이야.

직관적으로는, 제1항 \(\frac{\partial\mathcal{L}}{\partial\phi}\)는 「장 \(\phi\)의 값 자체가 라그랑지안에 어떻게 기여하는가」, 제2항은 「장의 변화율(미분)이 어떻게 기여하는가」를 나타내고, 양자의 균형이 운동방정식을 결정해. Newton의 \(F = ma\)로 말하면, 힘(퍼텐셜의 미분)과 가속도(위치의 2계 미분)의 균형에 대응하는 거야.

🔵 카이: 즉, Newton 운동방정식의 「장 버전」 같은 거구나. 하지만, 왜 이 식의 형태가 되는지는 솔직히 아직 잘 모르겠어.

🟡 리나: 솔직하게 말해줘서 고마워. 간단히 말하면, 「작용 \(S\)를 최소로 한다」는 것은 「\(S\)를 조금 바꿨을 때 변화가 0이다」는 거야. \(f(x)\)의 최솟값에서 \(f'(x) = 0\)이 되는 것과 같은 발상이야. 실은 1차원 입자의 경우, \(L = \frac{1}{2}m\dot{x}^2 - V(x)\)에 대해 Euler-Lagrange 방정식 \(\frac{\partial L}{\partial x} - \frac{d}{dt}\frac{\partial L}{\partial \dot{x}} = 0\)을 적용하면, \(\frac{\partial L}{\partial x} = -V'(x)\)\(\frac{\partial L}{\partial \dot{x}} = m\dot{x}\)이므로 \(-V'(x) - m\ddot{x} = 0\), 즉 \(m\ddot{x} = -V'(x)\)——Newton의 \(F = ma\)가 그대로 나와. 장이론 버전은 그 확장으로, 입자의 위치 \(x(t)\) 대신 장 \(\phi(x)\)가, 속도 \(\dot{x}\) 대신 장의 미분 \(\partial_\mu\phi\)가 대응한다고 생각하면 돼. 대응 관계를 표로 정리하면:

입자 역학 장이론
위치 \(x(t)\) \(\phi(x)\)
속도 \(\dot{x}\) 장의 미분 \(\partial_\mu\phi\)
시간 \(t\) 시공간 좌표 \(x^\mu\)
\(\frac{\partial L}{\partial x} - \frac{d}{dt}\frac{\partial L}{\partial\dot{x}} = 0\) \(\frac{\partial\mathcal{L}}{\partial\phi} - \partial_\mu\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)} = 0\)

⚪ 메이: 입자 역학과 장이론의 대응이 깔끔하게 정렬되네요. 구조는 같고 변수가 늘어난 것뿐이라는 뜻이네요.

🟡 리나: 도출의 상세는 「장의 양자론」편 「장의 양자론」편 제 3 장에서 꼼꼼히 하니까, 여기서는 「작용을 최소로 하는 조건에서 나오는 운동방정식」으로 인정하고 앞으로 나아가자.

지금부터 Noether의 정리를 도출하는데, 사용하는 것은 지금의 Euler-Lagrange 방정식과, 고등학교에서 배운 곱의 미분 공식 \((fg)' = f'g + fg'\), 그리고 다변수 함수의 전미분(\(\Delta f \approx \frac{\partial f}{\partial x}\Delta x + \frac{\partial f}{\partial y}\Delta y\))의 3가지뿐이야. 전미분은 바로 뒤에 설명하니까 걱정하지 마. Euler-Lagrange 방정식을 「운동방정식이 성립하는 장에서는 어떤 양이 0이 된다」는 사실로 받아들여 주면, 나머지 논의는 따라갈 수 있을 거야.

연속 변환 \(\phi(x) \to \phi(x) + \delta\phi(x)\) 아래에서, 라그랑지안 밀도의 변화는:

\[\delta\mathcal{L} = \frac{\partial\mathcal{L}}{\partial\phi}\,\delta\phi + \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\delta(\partial_\mu\phi)\]

이것은 다변수 함수의 전미분과 같은 구조야. 1변수의 경우, \(f(x)\)\(x\)에서 \(x + \Delta x\)로 바꿨을 때 \(\Delta f \approx f'(x)\Delta x\)로 쓸 수 있는 것은 고등학교에서 배웠을 거야. 2변수의 경우는 그 확장으로, \(f(x, y)\)의 미소 변화는 \(\Delta f \approx \frac{\partial f}{\partial x}\Delta x + \frac{\partial f}{\partial y}\Delta y\)——각 변수 변화에 의한 기여를 합산하는 것뿐이야. 같은 요령으로, \(\mathcal{L}(\phi, \partial_\mu\phi)\)의 두 「변수」 \(\phi\)\(\partial_\mu\phi\)가 각각 \(\delta\phi\)\(\delta(\partial_\mu\phi)\)만큼 변화했을 때의 \(\mathcal{L}\)의 변화를 나타내고 있어(제2항의 \(\mu\)에 대해서는 합을 취함).

🔵 카이: 그렇구나, 각 변수의 변화를 합산하는 것뿐이라는 거지. 전미분이라는 이름은 거창하지만 하는 것은 단순하구나.

🟡 리나: \(\delta\)\(\partial_\mu\)는 순서를 교환할 수 있어. \(\delta\)는 「장의 형태를 조금 바꾸는」 조작, \(\partial_\mu\)는 「어떤 점에서의 기울기를 보는」 조작으로, 서로 간섭하지 않아. 구체적으로 확인하자: \(\phi\)\(\phi + \epsilon\, \eta(x)\)로 바꿨다고 하자(\(\eta(x)\)는 변화의 「형태」). 그러면 \(\delta\phi = \epsilon\,\eta\)이고, \(\partial_\mu(\delta\phi) = \epsilon\,\partial_\mu\eta\). 한편, \(\delta(\partial_\mu\phi) = \partial_\mu(\phi + \epsilon\,\eta) - \partial_\mu\phi = \epsilon\,\partial_\mu\eta\). 확실히 일치해. 즉 \(\delta(\partial_\mu\phi) = \partial_\mu(\delta\phi)\). 대입하면:

\[\delta\mathcal{L} = \frac{\partial\mathcal{L}}{\partial\phi}\,\delta\phi + \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\partial_\mu(\delta\phi)\]

여기서부터의 목표는, \(\delta\mathcal{L}\)를 「운동방정식 부분」과 「전미분 부분」으로 분리하는 것이야. 그러기 위해 제2항을 곱의 미분 공식으로 바꿔 쓴다:

\[\partial_\mu\left[\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\delta\phi\right] = \partial_\mu\left[\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right]\delta\phi + \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\partial_\mu(\delta\phi)\]

이것을 사용하면:

\[\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\partial_\mu(\delta\phi) = \partial_\mu\left[\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\delta\phi\right] - \partial_\mu\left[\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right]\delta\phi\]

이것을 대입하면:

\[\delta\mathcal{L} = \left[\frac{\partial\mathcal{L}}{\partial\phi} - \partial_\mu\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right]\delta\phi + \partial_\mu\left[\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\delta\phi\right]\]

⚪ 메이: 제1항이 정확히 Euler-Lagrange 방정식의 형태가 되어 있네요.

🟡 리나: 맞아. 제1항의 \([\cdots]\)Euler-Lagrange 방정식(운동방정식) 그 자체야. 운동방정식이 성립하는 장(on-shell)에서는 이것이 0:

\[\frac{\partial\mathcal{L}}{\partial\phi} - \partial_\mu\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)} = 0 \quad \text{(운동방정식)}\]

따라서, 운동방정식이 성립할 때:

\[\delta\mathcal{L} = \partial_\mu\left[\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\delta\phi\right]\]

여기서, 변환이 대칭성이라 함은 작용 \(S\)가 불변이라는 것. 가장 단순한 경우는 \(\delta\mathcal{L} = 0\)(라그랑지안 밀도 자체가 불변)이고, 이때:

\[\boxed{\delta\mathcal{L} = 0 \quad \Longrightarrow \quad \partial_\mu j^\mu = 0}\]

여기서 Noether 커런트 \(j^\mu\)는:

\[\boxed{j^\mu = \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\delta\phi}\]

장이 여러 성분을 가지는 경우(예를 들어 복소장 \(\phi\)\(\phi^*\))는, 각 성분으로부터의 기여를 합산한다: \(j^\mu = \sum_i \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi_i)}\,\delta\phi_i\). 구체적 예 2에서 실제로 이것을 사용한다.

더 일반적으로는, \(\delta\mathcal{L}\)가 0이 아니더라도 전미분 \(\delta\mathcal{L} = \partial_\mu K^\mu\)의 형태가 되면 작용은 불변(경계항이 사라지는 조건 하에서)이며, 보존 커런트는 \(j^\mu - K^\mu\)로 수정된다. 공간 병진의 예(아래)는 이 일반적인 경우에 해당하지만, 본질적 구조는 같다.

\(\partial_\mu j^\mu = 0\)보존법칙(연속 방정식). 대응하는 보존 전하는:

\[Q = \int d^3x\, j^0(x)\]

\(Q\)가 보존되는가: \(\partial_\mu j^\mu = \partial_0 j^0 + \partial_i j^i = 0\)을 공간 전체에서 적분하면, \(\frac{dQ}{dt} = -\int d^3x\, \partial_i j^i\). 우변은 Gauss의 정리로 경계(무한원)에서의 면적분이 되지만, 장이 무한원에서 0이 되는 조건 하에서 사라진다. 따라서 \(\frac{dQ}{dt} = 0\)(\(Q\)는 시간 변화하지 않음).

🔵 카이: 잠깐. 중간에 곱의 미분 공식을 사용해서 항을 나눈 것은, Euler-Lagrange 방정식의 형태를 만들어내기 위해서였구나.

🟡 리나: 맞아. 운동방정식을 만족하는 장에서는 제1항이 0이 되니까, 나머지가 전미분 형태가 되지. 그것이 보존법칙이야.

🔵 카이: 대단해. 대칭성(\(\delta\mathcal{L} = 0\))을 가정하는 것만으로, 보존량이 자동으로 나오는 거구나.

🟡 리나: 맞아. 이것이 Noether의 정리의 위력이야. 구체적인 예를 살펴보자.

구체적 예 1: 공간 병진 → 운동량 보존

::: {.callout-tip}

읽는 방법 힌트

이 예는 첨자 조작이 다소 무거워요. 만약 중간에 막히면, 먼저 「구체적 예 2: \(U(1)\) 위상 변환 → 전하 보존」을 읽고 나서 돌아오면, Noether의 정리 구조가 명확하게 보일 거예요. :::

이 예는 앞의 도출보다 약간 복잡하고, \(\delta\mathcal{L} = 0\)이 아니라 전미분이 되는 경우에 해당해. 「전미분이 된다」는 것은, \(\delta\mathcal{L}\)가 0은 아니지만 \(\delta\mathcal{L} = \partial_\mu(\text{무언가})\) 형태로 쓸 수 있다는 것——이 경우에도 작용의 적분은 경계 조건 하에서 불변이 돼.

변환: \(\phi(x) \to \phi(x + \epsilon) \approx \phi(x) + \epsilon^\nu \partial_\nu\phi\)

\(\delta\phi = \epsilon^\nu \partial_\nu\phi\). 각 방향 \(\nu\)마다 Noether 커런트가 하나씩 얻어진다. \(\nu\) 방향의 병진에 대응하는 커런트는:

공간 병진에서는 \(\delta\phi = \epsilon^\nu\partial_\nu\phi\)이므로, Noether 커런트 공식 \(j^\mu = \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\delta\phi\)에 대입하면 \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\epsilon^\nu\partial_\nu\phi\)가 얻어진다.

그러나 공간 병진 아래에서는 라그랑지안 밀도 자체도 0이 아닌 전미분으로 변화한다. 왜일까? \(\mathcal{L}\)\(\phi\)\(\partial_\mu\phi\)의 함수인데, \(\phi(x)\) 자체가 \(x\)에 의존하므로 결국 \(\mathcal{L}\)\(x\)의 함수이기도 해. 공간을 \(\epsilon\)만큼 이동하면, \(\mathcal{L}\)의 값도 위치가 이동한 만큼 변해. 구체적으로는, \(\mathcal{L}(x) \to \mathcal{L}(x + \epsilon) \approx \mathcal{L}(x) + \epsilon^\nu\partial_\nu\mathcal{L}(x)\). 즉 \(\delta\mathcal{L} = \epsilon^\nu\partial_\nu\mathcal{L}\). \(\epsilon^\nu\)는 상수(위치에 의존하지 않는 미소량)이므로 \(\partial_\mu\) 밖으로 꺼낼 수 있다. 여기서 \(\partial_\nu\mathcal{L}\)\(\partial_\mu(\cdots)\) 형태로 정리하고 싶어. 왜 그렇게 하고 싶냐면, 최종적으로 보존 커런트 \(j^\mu\)\(\delta\mathcal{L}\) 부분을 「같은 \(\partial_\mu\) 안에 합쳐서 빼기」함으로써 보존법칙 \(\partial_\mu(\cdots) = 0\) 형태로 가져가고 싶기 때문이야. 그러려면 양자가 같은 첨자 \(\mu\)\(\partial_\mu(\cdots)\)라고 쓰여 있어야 해. 물리적 내용은 아무것도 변하지 않았어——첨자를 맞추기 위한 준비야.

그러기 위해 Kronecker 델타 \(\delta^\mu_\nu\)를 사용해. 이것은 \(\mu = \nu\)일 때 1, \(\mu \neq \nu\)일 때 0이 되는 기호야. 예를 들어 \(\delta^0_0 = 1\), \(\delta^1_0 = 0\), \(\delta^2_2 = 1\) 등. 가장 중요한 성질은 「첨자를 골라낸다」는 것: \(\sum_\mu \delta^\mu_\nu A_\mu = A_\nu\)(\(\mu = \nu\)인 항만 살아남고, 나머지는 0으로 사라짐). 구체적으로 \(\nu = 2\)이면 \(\sum_\mu \delta^\mu_2 A_\mu = \delta^0_2 A_0 + \delta^1_2 A_1 + \delta^2_2 A_2 + \delta^3_2 A_3 = 0 + 0 + A_2 + 0 = A_2\).

이것을 사용하면 \(\partial_\nu\mathcal{L} = \delta^\mu_\nu\partial_\mu\mathcal{L}\)로 다시 쓸 수 있다. 따라서 \(\delta\mathcal{L} = \epsilon^\nu \delta^\mu_\nu\partial_\mu\mathcal{L} = \partial_\mu(\epsilon^\nu \delta^\mu_\nu \mathcal{L})\)(마지막 등호는 \(\epsilon^\nu \delta^\mu_\nu\)가 상수이므로 \(\partial_\mu\) 안에 넣을 수 있다는 것에 의함). 이것은 앞서 말한 「\(\delta\mathcal{L}\)가 전미분 \(\partial_\mu K^\mu\) 형태이면 보존 커런트는 \(j^\mu - K^\mu\)로 수정된다」는 일반적인 경우에 해당해. \(\delta\mathcal{L} = \epsilon^\nu\partial_\nu\mathcal{L} = \partial_\mu(\epsilon^\nu\delta^\mu_\nu\mathcal{L})\)이므로 \(K^\mu = \epsilon^\nu\delta^\mu_\nu\mathcal{L}\)(여기서 \(\delta^\mu_\nu\)는 Kronecker 델타로, \(\mu = \nu\)일 때 1, 그 외에는 0. \(\sum_\mu \delta^\mu_\nu A_\mu = A_\nu\)처럼 첨자를 골라내는 역할을 함). 수정된 보존 커런트는 \(j^\mu - K^\mu\)이므로:

\[j^\mu - K^\mu = \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\epsilon^\nu\partial_\nu\phi - \epsilon^\nu\delta^\mu_\nu\mathcal{L} = \epsilon^\nu\left[\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\partial_\nu\phi - \delta^\mu_\nu \mathcal{L}\right]\]

마지막 등호에서 \(\epsilon^\nu\)를 공통 인자로 묶었다. 괄호 안을 \(T^\mu{}_\nu\)로 정의한다:

\[T^\mu{}_\nu \equiv \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\partial_\nu\phi - \delta^\mu_\nu \mathcal{L}\]

보존 커런트의 보존법칙 \(\partial_\mu(j^\mu - K^\mu) = 0\)\(\partial_\mu(\epsilon^\nu T^\mu{}_\nu) = \epsilon^\nu \partial_\mu T^\mu{}_\nu = 0\)으로 쓸 수 있다(\(\epsilon^\nu\)는 상수이므로 \(\partial_\mu\) 밖으로 꺼낼 수 있음). 여기서 \(\epsilon^\nu\)는 임의의 미소 상수 벡터이므로, 임의의 \(\epsilon^\nu\)에 대해 \(\epsilon^\nu \partial_\mu T^\mu{}_\nu = 0\)이 성립하려면, 각 \(\nu\)에 대해 \(\partial_\mu T^\mu{}_\nu = 0\)이어야 한다(임의의 \(\epsilon^\nu\)에 대해 \(\epsilon^\nu X_\nu = 0\)이 성립하면 \(X_\nu = 0\)이라는 논법). 즉, 정준 에너지-운동량 텐서 \(T^\mu{}_\nu\)는 보존법칙을 만족한다:

\[\partial_\mu T^\mu{}_\nu = 0\]

여기서 \(T^\mu{}_\nu\)는 위 첨자 \(\mu\)와 아래 첨자 \(\nu\)를 가진 양으로, \(\mu\)는 「흐름의 방향」, \(\nu\)는 「병진의 방향」을 지정한다(\(\nu = 0\)이 시간 방향, \(\nu = 1, 2, 3\)이 공간 방향). 이 양은 장의 에너지나 운동량의 「흐름」을 기술한다(자세한 것은 「장의 양자론」편 「장의 양자론」편 제 3 장 참조). 보존 전하는:

\[P_\nu = \int d^3x\, T^0{}_\nu\]

\(\nu = 1, 2, 3\)일 때 \(P_\nu\)는 각 방향의 운동량에 대응한다. \(\nu = 0\)일 때는 에너지에 대응하는 보존량이 얻어진다(정확한 부호는 계량의 부호 규약에 의존하지만, 여기서는 「시간 병진 → 에너지 보존, 공간 병진 → 운동량 보존」이라는 대응 관계가 본질). 즉, 공간 병진의 대칭성으로부터 운동량 보존이, 시간 병진의 대칭성으로부터 에너지 보존이 도출된다.

🔵 카이: 솔직히 첨자가 많이 나와서 중간 계산은 다 따라가지 못했어. 하지만 결론은 「공간을 이동해도 물리가 변하지 않는다 → 운동량이 보존된다」는 거지?

🟡 리나: 맞아, 결론은 그거야. 중간의 첨자 조작은 부록 C 연습이라고 생각해. 중요한 건 「대칭성 → 보존법칙」이라는 구조가, 다음 \(U(1)\) 예에서 더 명확하게 보이니까, 그쪽을 먼저 이해한 후 돌아와도 괜찮아.

구체적 예 2: \(U(1)\) 위상 변환 → 전하 보존

복소 스칼라장 \(\phi\)에 대한 변환: \(\phi \to e^{i\alpha}\phi \approx \phi + i\alpha\phi\)(\(\alpha \ll 1\))

\(\delta\phi = i\alpha\phi\). Noether 커런트는:

복소장 \(\phi\)는 실부 \(\phi_1\)과 허부 \(\phi_2\)(\(\phi = \phi_1 + i\phi_2\))의 2개의 실수장을 합친 것이야.

🔵 카이: 잠깐, \(\phi^*\)\(\phi\)가 정해지면 자동으로 정해지잖아? 왜 「독립 변수」로 취급할 수 있어?

🟡 리나: 좋은 의문이야. 실은 \(\phi\)\(\phi^*\)를 독립적으로 취급하는 것은, \(\phi_1 = (\phi + \phi^*)/2\)\(\phi_2 = (\phi - \phi^*)/(2i)\)를 독립적으로 취급하는 것과 수학적으로 동치야. 변수를 \((\phi_1, \phi_2)\)에서 \((\phi, \phi^*)\)로 변환한 것뿐이야. 편미분 계산이 편해지는 테크닉이야.

🔵 카이: 아, 실부와 허부를 따로 취급하는 것과 같은 걸 \(\phi\)\(\phi^*\)로 하고 있을 뿐이구나.

🟡 리나: 맞아. 그러면 계속하자. \(\delta\phi = i\alpha\phi\), \(\delta\phi^* = -i\alpha\phi^*\)이므로, Noether 커런트는 양쪽 기여를 합산한다. 일반 공식 \(j^\mu = \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi_i)}\,\delta\phi_i\)에 대입하면 \(\alpha\left[\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,(i\phi) + \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi^*)}\,(-i\phi^*)\right]\)가 얻어진다. 보존법칙 \(\partial_\mu j^\mu = 0\)은 전체에 곱해진 상수 \(\alpha\)를 나눠도 성립하므로, \(\alpha\)를 제외한 부분을 새롭게 Noether 커런트로 정의한다: $\(j^\mu = \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,(i\phi) + \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi^*)}\,(-i\phi^*)\)$

예를 들어, 자유 복소 스칼라장 \(\mathcal{L} = (\partial_\mu\phi)^*(\partial^\mu\phi) - m^2\phi^*\phi\)의 경우를 생각하자. 결론을 먼저 말하면, \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)} = \partial^\mu\phi^*\)가 된다(마찬가지로 \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi^*)} = \partial^\mu\phi\)). 직관적으로는 「\(\mathcal{L}\) 안에서 \(\partial_\mu\phi\)에 곱해져 있는 짝을 읽어내는」 조작으로, \(f(x,y) = xy\)\(x\)로 미분하면 \(y\)가 남는 것과 같아.

::: {.callout-tip}

처음 읽는 분에게

아래의 첨자 조작 상세는 처음 읽을 때는 건너뛰고, 「이들을 Noether 커런트 공식에 대입하면」 단락으로 진행해도 괜찮아요. 결론만 기억해 두면 충분: \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)} = \partial^\mu\phi^*\), \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi^*)} = \partial^\mu\phi\). 이들을 Noether 커런트 공식에 대입하면 최종 결과는 \(j^\mu = i(\phi\,\partial^\mu\phi^* - \phi^*\,\partial^\mu\phi)\)가 됩니다. :::

\(\phi\)\(\phi^*\)를 독립 변수로 취급하면, \(\mathcal{L}\) 중에서 \(\partial_\mu\phi\)를 포함하는 부분은 \((\partial_\mu\phi)^*(\partial^\mu\phi)\). 여기서 \(\partial^\mu\phi \equiv \eta^{\mu\nu}\partial_\nu\phi\)부록 C 에서 배운 「첨자를 올린 미분」으로, Minkowski 계량 \(\eta^{\mu\nu}\)를 사용하여 아래 첨자를 위 첨자로 변환한 것.

결론을 먼저 말하면:

\[\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)} = \partial^\mu\phi^*\]

이것은 「\(\mathcal{L}\) 안에서 \(\partial_\mu\phi\)에 곱해져 있는 계수를 읽어내는」 조작. 아래에서 확인하자.

먼저 간단한 경우에서 연습한다. 만약 \(\mathcal{L}\)가 단순히 \(\mathcal{L} = (\partial_0\phi^*)(\partial_0\phi)\)였다면, \(\frac{\partial\mathcal{L}}{\partial(\partial_0\phi)} = \partial_0\phi^*\)는 명확(\(f(x) = ax\)\(x\)로 미분하면 \(a\)가 남는 것과 같음). 일반적인 경우는, \((\partial_\mu\phi)^*(\partial^\mu\phi)\)를 첨자를 명시해서 쓰면 \(\sum_{\nu}(\partial_\nu\phi^*)(\eta^{\nu\rho}\partial_\rho\phi)\)(\(\nu\), \(\rho\)에 대해 합을 취함). 여기서 \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\)를 구하고 싶다. 주의: 여기서의 \(\mu\)는 합을 취하는 첨자가 아니라, 특정 값에 고정된 첨자(예를 들어 \(\mu = 2\)이면 「\(\partial_2\phi\)로 미분한다」는 의미). \(\partial_0\phi\), \(\partial_1\phi\), \(\partial_2\phi\), \(\partial_3\phi\)의 4개를 독립 변수로 보고, 그중 하나인 \(\partial_\mu\phi\)로 미분하는 조작.

아까의 간단한 경우와 같은 요령으로 생각하자.

::: {.callout-tip}

첨자 읽는 법 주의

여기서의 \(\mu\)고정된 특정 값(예를 들어 \(\mu = 2\))이며, 합을 취하는 첨자가 아니다. 「\(\partial_\mu\phi\)로 미분한다」는 것은 「\(\partial_0\phi, \partial_1\phi, \partial_2\phi, \partial_3\phi\)의 4개 독립 변수 중 \(\mu\)번째 것으로 미분한다」는 의미. :::

\(\sum_{\rho}\eta^{\nu\rho}\partial_\rho\phi\) 중에서 \(\partial_\mu\phi\)를 포함하는 것은 \(\rho = \mu\)인 항(즉 \(\eta^{\nu\mu}\partial_\mu\phi\))뿐. 다른 \(\rho \neq \mu\)인 항은 \(\partial_\mu\phi\)를 포함하지 않으므로 「상수」 취급이 되어 \(\partial_\mu\phi\)로 미분하면 0. 따라서 \(\rho = \mu\)인 항의 계수 \(\eta^{\nu\mu}\)만 남는다. \(\nu\)에 대해 합을 취하면 \(\sum_{\nu}(\partial_\nu\phi^*)\eta^{\nu\mu}\)가 얻어진다. 여기서 Minkowski 계량은 대칭(\(\eta^{\nu\mu} = \eta^{\mu\nu}\))이므로, \(\sum_{\nu}(\partial_\nu\phi^*)\eta^{\nu\mu} = \sum_{\nu}\eta^{\mu\nu}\partial_\nu\phi^* \equiv \partial^\mu\phi^*\)가 된다. 마찬가지로 \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi^*)} = \partial^\mu\phi\). 이들을 Noether 커런트 공식에 대입하면:

\[j^\mu = (\partial^\mu\phi^*)(i\phi) + (\partial^\mu\phi)(-i\phi^*) = i(\phi\,\partial^\mu\phi^* - \phi^*\,\partial^\mu\phi)\]

::: {.callout-note}

부호 규약에 대해

문헌에 따라서는 \(j^\mu = i(\phi^*\,\partial^\mu\phi - \phi\,\partial^\mu\phi^*)\)(전체 부호가 반대)를 채택하는 것도 있다. 이것은 \(\delta\phi\)의 정의에서 \(\alpha\)의 부호를 어느 쪽으로 취하느냐의 규약 차이이며, 전하 \(Q\)의 양음 정의에 대응한다. 물리적 결론(전하가 보존된다는 것)은 어떤 규약이든 같다. 여기서는 Noether 커런트 공식에의 직접 대입에 충실한 형태를 채택했다. :::

보존 전하 \(Q = \int d^3x\, j^0\)전하. 전하 보존은 \(U(1)\) 대칭성의 귀결.

✅ 이해도 체크: \(U(1)\) 위상 대칭성 \(\phi \to e^{i\alpha}\phi\)에 대응하는 Noether의 보존량은 무엇인가요?

전하. \(U(1)\) 대칭성으로부터 Noether의 정리에 의해 전하 보존이 도출된다.

정리 표

표 D.4: Noether의 정리: 대칭성과 보존량의 대응

대칭성 변환 보존량
시간 병진 \(t \to t + \epsilon\) 에너지
공간 병진 \(\mathbf{x} \to \mathbf{x} + \boldsymbol{\epsilon}\) 운동량
회전 \(\mathbf{x} \to R\mathbf{x}\) 각운동량
\(U(1)\) 게이지 \(\psi \to e^{i\theta}\psi\) 전하
\(SU(3)\) 게이지 쿼크의 색 변환 색하
%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart LR
    subgraph 대칭성
        T["시간 병진"]
        X["공간 병진"]
        R["회전"]
        U["U(1) 게이지"]
    end
    subgraph 보존량
        E["에너지"]
        P["운동량"]
        L["각운동량"]
        Q["전하"]
    end
    T -->|Noether| E
    X -->|Noether| P
    R -->|Noether| L
    U -->|Noether| Q

그림 D.7: Noether의 정리: 대칭성과 보존량

대칭성이 많을수록 보존량이 많다. 보존량이 많을수록 계의 행동이 제약된다. 이것이 대칭성이 물리학에서 압도적으로 중요한 이유야.

✅ 이해도 체크: Noether의 정리는 무엇을 말하고 있나요?

연속적인 대칭성에는 대응하는 보존량이 있다(예: 시간 병진 대칭성→에너지 보존).

✅ 이해도 체크: 공간 병진 대칭성에 대응하는 보존량은 무엇인가요?

운동량.


D.7 게이지 대칭성과 공변 미분

전역적 대칭성에서 국소적 대칭성으로

🟡 리나: D.6절에서 본 \(U(1)\) 대칭성 \(\phi \to e^{i\alpha}\phi\)는, \(\alpha\)가 상수(시공간 어디서나 같은 값)인 경우야. 이것을 전역적(global) 대칭성이라 불러.

여기서, 더 강한 요구를 해 보자: \(\alpha\)를 시공간의 각 점에서 독립적으로 선택할 수 있는, 즉 \(\alpha \to \alpha(x)\)로 해도 물리가 변하지 않는 것을 요구한다. 이것이 국소적(local) 대칭성, 즉 게이지 대칭성이야.

🔵 카이: 왜 일부러 그렇게 강한 요구를 하는 거야?

🟡 리나: 역사적으로는 「물리법칙은 좌표계 선택에 의존해서는 안 된다」는 일반상대론 정신의 확장이야. 그리고 놀랍게도, 국소 대칭성을 요구하면 힘을 매개하는 장(게이지장)이 자동으로 나타나. 대칭성으로부터 힘이 태어나는 거야.

문제의 발견: 보통의 미분은 게이지 불변이 아니다

자유 복소 스칼라장의 라그랑지안을 생각한다(D.6절의 구체적 예 2에서 사용한 것과 같다. \(\partial^\mu = \eta^{\mu\nu}\partial_\nu\)부록 C 에서 배운 첨자의 올리고 내리기):

\[\mathcal{L} = (\partial_\mu\phi)^*(\partial^\mu\phi) - m^2\phi^*\phi\]

제1항 \((\partial_\mu\phi)^*(\partial^\mu\phi)\)는 장의 「운동 에너지」에 해당하는 항으로, 장이 시공간 안에서 얼마나 변화하고 있는지를 측정해. 제2항 \(m^2\phi^*\phi\)는 질량 \(m\)의 입자를 기술하는 「질량항」.

여기서 \((\partial_\mu\phi)^*(\partial^\mu\phi)\)\(\mu = 0, 1, 2, 3\)에 대해 합을 취한다(Einstein 축약 규칙). \(\partial^\mu\phi = \eta^{\mu\nu}\partial_\nu\phi\)로 첨자를 올리므로(부록 C 참조), Minkowski 계량 \(\eta^{\mu\nu} = \text{diag}(-1,+1,+1,+1)\)을 사용하여 전개하면 \(-|\partial_0\phi|^2 + |\partial_1\phi|^2 + |\partial_2\phi|^2 + |\partial_3\phi|^2\)가 된다. 시간 미분 앞에 마이너스가 붙는 것은 Minkowski 계량의 부호 규약의 귀결로, 상대론적 장이론에서는 표준적인 구조야.

::: {.callout-note}

부호 규약에 대해

본 장에서는 「일반상대론」편 편과 같은 부호 규약 \(\eta_{\mu\nu} = \text{diag}(-1,+1,+1,+1)\)을 사용한다. 「장의 양자론」편 편에서는 반대 규약 \((+,-,-,-)\)을 사용하므로 주의. 물리적 결론은 규약에 의존하지 않는다. :::

전역적 변환 \(\phi \to e^{i\alpha}\phi\)(\(\alpha\) = 상수) 아래에서:

\[\phi^*\phi \to e^{-i\alpha}\phi^* \cdot e^{i\alpha}\phi = \phi^*\phi \quad \checkmark\]
\[\partial_\mu\phi \to \partial_\mu(e^{i\alpha}\phi) = e^{i\alpha}\partial_\mu\phi \quad \checkmark \text{($\alpha$가 상수이므로)}\]

따라서 \(\mathcal{L}\)는 불변. 문제없다.

그러나, 국소 변환 \(\phi(x) \to e^{i\alpha(x)}\phi(x)\)(\(\alpha(x)\)가 위치에 의존)에서는:

\[\partial_\mu\phi \to \partial_\mu(e^{i\alpha(x)}\phi) = e^{i\alpha(x)}\partial_\mu\phi + i(\partial_\mu\alpha)\,e^{i\alpha(x)}\phi\]
\[= e^{i\alpha(x)}\left[\partial_\mu\phi + i(\partial_\mu\alpha)\phi\right]\]

여분의 항 \(i(\partial_\mu\alpha)\phi\)가 나온다! \(\partial_\mu\phi\)\(e^{i\alpha(x)}\)만을 앞에 꺼낼 수 없다. 즉, 보통의 미분 \(\partial_\mu\)는 국소 게이지 변환 아래에서 「깔끔하게」 변환되지 않는다.

⚪ 메이: \(\alpha\)가 상수이면 \(\partial_\mu\alpha = 0\)으로 문제없지만, 위치에 의존하면 미분이 여분의 항을 만들어내는 거네요.

해결책: 공변 미분의 도입

🟡 리나: 이 문제를 해결하기 위해, 새로운 장 \(A_\mu(x)\)(게이지장)을 도입하여 공변 미분을 정의해:

\[\boxed{D_\mu \equiv \partial_\mu - igA_\mu}\]

여기서 \(g\)결합상수(힘의 세기를 결정하는 매개변수).

\(D_\mu\phi\)\(\phi\)와 같은 방식으로 변환하는(즉 \(D_\mu\phi \to e^{i\alpha(x)}D_\mu\phi\)) 것을 요구하자. 이를 통해 \(A_\mu\)의 변환 법칙이 결정된다.

\(D_\mu\phi\)의 변환을 계산한다. 게이지 변환 후의 공변 미분을 \(D'_\mu = \partial_\mu - igA'_\mu\)(\(A_\mu\)\(A'_\mu\)로 바뀐 것)로 쓰면:

\[D_\mu\phi \to D'_\mu(e^{i\alpha}\phi) = (\partial_\mu - igA'_\mu)(e^{i\alpha}\phi)\]
\[= e^{i\alpha}\partial_\mu\phi + i(\partial_\mu\alpha)e^{i\alpha}\phi - igA'_\mu e^{i\alpha}\phi\]
\[= e^{i\alpha}\left[\partial_\mu\phi + i(\partial_\mu\alpha)\phi - igA'_\mu\phi\right]\]

이것이 \(e^{i\alpha}D_\mu\phi = e^{i\alpha}(\partial_\mu - igA_\mu)\phi\)와 같아지려면:

\[\partial_\mu\phi + i(\partial_\mu\alpha)\phi - igA'_\mu\phi = \partial_\mu\phi - igA_\mu\phi\]

\(\partial_\mu\phi\)는 양변에서 소거. \(\phi\)로 나누면:

\[i(\partial_\mu\alpha) - igA'_\mu = -igA_\mu\]

정리하면:

\[A'_\mu = A_\mu + \frac{1}{g}\partial_\mu\alpha\]

이것이 게이지장의 변환 법칙. 전자기학에서 배운 「게이지 변환 \(A_\mu \to A_\mu + \partial_\mu\Lambda\)」와 같은 형태!

🔵 카이: 오, 깔끔하게 사라져! 여분의 항을 상쇄하도록 \(A_\mu\)가 변환해주는 거구나.

✅ 이해도 체크: 공변 미분 \(D_\mu = \partial_\mu - igA_\mu\)를 도입하는 목적은 무엇인가요?

국소 게이지 변환 아래에서 \(D_\mu\phi\)\(\phi\)와 같은 방식으로 변환하도록(\(D_\mu\phi \to e^{i\alpha(x)}D_\mu\phi\)) 하기 위해서. 보통의 미분 \(\partial_\mu\)에서는 여분의 \(\partial_\mu\alpha\) 항이 나오는 문제를 해결한다.

🔵 카이: 어, 국소 대칭성을 요구한 것만으로 전자기장이 나온 거야? 그런데 잠깐, \(A_\mu\)가 전자기 퍼텐셜이라는 건 어떻게 알아? 단순히 「새로운 장을 도입했다」는 것뿐 아니야?

🟡 리나: 좋은 의문이야. \(A_\mu\)의 변환 법칙 \(A_\mu \to A_\mu + \frac{1}{g}\partial_\mu\alpha\)가 전자기학에서 배운 게이지 변환(제 2 장 참조)과 같은 형태라는 것——이것이 첫 번째 단서야. 게다가, D.7절 마지막에 쓰는 게이지 불변 라그랑지안으로부터 \(A_\mu\)의 운동방정식을 도출하면 Maxwell 방정식이 나와(「장의 양자론」편 「장의 양자론」편 제 3 장 참조). 이 두 가지로부터, \(A_\mu\)가 전자기 퍼텐셜(광자의 장)에 다름 아니라는 것을 알 수 있어. 국소 \(U(1)\) 대칭성을 요구한다 → 게이지장(광자)이 필연적으로 나타난다 → 전자기력이 도출된다. 이것이 게이지 원리의 핵심이야.

🔵 카이: 그러면, \(SU(2)\)\(SU(3)\)에서도 같은 것을 하면, 약한 힘이나 강한 힘이 나온다는 거야?

🟡 리나: 맞아. \(SU(2)\)의 국소 대칭성을 요구하면 \(W\) 보손과 \(Z\) 보손이, \(SU(3)\)이면 8개의 글루온이 자동으로 나타나. 완전히 같은 논리 구조야.

⚪ 메이: 정리하면, 「보통의 미분이 국소 변환에서 깨진다 → 보상하기 위해 게이지장을 도입 → 그 게이지장이 힘의 매개 입자였다」라는 3단계네요. 출발점(국소 대칭성의 요구)만 정하면 나머지는 필연적으로 결정되는 거예요.

🟡 리나: 맞아. 대칭성의 요구만으로 힘의 존재가 도출된다——이것이 게이지 원리의 위력이야.

🔵 카이: 하지만 거꾸로 말하면, 「왜 국소 대칭성을 요구하는가」 자체는 설명되지 않잖아? 그건 실험으로 확인하는 수밖에 없어?

🟡 리나: 날카로워. 확실히 「왜 자연이 국소 대칭성을 선택했는가」는 현시점에서는 공리에 가까워. 다만, 국소 대칭성을 가정하면 실험과 멋지게 일치해——그것이 최대의 근거야.

🔵 카이: 즉 「국소 대칭성을 가정한다 → 힘의 형태가 결정된다 → 실험과 맞는다」이니까, 가정이 옳다고 믿는 거구나. 출발점의 「왜」는 미해결이지만, 결과가 맞으면 강력한 원리인 거지.

%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart TD
    A["전역적 U(1) 대칭성<br/>φ → e^{iα}φ(α = 상수)"] --> B["국소화를 요구<br/>α → α(x)"] 
    B --> C["∂μφ가 깔끔하게 변환되지 않음<br/>여분의 ∂μα 항 출현"]
    C --> D["공변 미분 Dμ = ∂μ − igAμ 도입"]
    D --> E["게이지장 Aμ(광자)가 필연적으로 출현"]
    E --> F["전자기력이 도출됨"]
    style A fill:#eef,stroke:#339
    style F fill:#fdd,stroke:#c33

그림 D.8: 국소 게이지 대칭성으로부터의 게이지장 도출

게이지 불변 라그랑지안

공변 미분을 사용하면, 국소 게이지 불변 라그랑지안을 쓸 수 있다:

\[\mathcal{L} = (D_\mu\phi)^*(D^\mu\phi) - m^2\phi^*\phi - \frac{1}{4}F_{\mu\nu}F^{\mu\nu}\]

마지막 항은 게이지장 자체의 운동 에너지. \(F_{\mu\nu}\)장 세기 텐서:

\[F_{\mu\nu} = \partial_\mu A_\nu - \partial_\nu A_\mu\]

이것은 전자기학의 전기장·자기장을 통일적으로 기술하는 텐서(「일반상대론」편 「일반상대론」편 제 4 장 참조). \(F_{\mu\nu}\)는 게이지 변환 \(A_\mu \to A_\mu + \frac{1}{g}\partial_\mu\alpha\) 아래에서 불변임을 직접 계산으로 확인할 수 있다(\(\partial_\mu\partial_\nu\alpha - \partial_\nu\partial_\mu\alpha = 0\)에 의함). 따라서 \(F_{\mu\nu}F^{\mu\nu}\)도 게이지 불변.

비가환 게이지 이론으로의 확장

🟡 리나: \(U(1)\)은 가환군이었는데, \(SU(2)\)\(SU(3)\) 같은 비가환군으로 확장하면, 공변 미분은:

\[\boxed{D_\mu = \partial_\mu - igA_\mu^a T_a}\]

여기서 \(T_a\)는 군의 생성원, \(A_\mu^a\)는 각 생성원에 대응하는 게이지장. \(SU(3)\)이면 \(a = 1, \ldots, 8\)로 8개의 게이지장(= 8종류의 글루온)이 나타난다.

비가환의 경우, 장 세기 텐서에도 추가 항이 나온다:

\[F_{\mu\nu}^a = \partial_\mu A_\nu^a - \partial_\nu A_\mu^a + gf_{abc}A_\mu^b A_\nu^c\]

마지막 항 \(gf_{abc}A_\mu^b A_\nu^c\)는 비가환군 특유의 것. 이로 인해 게이지장끼리 상호작용한다(글루온끼리 충돌한다). \(U(1)\)(전자기력)에서는 \(f_{abc} = 0\)이므로 광자끼리는 직접 상호작용하지 않는다.

🔵 카이: 광자끼리는 안 부딪치는데 글루온끼리는 부딪치는 거구나. 그게 비가환(\(f_{abc} \neq 0\)) 때문이구나. 그런데 매개 입자끼리 부딪친다는 건, 힘의 행동이 전자기력과는 완전히 다를 것 같은데?

🟡 리나: 바로 그래. 글루온끼리의 상호작용 때문에, 쿼크 사이의 힘은 거리가 멀어질수록 강해져——이것이 「가둠(confinement)」(쿼크가 단독으로 꺼내지지 않는 현상)의 기원이야. 전자기력이 거리의 제곱에 반비례하여 약해지는 것과는 대조적이지. 이 구조의 상세는 「장의 양자론」편 「장의 양자론」편 제 17 장(Yang-Mills 이론)을 참조해.

✅ 이해도 체크: 국소 게이지 불변성을 요구하면, 왜 게이지장(힘을 매개하는 장)이 필연적으로 나타나는 건가요?

보통의 미분 \(\partial_\mu\)는 국소 게이지 변환 아래에서 「깔끔하게」 변환되지 않는다(여분의 \(\partial_\mu\alpha\) 항이 나옴). 이를 보상하기 위해 게이지장 \(A_\mu\)를 도입하여 공변 미분 \(D_\mu = \partial_\mu - igA_\mu\)를 구성할 필요가 있다.

✅ 이해도 체크: \(SU(3)\)의 게이지 이론에서 게이지장은 몇 개 필요하고, 그것은 무엇에 대응하나요?

8개. \(SU(3)\)의 생성원이 8개 있고, 각 생성원에 1개의 게이지장이 대응한다. 물리적으로는 8종류의 글루온.


D.8 대칭성의 자발적 깨짐

대칭성이 있는데, 보이지 않는다?

🟡 리나: 제 9 장의 히그스 메커니즘에서는, 대칭성의 자발적 깨짐(spontaneous symmetry breaking, SSB)이 중요한 역할을 해. 여기서는 그 수학적 구조를 보자.

🔵 카이: 「자발적으로 깨진다」는 게 뭔 뜻이야?

🟡 리나: 직관적인 예에서 시작하자. 연필을 책상 위에 수직으로 세운다. 연필은 회전 대칭(어느 방향으로든 쓰러질 수 있음). 하지만 실제로 쓰러지면 특정 방향을 선택해. 법칙은 대칭이지만, 상태가 대칭성을 깬 거야.

멕시칸 모자형 퍼텐셜

이것을 장이론으로 정식화하자. 복소 스칼라장 \(\phi\)의 퍼텐셜을 생각한다:

\[\boxed{V(\phi) = \mu^2 |\phi|^2 + \lambda |\phi|^4}\]

여기서 \(\lambda > 0\)(퍼텐셜이 아래로 발산하지 않기 위한 조건).

경우 1: \(\mu^2 > 0\)(보통의 경우)

퍼텐셜의 최솟값은 \(\phi = 0\)에 있다. \(V\)\(|\phi|\)로 미분하여 0과 놓으면:

\[\frac{dV}{d|\phi|} = 2\mu^2|\phi| + 4\lambda|\phi|^3 = 2|\phi|(\mu^2 + 2\lambda|\phi|^2) = 0\]

\(\mu^2 > 0\), \(\lambda > 0\)이면, 괄호 안은 항상 양이므로, 해는 \(|\phi| = 0\)뿐. 진공(최저 에너지 상태)은 \(\phi = 0\)이고, \(U(1)\) 대칭성을 유지한다.

경우 2: \(\mu^2 < 0\)(자발적 깨짐의 경우)

\(\mu^2 < 0\)로 쓰면 헷갈리니까, \(\mu^2 = -|\mu|^2\)로 치환하자:

\[V(\phi) = -|\mu|^2 |\phi|^2 + \lambda |\phi|^4\]

퍼텐셜의 최솟값을 구한다. \(v \equiv |\phi|\)로 놓으면:

\[\frac{dV}{dv} = -2|\mu|^2 v + 4\lambda v^3 = 2v(-|\mu|^2 + 2\lambda v^2) = 0\]

해는 \(v = 0\) 또는 \(v^2 = \frac{|\mu|^2}{2\lambda}\).

\(v = 0\)에서의 \(V\) 값은 \(V(0) = 0\). \(v = v_0 \equiv \sqrt{\frac{|\mu|^2}{2\lambda}}\)에서의 \(V\) 값은:

\[V(v_0) = -|\mu|^2 \cdot \frac{|\mu|^2}{2\lambda} + \lambda \cdot \frac{|\mu|^4}{4\lambda^2} = -\frac{|\mu|^4}{2\lambda} + \frac{|\mu|^4}{4\lambda} = -\frac{|\mu|^4}{4\lambda} < 0\]

\(V(v_0) < V(0) = 0\)이므로, 진정한 최솟값은 \(v = 0\)이 아니라 \(v = v_0\).

🔵 카이: 어, 원점이 가장 낮은 게 아니었어. \(\mu^2 < 0\)으로 하면, 원점이 오히려 「산꼭대기」가 되는 거구나.

대칭성의 자발적 깨짐의 퍼텐셜

그림 D.9: 대칭성의 자발적 깨짐의 퍼텐셜. 그림 D_5: 왼쪽: \(\mu^2 > 0\)에서는 최솟값이 원점에 있고 대칭성은 유지됨. 오른쪽: \(\mu^2 < 0\)에서는 최솟값이 원점에서 벗어나고, 진공이 대칭성을 깬다.

\[\boxed{|\phi|_{\text{min}} = \sqrt{\frac{|\mu|^2}{2\lambda}} = \frac{v}{\sqrt{2}}}\]

여기서 \(v\)를 다음과 같이 정의했다:

\[v \equiv \sqrt{\frac{|\mu|^2}{\lambda}}\]

\(v\)진공 기대값(vacuum expectation value, VEV)이라 불린다. 물리적 최솟값은 \(|\phi|_{\text{min}} = v/\sqrt{2}\)이다.

🔵 카이: \(v\)\(v/\sqrt{2}\)는 헷갈리네. 왜 \(\sqrt{2}\)가 들어가는 거야?

🟡 리나: 좋은 질문이야. 이후의 계산에서는 장을 진공 주위에서 전개해:

\[\phi(x) = \frac{1}{\sqrt{2}}\left[v + h(x) + i\xi(x)\right]\]

여기서 \(h(x)\)\(\xi(x)\)는 진공으로부터의 요동(\(h = \xi = 0\)이 진공). \(\sqrt{2}\)로 나누는 것은, \(h\)\(\xi\)의 운동항이 깔끔한 형태(\(\frac{1}{2}(\partial_\mu h)^2\) 등)가 되도록 하기 위한 표준적 규약이야. 이렇게 쓰면, 진공(\(h = \xi = 0\))에서 \(|\phi| = v/\sqrt{2}\)이고, 확실히 아까 구한 최솟값과 일치해.

⚪ 메이: 즉 \(v\)는 「장의 전개를 간결하게 쓰기 위한 정의」이고, 물리적 최솟값은 \(|\phi|_{\text{min}} = v/\sqrt{2}\)라는 뜻이네요.

🟡 리나: 맞아. 이후로는 \(v\)(\(v^2 = |\mu|^2/\lambda\))만 사용할게.

자, 퍼텐셜의 형태를 생각하면, \(\phi = 0\)은 「산꼭대기」이고, \(|\phi| = v_0\)가 「골짜기 바닥」이야. \(\phi\)는 복소수이니까, \(|\phi| = v_0\)을 만족하는 점은 복소평면 위의 원. 그림 D.9「대칭성의 자발적 깨짐의 퍼텐셜」에서 \(\mu^2 > 0\)(왼쪽)과 \(\mu^2 < 0\)(오른쪽)을 비교하면, 최솟값의 위치가 원점에서 벗어난 것을 알 수 있어. 게다가 \(\phi\)가 복소수라는 것을 고려하여 \(\text{Re}\,\phi\)\(\text{Im}\,\phi\)의 2축으로 3차원적으로 그리면, 중앙이 솟아오른 「멕시칸 모자(솜브레로)」형태가 된다(그림 D.10「멕시칸 모자형 퍼텐셜」). 최솟값이 \(|\phi| = v/\sqrt{2}\)의 원 위에 나열되어 있는 것이 보일 거야.

멕시칸 모자형 퍼텐셜

그림 D.10: 멕시칸 모자형 퍼텐셜. \(\mu^2 < 0\)인 경우의 퍼텐셜 \(V(\phi) = \mu^2|\phi|^2 + \lambda|\phi|^4\)를, \(\text{Re}\,\phi\)\(\text{Im}\,\phi\)의 2축으로 3차원적으로 그린 것. 중앙이 솟아오르고, 진정한 최솟값은 \(|\phi| = v/\sqrt{2}\)의 원 위에 있다. 진공은 원 위의 한 점을 선택하며 \(U(1)\) 대칭성을 자발적으로 깬다.

대칭성의 깨짐

퍼텐셜 \(V(\phi)\) 자체는 \(U(1)\) 대칭성을 가진다(\(\phi \to e^{i\alpha}\phi\)\(|\phi|^2\)는 불변이므로 \(V\)도 불변).

그러나 진공 상태는 \(|\phi| = v/\sqrt{2}\)의 원 위의 특정한 1점을 선택한다. 예를 들어 \(\phi_0 = v/\sqrt{2}\)(실축 위의 점)를 선택했다고 하자. 이 특정 점은 \(U(1)\) 변환으로 움직여 버리므로, 진공은 \(U(1)\) 대칭성을 깨고 있다.

이것이 「자발적 대칭성의 깨짐」:

  • 법칙(라그랑지안)은 대칭성을 가진다
  • 상태(진공)가 대칭성을 깬다

진공 주위의 요동 — Goldstone 모드

진공 \(\phi_0 = v/\sqrt{2}\) 주위에서 장을 전개한다. 진공으로 실축 위의 점을 선택했으므로, \(\phi\)를 실부와 허부로 분해하면:

\[\phi(x) = \frac{1}{\sqrt{2}}\left[v + h(x) + i\xi(x)\right]\]

\(h = \xi = 0\)일 때 \(\phi = v/\sqrt{2}\)(실수)로, 확실히 선택한 진공과 일치한다. \(h(x)\)는 진공으로부터의 「지름 방향」(\(|\phi|\)를 바꾸는 방향)의 요동, \(\xi(x)\)는 「원주 방향」(\(|\phi|\)를 바꾸지 않고 위상만 바꾸는 방향)의 요동이야.

퍼텐셜에 대입한다. \(|\phi|^2 = \frac{1}{2}[(v + h)^2 + \xi^2]\)이므로, \(V = -|\mu|^2|\phi|^2 + \lambda|\phi|^4\)에 대입하면:

\[V = -|\mu|^2 \cdot \frac{1}{2}\left[(v+h)^2 + \xi^2\right] + \lambda \cdot \frac{1}{4}\left[(v+h)^2 + \xi^2\right]^2\]
\[= -\frac{|\mu|^2}{2}\left[(v+h)^2 + \xi^2\right] + \frac{\lambda}{4}\left[(v+h)^2 + \xi^2\right]^2\]

\(v^2 = |\mu|^2/\lambda\)(진공 기대값의 정의로부터)를 사용하여 전개하자. \(\rho \equiv (v+h)^2 + \xi^2 = v^2 + 2vh + h^2 + \xi^2\)로 놓으면:

\[V = -\frac{|\mu|^2}{2}\rho + \frac{\lambda}{4}\rho^2\]

\(\rho\)\(h\), \(\xi\)의 차수로 정리한다. \(\rho = v^2 + 2vh + (h^2 + \xi^2)\)이므로, \(h\), \(\xi\)의 2차까지의 항을 구하자. \(A = v^2 + 2vh\), \(B = h^2 + \xi^2\)로 놓으면 \(\rho = A + B\)이고, \(\rho^2 = A^2 + 2AB + B^2\). \(B^2\)는 4차 이상이므로 무시한다.

\(A^2 = (v^2 + 2vh)^2 = v^4 + 4v^3 h + 4v^2 h^2\)

\(2AB = 2(v^2 + 2vh)(h^2 + \xi^2)\)를 전개하면 \(2v^2(h^2 + \xi^2) + 4vh(h^2 + \xi^2)\). 제1항은 \(h\), \(\xi\)에 대해 2차, 제2항은 \(h \cdot h^2 = h^3\)이나 \(h \cdot \xi^2\)처럼 3차 이상이므로, 2차까지의 근사에서는 무시한다. 따라서 2차까지의 부분은 \(2v^2(h^2 + \xi^2)\).

\(h^2\)의 계수를 합치면 \(4v^2 + 2v^2 = 6v^2\), \(\xi^2\)의 계수는 \(2v^2\). 따라서 2차까지:

\[\rho^2 \approx v^4 + 4v^3 h + 6v^2 h^2 + 2v^2\xi^2\]

이것을 \(V\)에 대입한다:

\[V \approx -\frac{|\mu|^2}{2}(v^2 + 2vh + h^2 + \xi^2) + \frac{\lambda}{4}(v^4 + 4v^3 h + 6v^2 h^2 + 2v^2\xi^2)\]

상수항(\(h = \xi = 0\)): \(-\frac{|\mu|^2}{2}v^2 + \frac{\lambda}{4}v^4\)(진공의 에너지, 물리에 영향 없음).

1차 항(\(h\)에 비례): \(-|\mu|^2 v h + \lambda v^3 h = vh(-|\mu|^2 + \lambda v^2) = 0\)(진공 조건 \(v^2 = |\mu|^2/\lambda\)에 의해 사라짐. 이것이 「진공이 최솟값」이라는 것의 반영).

⚪ 메이: 1차 항이 0이 되는 것은 정확히 「골짜기 바닥에 있으니까 기울기가 0」이라는 거네요.

🟡 리나: 맞아. 2차 항을 보자:

\[V^{(2)} = \left(-\frac{|\mu|^2}{2} + \frac{6\lambda v^2}{4}\right)h^2 + \left(-\frac{|\mu|^2}{2} + \frac{2\lambda v^2}{4}\right)\xi^2 = \left(-\frac{|\mu|^2}{2} + \frac{3\lambda v^2}{2}\right)h^2 + \left(-\frac{|\mu|^2}{2} + \frac{\lambda v^2}{2}\right)\xi^2\]

\(v^2 = |\mu|^2/\lambda\)를 대입하면:

\[V^{(2)} = \left(-\frac{|\mu|^2}{2} + \frac{3|\mu|^2}{2}\right)h^2 + \left(-\frac{|\mu|^2}{2} + \frac{|\mu|^2}{2}\right)\xi^2 = |\mu|^2 h^2 + 0 \cdot \xi^2\]

즉:

\[V^{(2)} = |\mu|^2 h^2 + 0 \cdot \xi^2\]

🔵 카이: 어라, \(h^2\) 앞에는 \(|\mu|^2\)가 곱해져 있는데, \(\xi^2\) 앞은 \(0\)이야. 이게 뭔가 의미가 있어?

🟡 리나: 아주 의미가 커. 장이론에서 실수 스칼라장의 라그랑지안은 \(\mathcal{L} = \frac{1}{2}(\partial_\mu h)^2 - \frac{1}{2}m^2 h^2 - \cdots\)의 형태를 하고 있어서, 질량항은 \(\frac{1}{2}m^2 h^2\)로 쓰여져(\(\frac{1}{2}\)은 운동항 \(\frac{1}{2}(\partial_\mu h)^2\)와 짝을 이루는 표준적 규격화). 지금의 경우, \(\phi = (v + h + i\xi)/\sqrt{2}\)로 전개했으므로, 원래의 운동항 \((\partial_\mu\phi)^*(\partial^\mu\phi)\)를 전개하면——\(\partial_\mu\phi = (\partial_\mu h + i\partial_\mu\xi)/\sqrt{2}\)이므로 \((\partial_\mu\phi)^*(\partial^\mu\phi) = \frac{1}{2}(\partial_\mu h)^2 + \frac{1}{2}(\partial_\mu\xi)^2\)가 되어, \(h\)\(\xi\)의 운동항은 확실히 표준적인 \(\frac{1}{2}\) 규격화가 되어 있어.

🔵 카이: 즉, 퍼텐셜의 2차 계수를 읽으면 그 장의 입자 질량을 알 수 있다는 거야?

🟡 리나: 맞아. 일반적으로 장의 라그랑지안은 운동항 \(\frac{1}{2}(\partial_\mu h)^2\)와 퍼텐셜항 \(V\)의 차로 쓰여져: \(\mathcal{L} = \frac{1}{2}(\partial_\mu h)^2 - V\). 용수철 역학에서 \(\frac{1}{2}m\dot{x}^2 - \frac{1}{2}kx^2\)로 쓰는 것과 같은 구조야. 질량항은 라그랑지안 안에서 \(-\frac{1}{2}m^2 h^2\) 형태로 나타나고(퍼텐셜 안에서는 \(+\frac{1}{2}m^2 h^2\)). 장의 운동방정식은 \(\ddot{h} + m^2 h = 0\)이 되어, \(m\)이 입자의 질량에 대응해.

🔵 카이: 용수철의 \(\ddot{x} + (k/m)x = 0\)에서 진동수가 \(\omega = \sqrt{k/m}\)이 되는 것과 같은 구조구나. 장의 경우에는 「용수철 상수」에 해당하는 것이 \(m^2\)이고, 그것이 입자의 질량을 결정하는 거지.

🟡 리나: 맞아, 좋은 유추야. 지금의 결과 \(V^{(2)} = |\mu|^2 h^2\)는 퍼텐셜의 2차 항이야. 장의 라그랑지안은 \(\mathcal{L} = \frac{1}{2}(\partial_\mu h)^2 - V\)이므로, \(h\)에 관한 부분을 써 내면:

\[\mathcal{L}_h = \frac{1}{2}(\partial_\mu h)^2 - |\mu|^2 h^2\]

표준적인 질량 \(m_h\)의 자유장 라그랑지안은 \(\frac{1}{2}(\partial_\mu h)^2 - \frac{1}{2}m_h^2 h^2\)이므로, 퍼텐셜 부분은 \(V = \frac{1}{2}m_h^2 h^2\). 지금의 결과 \(V^{(2)} = |\mu|^2 h^2\)와 비교하면 \(\frac{1}{2}m_h^2 = |\mu|^2\), 즉:

\[m_h = \sqrt{2}\,|\mu| \quad \text{(히그스 입자의 질량)}, \qquad m_\xi = 0 \quad \text{(Goldstone 보손)}\]

🔵 카이: \(\xi\)의 질량이 0이야! \(h\)는 질량이 있는데, \(\xi\)만 질량이 0이구나.

🟡 리나: 이것이 Goldstone의 정리: 연속 대칭성이 자발적으로 깨지면, 깨진 대칭성의 각 생성원에 대응하여 질량 0의 입자(Goldstone 보손)가 나타난다.

\(\xi\)가 질량 0인 것은 직관적으로도 이해할 수 있어. 멕시칸 모자의 골짜기 바닥을 따라 움직이는(원주 방향) 데에는 에너지가 필요 없어(퍼텐셜이 평탄). 골짜기에서 벗어나는 방향(지름 방향)으로는 에너지가 필요하지.

🔵 카이: 그렇구나, 골짜기 바닥의 「어디에 있는가」는 물리에 영향을 미치지 않으니까, 거기를 움직이는 데 비용이 들지 않아. 그래서 질량 0의 입자가 나오는 거구나. 근데 잠깐, 현실 세계에서 질량 0의 입자가 그렇게 많이 발견되지는 않잖아? 대칭성이 깨질 때마다 질량 0의 입자가 나온다면, 더 많이 있어야 하는 거 아니야?

🟡 리나: 좋은 의문이야. 실은, 게이지 대칭성이 깨지는 경우에는 이야기가 달라져. 그것이 다음 히그스 메커니즘 이야기로 이어져.

✅ 이해도 체크: Goldstone의 정리란 무엇을 말하고 있나요?

연속 대칭성이 자발적으로 깨지면, 깨진 대칭성의 각 생성원에 대응하여 질량 0의 입자(Goldstone 보손)가 나타난다. 멕시칸 모자의 골짜기 바닥을 따른 방향의 요동에 대응한다.

히그스 메커니즘으로의 다리

🟡 리나: 제 9 장에서 자세히 보겠지만, 게이지 대칭성이 자발적으로 깨지는 경우에는 상황이 변해. Goldstone 보손 \(\xi\)가 게이지장에 「먹혀서」, 게이지장이 질량을 획득해. 이것이 히그스 메커니즘이야.

표준모형에서는: - \(SU(2) \times U(1)\)의 4개 생성원 중 3개가 깨진다 → 3개의 Goldstone 보손 - 이것들이 \(W^+\), \(W^-\), \(Z\) 보손에 먹혀서, 이들이 질량을 획득 - 나머지 1개의 생성원은 깨지지 않음 → 광자는 질량 0인 채로 - 지름 방향의 요동 \(h\)히그스 입자(2012년에 발견)

✅ 이해도 체크: 히그스 메커니즘에서 Goldstone 보손은 어떻게 되나요?

Goldstone 보손이 게이지장에 「먹혀서」 사라지고, 대신 게이지장(\(W^+\), \(W^-\), \(Z\) 보손)이 질량을 획득한다. 지름 방향의 요동이 히그스 입자로 남는다.

✅ 이해도 체크: 대칭성의 자발적 깨짐이란 무엇인가요? 연필의 비유로 설명해 보세요.

법칙(방정식)은 대칭성을 가지지만, 실현되는 상태가 특정 방향을 선택하는 것. 세운 연필은 어느 방향으로든 쓰러질 수 있지만(대칭), 실제로 쓰러지면 한 방향을 선택한다(대칭성이 깨짐).

✅ 이해도 체크: 멕시칸 모자형 퍼텐셜 \(V = \mu^2|\phi|^2 + \lambda|\phi|^4\)(\(\mu^2 < 0\))에서 진공 기대값 \(|\phi|_{\text{min}}\)는 얼마인가요?

\(|\phi|_{\text{min}} = \sqrt{|\mu|^2/(2\lambda)}\). 퍼텐셜을 \(|\phi|\)로 미분하여 0으로 놓음으로써 얻어진다. 본문의 표기법에서는 \(v = \sqrt{|\mu|^2/\lambda}\)로 정의하고 있으므로, \(|\phi|_{\text{min}} = v/\sqrt{2}\)로도 쓸 수 있다.


D.9 연습문제

📝 연습문제:


다음 장 예고

끈이론의 세계면은 2차원이며, 그곳에서의 물리는 복소해석의 언어로 아름답게 기술된다. 정칙함수, 유수정리, 등각사상——이 도구들이 제 16 장의 공형장론과 연산자곱 전개(OPE)를 지탱하는 수학적 기반이 된다. 부록 E 에서는 복소해석의 핵심을 최단 거리로 정비하자.


참고문헌

  • M. Nakahara, Geometry, Topology and Physics, Ch.5「Lie 군과 Lie 대수」— 군론의 수학적 기초
  • 場の量子論(上巻), Ch.7「게이지 원리」— 게이지 대칭성의 기초, \(U(1)\) 게이지 이론
  • 場の量子論(下巻), Ch.14「대칭성의 자발적 깨짐」— SSB의 수학, Goldstone의 정리
  • 場の量子論(下巻), Ch.15「표준모형과 히그스 메커니즘」— \(SU(3) \times SU(2) \times U(1)\)의 상세
  • 「양자역학」편 제26장「대칭성과 보존법칙」— Noether의 정리의 양자역학 버전
  • 「장의 양자론」편 제3장「고전장론」— Noether의 정리의 장이론 버전
  • 「장의 양자론」편 제17장「Yang-Mills 이론」— 비가환 게이지 대칭성의 상세
  • 「장의 양자론」편 Appendix B「Lorentz 군과 Poincaré 군의 표현론」— Lorentz 군의 상세