Appendix G Einstein 방정식의 도출¶
지난 내용 요약: 제 6 장에서 Einstein 방정식 \(G_{\mu\nu} = 8\pi G\, T_{\mu\nu}\)를 "시공간의 휘어짐 = 물질의 에너지"로서 결과만 제시했다. 하지만 이 방정식은 어디서 오는 걸까? Newton 역학이 \(L = T - V\)에서 \(F = ma\)를 이끌어내듯이, Einstein 방정식도 작용 원리로부터 도출할 수 있다.
이 부록의 목표
- Einstein-Hilbert 작용의 변분을 한 줄 한 줄 따라가며, Einstein 방정식을 완전히 도출한다
- 변분법의 실천 예로서, 끈이론의 Polyakov 작용(제 13 장)으로의 다리 역할도 한다
G.1 동기 — 왜 작용 원리로부터 도출하는가¶
🟡 리나: 물리학의 역사를 돌아보면, 기본 방정식은 항상 2가지 루트로 얻어져 왔어요.
표 G.1: 기본 방정식의 도출 루트 비교
| 분야 | 직접적 추론 | 작용 원리 |
|---|---|---|
| 역학 | Newton의 운동방정식 \(F = ma\) | Lagrangian \(L = T - V\)의 변분 |
| 전자기학 | Maxwell 방정식 | 전자기장의 작용 \(S = -\frac{1}{4}\int F_{\mu\nu}F^{\mu\nu}\sqrt{-g}\,d^4x\) |
| 일반상대론 | Einstein의 물리적 추론(1915년) | Einstein-Hilbert 작용의 변분 |
🔵 카이: Newton의 경우는 \(F = ma\)가 먼저이고, 나중에 Lagrangian으로 재도출할 수 있었어요. Einstein 방정식도 마찬가지인가요?
🟡 리나: 그래요. Einstein은 등가원리·일반 공변성·Newton 극한과의 정합성으로부터 방정식에 도달했어요. 거의 같은 시기에 Hilbert가 작용 원리를 이용한 정식화에 착수하고 있었죠. 역사적으로는 "방정식이 먼저, 작용이 나중". 하지만 작용 원리에는 결정적인 장점이 있어요.
🔵 카이: 어떤 장점이 있나요?
🟡 리나: 3가지가 있어요:
- 대칭성이 자동으로 보장된다 — 작용이 스칼라라면, 거기서 나오는 방정식은 자동적으로 일반 좌표변환에 대해 공변
- 통일적인 틀 — 중력도 물질도 같은 작용 \(S = S_{EH} + S_M\)에 넣어서, \(\delta S = 0\)으로 모든 것이 나온다
- 양자화로의 길 — 장의 양자론(「장의 양자론」편 제10–11장)에서 보았듯이, 경로적분 \(\int \mathcal{D}[g]\,e^{iS/\hbar}\)의 출발점이 된다
🔵 카이: 끈이론에서도 같은 정신인가요?
🟡 리나: 바로 그래요. 제 13 장의 Polyakov 작용도 "세계면 위의 스칼라 작용을 변분한다"는 같은 구조예요. 그래서 여기서 변분의 기술을 익혀두면, 끈이론의 도출을 매끄럽게 읽을 수 있어요.
변분법의 기초는 「일반상대론」편 「일반상대론」편 부록 C, 장의 Lagrangian 변분은 「장의 양자론」편 「장의 양자론」편 제 3 장을 참조.
G.2 Einstein-Hilbert 작용¶
G.2.1 작용의 형태를 결정하는 요청¶
🟡 리나: 중력장의 작용 \(S_{EH}\)를 결정하기 위해, 다음의 요청을 부과해요:
- 일반 좌표 불변성 — 작용은 스칼라(좌표변환으로 값이 변하지 않는다)
- 계량텐서 \(g_{\mu\nu}\)와 그 미분으로만 구성 — 중력장의 자유도는 계량
- 운동방정식이 2계 — 초기조건으로 위치와 속도를 지정하면 해가 결정되도록 하고 싶다. 일반적으로 Lagrangian이 변수의 \(n\)계 미분을 포함하면, Euler-Lagrange 방정식은 \(2n\)계 미분방정식이 된다(변분에서 부분적분을 \(n\)번 수행하기 때문). \(R\)은 계량의 2계 미분을 포함하므로, 소박하게는 운동방정식이 4계가 될 것 같지만, \(R\)의 특수한 구조 덕분에 \(\delta R_{\mu\nu}\)를 포함하는 항이 전미분(경계항)이 되어 떨어지고, 결과적으로 2계에 머문다(G.3.3에서 확인한다)
- 가장 단순 — 가능한 한 낮은 차수의 항
🔵 카이: 그 조건을 전부 만족하는 스칼라가 구체적으로 뭐가 있나요?
🟡 리나: 「일반상대론」편 「일반상대론」편 제 13 장에서 배운 Ricci 스칼라 \(R\)이 바로 그거예요. \(R = g^{\mu\nu}R_{\mu\nu}\)는 계량의 2계 미분을 포함하는 가장 단순한 스칼라예요. 4차원에서 부피요소 \(\sqrt{-g}\,d^4x\)와 조합하면:
여기서는 자연단위계 \(c = 1\)을 사용해요(\(c\)를 복원하면 \(1/(16\pi G) \to c^4/(16\pi G)\)).
🔵 카이: \(\sqrt{-g}\)는 왜 필요한가요?
🟡 리나: \(d^4x\)만으로는 좌표변환에서 야코비안이 나와버려요. \(\sqrt{-g}\,d^4x\)가 일반 좌표 불변인 부피요소가 돼요. 이건 「일반상대론」편 「일반상대론」편 제 7 장에서 배웠죠.
⚪ 메이: 즉 \(\sqrt{-g}\)는 "좌표 선택에 상관없이 부피를 올바르게 재는" 보정인자인 거네요.
✅ 이해도 체크: Einstein-Hilbert 작용의 형태를 결정하는 4가지 요청은 무엇일까요?
답
(1) 일반 좌표 불변성(작용이 스칼라), (2) 계량텐서와 그 미분으로만 구성, (3) 2계 미분까지(운동방정식이 2계), (4) 가장 단순(가능한 한 낮은 차수의 항).
G.2.2 우주상수항의 추가¶
🟡 리나: 요청을 만족하는 또 하나의 항이 있어요. 상수 \(\Lambda\)(우주상수)를 곱한 부피:
이것도 일반 좌표 불변인 스칼라이고, 계량의 0계 미분(미분 없음)이에요. 가장 단순한 항이니까, 원리적으로 배제할 이유가 없어요.
✅ 이해도 체크: 우주상수항 \(S_\Lambda\)는 왜 중력 작용에 포함하는 것이 허용될까요?
답
우주상수항은 일반 좌표 불변인 스칼라이며, 계량의 0계 미분(미분을 포함하지 않는)으로 구성되는 가장 단순한 항이기 때문에, 대칭성의 요청을 만족하고 원리적으로 배제할 이유가 없기 때문이다.
🟡 리나: 이것을 아까의 \(S_{EH}\)와 합치면, 전체 중력 작용은:
\(-2\Lambda\)의 계수는 관습으로, 최종적으로 Einstein 방정식에 \(\Lambda g_{\mu\nu}\)가 나오도록 선택한 거예요.
⚪ 메이: 즉 \(R\)의 항과 상수항을 하나의 적분으로 정리한 형태네요.
G.2.3 전체 작용¶
물질장의 작용을 \(S_M\)이라 하면, 전체 작용은:
최소 작용의 원리:
이것이 Einstein 방정식을 준다. 이하, 이 변분을 실행한다.
✅ 이해도 체크: Einstein-Hilbert 작용의 피적분함수에 포함된 스칼라량은 무엇일까요?
답
스칼라 곡률 \(R\)(과 우주상수 \(\Lambda\)).
✅ 이해도 체크: 최소 작용의 원리에서, 전체 작용 \(S\)를 무엇으로 변분하여 0으로 놓을까요?
답
계량텐서 \(g^{\mu\nu}\)로 변분하여 0으로 놓는다.
G.3 변분의 실행 — 3가지 기여¶
🟡 리나: \(R = g^{\mu\nu}R_{\mu\nu}\)이므로, 피적분함수 \(\sqrt{-g}\,R = \sqrt{-g}\,g^{\mu\nu}R_{\mu\nu}\)의 변분은 곱의 미분법칙으로 3개로 나뉘어요:
각 항을 제1항, 제2항, 제3항이라 부르겠어요. 전체 구조를 그림 G.1「Einstein–Hilbert 작용의 변분 분해」에 나타냈어요.
🔵 카이: 3개 인수의 곱이니까, 미분법칙으로 3개로 나뉘는 거네요.
🟡 리나: 그래요. 그림에서는 번호순으로 나열했지만, 이하에서는 계산 난이도 순으로 진행할게요: 먼저 기술적으로 독립적인 제3항(\(\delta\sqrt{-g}\)의 계산), 다음으로 자명한 제1항(그대로 남는 것), 마지막으로 핵심이 되는 제2항(Palatini의 항등식) 순으로 처리하겠어요.
%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart TD
A["δ(√-g · g^μν R_μν)"] --> B["제1항<br>√-g R_μν δg^μν"]
A --> C["제2항<br>√-g g^μν δR_μν"]
A --> D["제3항<br>R · δ√-g"]
B --> E["그대로 남는다<br>→ R_μν δg^μν"]
C --> F["Palatini의 항등식<br>∇_α V^α (전미분)"]
F --> G["경계항 → 0"]
D --> H["δ√-g 의 공식<br>→ -½ R g_μν δg^μν"]
E --> I["합산: (R_μν - ½ g_μν R) δg^μν"]
H --> I
그림 G.1: Einstein–Hilbert 작용의 변분 분해
G.3.1 제3항: \(\delta\sqrt{-g}\)의 계산¶
🟡 리나: 먼저 가장 기술적으로 독립적인 제3항부터 처리할게요. \(g \equiv \det(g_{\mu\nu})\)로 두고, \(\sqrt{-g}\)의 변분을 구하고 싶어요.
스텝 1: 행렬식의 변분(Jacobi의 공식)
행렬 \(A\)의 행렬식에 대해, 일반적으로:
이것은 「일반상대론」편 「일반상대론」편 부록 C에서 도출했어요. 계량텐서에 적용하면:
🔵 카이: \(\delta g_{\mu\nu}\)와 \(\delta g^{\mu\nu}\)는 별개이죠? 관계는요?
🟡 리나: 좋은 질문이에요. \(g^{\mu\alpha}g_{\alpha\nu} = \delta^\mu_\nu\)의 양변을 변분하면:
양변에 \(g^{\nu\beta}\)를 곱하고 정리하면:
따라서:
⚪ 메이: 지표의 올림내림에서 부호가 반전되는 거네요. 역행렬의 미분과 같은 구조예요.
🟡 리나: 그렇죠.
스텝 2: \(\delta g\)를 \(\delta g^{\mu\nu}\)로 쓰기
위의 관계를 사용하면:
스텝 3: \(\delta\sqrt{-g}\) 구하기
\(\sqrt{-g}\)의 변분은 연쇄법칙으로:
\(\delta g = -g\,g_{\mu\nu}\,\delta g^{\mu\nu}\)를 대입하면:
\(g < 0\)이므로 \(-g > 0\)이며, \(\sqrt{-g}\)는 실수로서 well-defined. \(\sqrt{-g}\)의 정의로부터 \((\sqrt{-g})^2 = -g\)이므로, \(g = -(\sqrt{-g})^2\)로 쓸 수 있어요. 이것을 분자에 대입하면:
마지막 등호는 분자분모에서 \(\sqrt{-g}\)를 하나 약분한 것뿐이에요.
따라서:
⚪ 메이: 깔끔한 형태예요! \(g_{\mu\nu}\,\delta g^{\mu\nu}\)는 지표의 축약이니까, 스칼라가 되어 있네요.
🟡 리나: 그래요. 이것으로 제3항은:
📝 연습문제:
- \(\delta\sqrt{-g}\)의 도출 → 문제 M-1. \(\delta\sqrt{-g}\) 의 유도
G.3.2 제1항: \(\sqrt{-g}\,R_{\mu\nu}\,\delta g^{\mu\nu}\)¶
🟡 리나: 제1항은 그대로:
아무것도 계산할 필요가 없어요. \(R_{\mu\nu}\)는 \(g^{\mu\nu}\)의 변분에 대해 "상수"처럼 행동하는 부분이에요.
G.3.3 제2항: \(\sqrt{-g}\,g^{\mu\nu}\,\delta R_{\mu\nu}\) — Palatini의 항등식¶
🟡 리나: 여기가 도출의 핵심이에요. Ricci 텐서 \(R_{\mu\nu}\)는 Christoffel 기호 \(\Gamma^\alpha_{\mu\nu}\)의 미분으로 쓰이니까, \(g^{\mu\nu}\)를 바꾸면 \(\Gamma\)가 변하고, \(R_{\mu\nu}\)도 변해요.
스텝 1: \(\delta\Gamma^\alpha_{\mu\nu}\)가 텐서임을 보이기
🔵 카이: \(\Gamma^\alpha_{\mu\nu}\) 자체는 텐서가 아닌데, 그 변분이 텐서가 되나요?
🟡 리나: 그래요. 기억해주세요, \(\Gamma\)의 좌표변환 법칙에는 "좌표변환의 2계 미분"——즉 좌표변환 \(x \to x'\)를 수행할 때 \(\partial^2 x^\mu / \partial x'^\alpha \partial x'^\beta\) 같은 항——이 여분으로 붙어요(「일반상대론」편 「일반상대론」편 제 7 장 참조). "텐서로서 변환한다"란, 좌표를 바꿀 때 각 성분이 규칙적인 룰(지표마다 변환행렬을 하나씩 곱하는 것)로 변하는 것을 말해요. \(\Gamma\)에는 그 룰에서 벗어나는 여분의 항이 붙으니까 "텐서가 아닌" 거죠.
그런데 이 여분의 항은 좌표계의 선택만으로 결정되고, 계량의 값에는 의존하지 않아요. 구체적으로 쓰면, \(\Gamma\)의 좌표변환 법칙은 "텐서적으로 변환하는 부분 + 좌표변환의 2계 미분 \(\partial^2 x/\partial x'^2\)에 비례하는 여분의 항"이라는 구조를 갖고 있어요. 이 여분의 항은 좌표변환만으로 결정되며, 계량 \(g_{\mu\nu}\)가 어떤 값인지에는 전혀 의존하지 않아요. 그러니까 \(\Gamma\) 자체는 텐서가 아니지만, 같은 좌표계에서 계량을 \(g_{\mu\nu} \to g_{\mu\nu} + \delta g_{\mu\nu}\)로 조금 바꿨을 때, 변분 전의 접속 \(\Gamma[g]\)와 변분 후의 접속 \(\Gamma[g + \delta g]\)의 차 \(\delta\Gamma = \Gamma[g + \delta g] - \Gamma[g]\)를 생각하면, 좌표변환할 때 붙는 여분의 항이 양쪽에 완전히 같은 형태로 나타나니까 상쇄돼요.
🔵 카이: 아, 그렇구나. 여분의 항은 "좌표계 선택"만으로 결정되니까, 계량을 바꿔도 여분의 항은 변하지 않아요. 그래서 차를 취하면 사라지는 거야——뺄셈으로 공통 부분이 사라지는 것과 같은 거네요.
🟡 리나: 바로 그거예요. 결과적으로 \(\delta\Gamma^\alpha_{\mu\nu}\)는 텐서로서 변환해요.
스텝 2: Ricci 텐서의 정의와 변분
Ricci 텐서는 Riemann 텐서의 축약(「일반상대론」편 「일반상대론」편 제 13 장 참조):
이 변분을 계산해요. "변분"이란 \(g_{\mu\nu} \to g_{\mu\nu} + \delta g_{\mu\nu}\)로 계량을 미소하게 바꿨을 때, 그에 따라 \(\Gamma \to \Gamma + \delta\Gamma\)로 변하는 분을 구하는 것이에요. \(\delta\Gamma\)는 미소량이니까, \(\delta\Gamma\)의 2차 이상의 항(\((\delta\Gamma)^2\) 등)은 무시하고 1차 항만 취해요——이것은 Taylor 전개에서 1차 항만 남기는 것과 같은 조작이에요. 편미분 항 \(\partial_\alpha\Gamma^\alpha_{\mu\nu}\)는 \(\Gamma\)에 대해 선형(1차식)이니까, 그대로 \(\partial_\alpha(\delta\Gamma^\alpha_{\mu\nu})\)가 돼요. \(\Gamma\Gamma\) 항에는 곱의 미분법칙(\((fg)' = f'g + fg'\))을 적용해요. 예를 들어 \(\Gamma^\alpha_{\alpha\beta}\Gamma^\beta_{\mu\nu}\)의 변분은 \(\delta(\Gamma^\alpha_{\alpha\beta})\cdot\Gamma^\beta_{\mu\nu} + \Gamma^\alpha_{\alpha\beta}\cdot\delta(\Gamma^\beta_{\mu\nu})\)의 2항을 만들어요. 마찬가지로 \(-\Gamma^\alpha_{\nu\beta}\Gamma^\beta_{\mu\alpha}\)의 변분은 \(-\delta(\Gamma^\alpha_{\nu\beta})\cdot\Gamma^\beta_{\mu\alpha} - \Gamma^\alpha_{\nu\beta}\cdot\delta(\Gamma^\beta_{\mu\alpha})\)의 2항을 만들어요. 전부 합치면:
⚪ 메이: 이거 정말 복잡하네요……
🟡 리나: 실은, \(\delta\Gamma\)가 텐서이기 때문에, 편미분 \(\partial_\alpha\)를 공변미분 \(\nabla_\alpha\)로 바꿀 수 있어요. 구체적으로 확인해볼게요. \(\nabla_\alpha(\delta\Gamma^\rho_{\mu\nu})\)를 공변미분의 정의(「일반상대론」편 「일반상대론」편 제 7 장 참조)로 전개하면:
마찬가지로 \(\nabla_\nu(\delta\Gamma^\rho_{\mu\alpha})\)를 전개하면:
🔵 카이: 공변미분의 정의를 대입한 것뿐인데, 항이 많네요…… 이게 정말 위의 복잡한 식과 일치하나요?
🟡 리나: 일치해요. 차 \(\nabla_\alpha(\delta\Gamma^\rho_{\mu\nu}) - \nabla_\nu(\delta\Gamma^\rho_{\mu\alpha})\)를 취하고, 그 후 \(\rho = \alpha\)로 축약하면(여기까지 \(\rho\)는 자유 지표였지만, \(\alpha\)와 같은 문자로 해서 합을 취하면), 편미분 항으로서 \(\partial_\alpha(\delta\Gamma^\alpha_{\mu\nu}) - \partial_\nu(\delta\Gamma^\alpha_{\mu\alpha})\)가 나타나요. 나머지 \(\Gamma \cdot \delta\Gamma\) 항을 구체적으로 살펴볼게요.
\(\nabla_\alpha(\delta\Gamma^\alpha_{\mu\nu})\)를 공변미분의 정의로 전개하면(\(\rho = \alpha\) 축약을 수행한 후), 편미분 \(\partial_\alpha(\delta\Gamma^\alpha_{\mu\nu})\)에 더해 3개의 \(\Gamma\cdot\delta\Gamma\) 항이 나와요:
마찬가지로 \(\nabla_\nu(\delta\Gamma^\alpha_{\mu\alpha})\)를 전개하면:
차를 취하면 합계 6개의 \(\Gamma\cdot\delta\Gamma\) 항이 나타나요. 이 중 제1식의 제4항 \(-\Gamma^\sigma_{\alpha\nu}(\delta\Gamma^\alpha_{\mu\sigma})\)와 제2식의 제4항 \(+\Gamma^\sigma_{\nu\alpha}(\delta\Gamma^\alpha_{\mu\sigma})\)는, \(\Gamma\)의 아래 지표의 대칭성 \(\Gamma^\sigma_{\alpha\nu} = \Gamma^\sigma_{\nu\alpha}\)에 의해 정확히 상쇄돼요. 남은 4항을 써보면:
- 제1식의 제2항: \(+\Gamma^\alpha_{\alpha\sigma}(\delta\Gamma^\sigma_{\mu\nu})\)
- 제1식의 제3항: \(-\Gamma^\sigma_{\alpha\mu}(\delta\Gamma^\alpha_{\sigma\nu})\)
- 제2식의 제2항: \(-\Gamma^\alpha_{\nu\sigma}(\delta\Gamma^\sigma_{\mu\alpha})\)
- 제2식의 제3항: \(+\Gamma^\sigma_{\nu\mu}(\delta\Gamma^\alpha_{\sigma\alpha})\)
이것들이 스텝 2 첫머리의 \(\delta R_{\mu\nu}\)의 \(\Gamma\cdot\delta\Gamma\) 4항과 일치하는 것은, 더미 지표의 이름 바꾸기(예를 들어 제2식의 제3항 \(+\Gamma^\sigma_{\nu\mu}(\delta\Gamma^\alpha_{\sigma\alpha})\)에서 \(\sigma \to \beta\)로 놓으면 \(+\Gamma^\beta_{\nu\mu}(\delta\Gamma^\alpha_{\beta\alpha})\)가 되고, \(\Gamma\)의 아래 지표 대칭성으로 \(\Gamma^\beta_{\nu\mu} = \Gamma^\beta_{\mu\nu}\)를 쓰면 \(+\Gamma^\beta_{\mu\nu}(\delta\Gamma^\alpha_{\beta\alpha})\). 이것은 원래 식의 \((\delta\Gamma^\alpha_{\alpha\beta})\Gamma^\beta_{\mu\nu}\)와 인수의 순서가 반대일 뿐 같은 항에 대응)로 확인할 수 있어요. 나머지 항도 마찬가지로 더미 지표의 이름 바꾸기로 대응이 확인돼요(전체 4항의 대응을 하나하나 추적하고 싶은 독자는 「일반상대론」편 「일반상대론」편 부록 C의 연습문제를 참조). 요점은, 공변미분의 정의에 포함된 접속계수 항이, \(\delta R_{\mu\nu}\)의 \(\Gamma\cdot\delta\Gamma\) 4항을 과부족 없이 흡수하는 구조로 되어 있다는 것이에요. 이것은 우연이 아니라, \(\delta\Gamma\)가 텐서라는 것의 직접적 귀결——텐서의 편미분에 접속계수 보정을 더한 것이 공변미분이니까, 텐서 \(\delta\Gamma\)의 편미분을 포함하는 식은 반드시 공변미분의 형태로 정리되는 거예요. 결과는:
여기서 제1항과 제2항에서 미분의 방향(\(\alpha\)와 \(\nu\))이 다르다는 점에 주의해요.
이것이 Palatini의 항등식이에요.
🔵 카이: 편미분과 \(\Gamma\)의 곱 항이 전부, 공변미분 안에 흡수되는 거구나.
⚪ 메이: 6항 중 2항이 상쇄되고, 나머지 4항이 딱 맞게 일치한다——아름다운 구조네요.
🔵 카이: 공변미분 안에 흡수되는 건 알겠는데, 다음 스텝 3에서 \(g^{\mu\nu}\)를 곱하면 어떻게 되나요?
🟡 리나: 좋은 질문이에요. 텐서의 공변미분은 텐서이니까, 이 식은 좌표에 의존하지 않아요. 다음으로 \(g^{\mu\nu}\)를 곱해서 전미분 형태로 정리해볼게요.
스텝 3: \(g^{\mu\nu}\,\delta R_{\mu\nu}\)를 전미분으로 만들기
\(g^{\mu\nu}\)를 곱하면:
Levi-Civita 접속에서는 계량적합조건 \(\nabla_\alpha g^{\mu\nu} = 0\)(metric compatibility, 「일반상대론」편 「일반상대론」편 제 12 장 참조)이 성립하니까, \(g^{\mu\nu}\)를 공변미분 안으로 넣을 수 있어요. 먼저 제1항에 대해:
다음으로 제2항에 대해:
⚪ 메이: 계량적합조건 덕분에 \(g^{\mu\nu}\)를 미분 안으로 넣을 수 있는 거네요.
🔵 카이: 그런데 제1항은 \(\nabla_\alpha(\cdots)\)이고 제2항은 \(\nabla_\nu(\cdots)\)——미분의 지표가 다른데, 이건 어떻게 정리하나요?
🟡 리나: 좋은 착안점이에요. 이대로는 하나의 발산으로 정리할 수 없어요. 여기서 제1항의 \(\alpha\)와 제2항의 \(\nu\)는 둘 다 더미 지표(같은 문자가 2번 나타나서 축약되는 지표)예요. 최종적으로 하고 싶은 것은, 양쪽 항을 \(\nabla_\lambda(\text{뭔가})\)라는 같은 형태로 만들어서, \(\nabla_\lambda(\text{제1항의 내용} - \text{제2항의 내용})\)으로 하나로 정리하는 것이에요. 그러려면 양쪽 항의 미분 지표를 같은 문자 \(\lambda\)로 맞춰야 해요.
🔵 카이: 더미 지표는 이름을 바꿔도 값이 변하지 않죠? \(\sum_i a_i = \sum_j a_j\)처럼.
🟡 리나: 바로 그래요. 예를 들어 2차원에서 \(\sum_{\nu=0}^{1} A_\nu B^\nu = A_0 B^0 + A_1 B^1\)이라고 써도 \(\sum_{\alpha=0}^{1} A_\alpha B^\alpha = A_0 B^0 + A_1 B^1\)이라고 써도 같은 값——문자는 "더하는 번호"의 라벨에 불과해요.
그래서 구체적으로 할 일을 2단계로 설명할게요:
단계 A: 제2항 \(\nabla_\nu(g^{\mu\nu}\,\delta\Gamma^\alpha_{\mu\alpha})\)의 더미 지표를 이름 바꾸기 해요. 목표는 미분의 지표를 \(\lambda\)로 맞추는 것. \(\nu \to \lambda\)로 바꾸고 싶어요. 동시에 \(\alpha\)도 그대로 남겨도 문제없는지 확인——\(\nabla_\lambda(g^{\mu\lambda}\,\delta\Gamma^\alpha_{\mu\alpha})\)는 \(\lambda\)가 위아래 1번씩, \(\alpha\)가 위아래 1번씩이라 축약규칙에 위반되지 않아요. OK.
🔵 카이: 잠깐만요. 만약 \(\nu \to \alpha\)로 하면 어떻게 되나요?
🟡 리나: \(\nabla_\alpha(g^{\mu\alpha}\,\delta\Gamma^\alpha_{\mu\alpha})\)가 되어, \(\alpha\)가 3곳에 나타나요. Einstein 축약규칙——같은 지표는 위아래 1번씩의 쌍으로만 합을 취한다——에 위반돼요. 그래서 \(\nu\)는 \(\alpha\) 이외의 새로운 문자로 바꿔야 해요.
단계 B: 제1항 \(\nabla_\alpha(g^{\mu\nu}\,\delta\Gamma^\alpha_{\mu\nu})\)를 봐요. 여기서는 \(\alpha\)가 미분의 지표인 동시에 \(\Gamma\)의 위첨자 지표이기도 해요(양쪽에 나타나서 축약되고 있어요). 이 \(\alpha\)를 \(\lambda\)로 이름 바꿔서 \(\nabla_\lambda(g^{\mu\nu}\,\delta\Gamma^\lambda_{\mu\nu})\)로 써요.
이것으로 양쪽 항이 \(\nabla_\lambda(\cdots)\) 형태가 되었으니까, 괄호 안의 내용을 빼기로 하나로 정리할 수 있어요.
🔵 카이: 양쪽 항에서 \(\lambda\)를 써도 괜찮나요? 섞이지 않아요?
🟡 리나: 괜찮아요. 포인트는, 최종적으로 2개 항을 \(\nabla_\lambda(\text{제1항의 내용} - \text{제2항의 내용})\)로 하나의 공변미분으로 정리하는 것이에요. 정리한 후에는 \(\lambda\)가 전체를 통틀어 1개의 더미 지표가 돼요. 예를 들어 보통 덧셈에서 \(\sum_i a_i - \sum_j b_j\)를 \(\sum_i(a_i - b_i)\)로 정리할 때, \(j\)를 \(i\)로 이름 바꾸고 나서 빼기를 하는 것과 같은 조작이에요. 각 항 안에서 더미 지표가 중복되지 않으면 문제없어요.
⚪ 메이: 즉, 이름을 바꿔도 값은 같으니까, 양쪽 항의 미분 지표를 \(\lambda\)로 통일해서 괄호 안의 내용을 빼기할 수 있도록 한 거네요.
🟡 리나: 바로 그래요. 제1항은 원래 \(\nabla_\alpha(g^{\mu\nu}\,\delta\Gamma^\alpha_{\mu\nu})\)였지만, \(\alpha \to \lambda\)로 이름 바꿔서 \(\nabla_\lambda(g^{\mu\nu}\,\delta\Gamma^\lambda_{\mu\nu})\)로 써요. 제2항은 아까 \(\nabla_\lambda(g^{\mu\lambda}\,\delta\Gamma^\alpha_{\mu\alpha})\)가 됐어요. 이것으로 양항의 미분이 \(\nabla_\lambda\)로 맞춰져서, 괄호 안의 내용을 빼기할 수 있어요:
벡터 \(V^\lambda\)를 정의해요:
그러면:
🔵 카이: 오오, 6항이나 있던 \(\Gamma\cdot\delta\Gamma\)가 전부 사라져서, 마지막은 단 하나의 발산 \(\nabla_\lambda V^\lambda\)로 정리되는 거구나!
🟡 리나: 그래요. 이것이 텐서 해석학의 위력이에요.
스텝 4: 적분하여 경계항으로 만들기
\(\sqrt{-g}\)를 곱하고 적분하면, 일반 좌표 불변인 발산정리(「일반상대론」편 「일반상대론」편 제 7 장 참조)에 의해:
마지막 등호는 \(\sqrt{-g}\,\nabla_\alpha V^\alpha = \partial_\alpha(\sqrt{-g}\,V^\alpha)\)라는 항등식(「일반상대론」편 「일반상대론」편 제 7 장)에 의한 것이에요.
이것은 4차원 발산정리로 경계면 위의 적분으로 변환할 수 있어요:
⚪ 메이: 부피적분이 경계면의 적분으로 바뀐다——벡터 해석의 Gauss 정리와 같은 정신이네요.
🟡 리나: 바로 그래요. 그리고 다음은 경계조건의 논의에 들어갈게요.
경계조건: 변분 문제에서는 경계 위에서 \(\delta g^{\mu\nu} = 0\)(계량을 경계에서 고정)으로 해요. 소박하게는 "\(g\)를 고정하면 \(\Gamma\)도 고정되니까 \(V^\alpha = 0\)"이라고 말하고 싶지만, 정말 그럴까요?
🔵 카이: 잠깐만요. \(\delta g^{\mu\nu} = 0\)이어도 \(\partial_\rho(\delta g^{\mu\nu})\)는 경계에서 0이라고 보장되지 않는 거 아닌가요? \(\Gamma\)는 \(g\)의 미분을 포함하니까……
🟡 리나: 날카로워요! 바로 그래요. 엄밀히는 \(\delta g^{\mu\nu}|_{\partial\mathcal{M}} = 0\)만으로는 \(\delta\Gamma|_{\partial\mathcal{M}} = 0\)이 보장되지 않아요. \(g\)의 법선방향 미분 \(\partial_n g\)는 고정되지 않으니까요.
이 문제를 완전히 해결하려면 Gibbons-Hawking-York 경계항:
을 작용에 추가해요. 여기서 \(h\)는 경계면에 유도되는 3차원 계량의 행렬식, \(K\)는 경계면의 외적 곡률의 트레이스(정식 정의는 생략)예요. 외적 곡률이란, 경계면이 주위 시공간 속에서 어떤 방향으로 얼마나 휘어져 묻혀 있는지를 나타내는 양이에요. 친숙한 예로 말하면, 풍선의 표면은 바깥쪽으로 부풀어 있으니 외적 곡률이 양, 말 안장의 안쪽은 오목하니 외적 곡률이 음이에요. 평평한 종이는 외적 곡률이 0이에요. 그 트레이스 \(K\)는 "경계면이 전체적으로 얼마나 부풀어 있는지"를 하나의 수로 요약한 거예요. 이 부록에서는 \(K\)의 구체적 계산에는 들어가지 않지만, 요점은: 이 항을 더하면, \(\delta g^{\mu\nu}|_{\partial\mathcal{M}} = 0\)만으로 변분 문제가 well-posed가 된다는 것이에요.
⚪ 메이: 하지만 최종적인 운동방정식(Einstein 방정식)에는 영향을 안 주나요?
🟡 리나: 안 줘요. GHY 항 \(S_{GHY}\)의 변분은, \(S_{EH}\)의 변분에서 생긴 경계항을 정확히 상쇄하도록 설계되어 있어요. 결과적으로, 전체 작용 \(S_{EH} + S_{GHY} + S_M\)의 변분에서는 경계항이 완전히 사라지고, 부피적분의 피적분함수만 남아요. 그래서 \(\delta S/\delta g^{\mu\nu} = 0\)으로부터 얻어지는 운동방정식은 \(S_{GHY}\)의 유무에 상관없이 같아요. 블랙홀의 열역학(제 10 장)이나 양자중력의 경로적분에서는 경계항의 값 자체가 중요해지지만, 여기서는 "제2항은 사라진다"고 결론짓고 앞으로 나가요. 이 과정의 전체상을 그림 G.2「Palatini의 항등식과 경계항의 소거 과정」에 정리했어요.
그림 G.2: Palatini의 항등식과 경계항의 소거 과정. \(g^{\mu\nu}\delta R_{\mu\nu} = \nabla_\alpha V^\alpha\)가 발산정리로 경계적분으로 바뀐다. 엄밀히는 Gibbons-Hawking-York 경계항의 추가가 필요하지만, 운동방정식에는 영향을 주지 않는다
G.3.4 3가지 기여를 합치기¶
🟡 리나: 이상을 정리할게요. \(\delta(\sqrt{-g}\,R)\)의 3항은:
- 제1항: \(\sqrt{-g}\,R_{\mu\nu}\,\delta g^{\mu\nu}\)
- 제2항: \(0\)(경계항으로 사라진다)
- 제3항: \(-\frac{1}{2}\sqrt{-g}\,R\,g_{\mu\nu}\,\delta g^{\mu\nu}\)
따라서:
🔵 카이: 제2항이 사라진 덕분에, \(R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R\)로 깔끔하게 정리되네요. Einstein 텐서의 형태가 보여요!
🟡 리나: 바로 그래요. 이제 우주상수항의 변분만 더하면 돼요:
합치면:
⚪ 메이: 중력 부분의 변분은 이것으로 완료네요. 나머지는 물질의 작용을 더하는 것뿐이에요.
✅ 이해도 체크: Palatini의 항등식에 의해 \(\delta R_{\mu\nu}\)는 어떤 형태로 표현될까요?
답
\(\delta R_{\mu\nu} = \nabla_\alpha(\delta\Gamma^\alpha_{\mu\nu}) - \nabla_\nu(\delta\Gamma^\alpha_{\mu\alpha})\)라는 공변미분의 차 형태로 표현된다.
✅ 이해도 체크: \(g^{\mu\nu}\delta R_{\mu\nu}\) 항이 최종적으로 기여하지 않는 이유는 무엇일까요?
답
전미분(\(\nabla_\alpha V^\alpha\))의 형태가 되기 때문에, 발산정리에 의해 경계항이 되고, 경계에서 \(\delta g^{\mu\nu} = 0\)으로 놓으면 사라지기 때문이다.
G.4 물질의 작용과 에너지-운동량 텐서¶
G.4.1 에너지-운동량 텐서의 변분적 정의¶
🟡 리나: 물질장의 작용 \(S_M[g^{\mu\nu}, \phi]\)를 계량으로 변분해요. 여기서 \(\phi\)는 물질장(스칼라장, 전자기장 등, 중력 이외의 모든 장)을 통틀어 나타내는 기호예요. 구체적인 예는 바로 다음에 볼 거예요.
🟡 리나: \(\frac{\delta S_M}{\delta g^{\mu\nu}}\)는 범함수 미분(汎関数微分)이라 불려요. 보통의 미분이 "변수를 조금 바꿨을 때 함수의 변화율"을 나타내듯이, 범함수 미분은 "장 \(g^{\mu\nu}(x)\)를 각 점에서 조금 바꿨을 때 작용(적분량)의 변화율"을 나타내요(「일반상대론」편 「일반상대론」편 부록 C 참조).
🔵 카이: 보통의 미분은 \(df/dx\)로 "\(x\)를 조금 움직였을 때 \(f\)의 변화율"이잖아요. 범함수 미분은 뭐가 다른가요?
🟡 리나: 보통의 미분에서는 변수가 유한 개(\(x\), \(y\), \(z\) 등)예요. 범함수 미분에서는 "변수"가 장 \(g^{\mu\nu}(x)\)——즉 공간의 각 점에 값이 있어요. 이미지로는, 공간을 격자점으로 나누어 각 점의 \(g^{\mu\nu}\)를 독립변수라고 생각하면, 이산 버전에서는 \(\delta S \approx \sum_i \frac{\partial S}{\partial g^{\mu\nu}_i}\,\delta g^{\mu\nu}_i\)로 쓸 수 있어요. 격자를 무한히 세밀하게 하면, 합 \(\sum_i\)가 적분 \(\int d^4x\)로 바뀌고, 편미분 \(\partial S/\partial g^{\mu\nu}_i\)가 범함수 미분 \(\delta S_M/\delta g^{\mu\nu}(x)\)로 치환돼요.
⚪ 메이: 즉 실용적으로는, \(S_M\)의 변분을 적분 형태로 쓰고 \(\delta g^{\mu\nu}\)의 계수를 읽어내면 되는 거네요?
🟡 리나: 바로 그래요. 실용적인 정의는 바로 그것: \(S_M\)의 변분을
로 썼을 때, 피적분함수 안에서 \(\delta g^{\mu\nu}\)에 곱해진 계수가 \(\frac{\delta S_M}{\delta g^{\mu\nu}}\)이다——이것이 범함수 미분의 정의예요. 기호 주의: 좌변의 \(\delta S_M\)은 "작용 전체의 미소 변화", 우변의 \(\delta g^{\mu\nu}\)는 "계량의 미소 변화", \(\frac{\delta S_M}{\delta g^{\mu\nu}}\)는 "범함수 미분"이에요. 같은 \(\delta\)가 사용되지만, 문맥으로 구별해요(보통 미분에서 \(df = \frac{df}{dx}\,dx\)라고 쓸 때, \(d\)가 "전미분"과 "미분연산자" 양쪽에 사용되는 것과 같은 관습). G.4.3의 스칼라장 예에서 실제로 계산하니까, 거기서 구체적인 절차를 확인해볼게요.
🔵 카이: 잠깐만요. 보통의 편미분이라면 \(\partial f/\partial x_i\)로 "\(x_i\)만 움직이고 나머지는 고정"이잖아요. 범함수 미분도 마찬가지로, "어떤 한 점 \(x\)에서의 \(g^{\mu\nu}\)만 움직이고 다른 점은 고정"이라는 거예요?
🟡 리나: 직관적으로는 그래요. 격자점이 무한히 세밀해진 극한이 범함수 미분이고, 기호도 \(\partial\)이 아닌 \(\delta\)를 써서 구별해요. 다만 실용적으로는 "한 점만 움직인다"고 생각하기보다, 아까 말한 정의——\(\delta S_M\)을 적분 형태로 쓰고 \(\delta g^{\mu\nu}\)의 계수를 읽어내는 것——이 계산하기 쉬워요. G.4.3의 스칼라장 예에서 바로 그 절차를 사용하니까, 거기서 감각을 잡아봐요.
🔵 카이: 그러면 확인——아까의 정의에 따르면, \(\delta S_M\)을 적분 형태로 쓰고 \(\delta g^{\mu\nu}\)의 계수를 읽어내면, 그것이 \(\delta S_M/\delta g^{\mu\nu}\)라는 거죠. 보통 미분에서 \(df = (\partial f/\partial x)\,dx\)의 계수가 미분계수인 것과 같은 구조?
🟡 리나: 완벽한 이해예요. 바로 그래요. 그럼 한 걸음 더——물질의 작용을 "계량으로" 변분한다는 건 물리적으로 어떤 의미라고 생각해요?
🔵 카이: 음…… "시공간의 형태를 조금 바꿨을 때, 물질이 얼마나 영향받는지"? 그런데 잠깐, 그건 거꾸로 말하면 "물질이 시공간을 얼마나 휘게 하고 싶어하는지"의 지표이기도 한 거 아닌가요? 작용-반작용처럼.
🟡 리나: 바로 거기가 핵심이에요. 물질이 시공간의 변형에 대해 얼마나 "저항"하는지——그 응답의 강도를 정량화한 것이 에너지-운동량 텐서가 돼요. 그리고 그것이 Einstein 방정식의 우변에 자리 잡아, 시공간의 휘어짐을 결정하는 원천이 되는 거예요. 구체적으로는, 에너지-운동량 텐서 \(T_{\mu\nu}\)를 다음과 같이 정의해요:
그러면:
🔵 카이: 왜 \(-2/\sqrt{-g}\)라는 계수인가요?
🟡 리나: 2가지 이유가 있어요. 첫째, 이 계수로 정의하면 Newton 극한에서 \(T_{00}\)이 정확히 에너지 밀도 \(\rho\)에 일치해요——이것은 「G.5.3 Newton 극한과의 정합성」에서 실제로 확인할 거예요. 둘째, Einstein 방정식이 \(G_{\mu\nu} = 8\pi G\,T_{\mu\nu}\)라는 깔끔한 형태가 돼요. 또한 이 정의로 얻어지는 \(T_{\mu\nu}\)는 자동적으로 대칭텐서(\(T_{\mu\nu} = T_{\nu\mu}\))가 돼요. 이것은 「장의 양자론」편 「장의 양자론」편 제 3 장의 Noether 정리로부터 얻어지는 정준 에너지-운동량 텐서와는 일반적으로 다르지만, 물리적으로 올바른 것은 이쪽이에요.
G.4.2 구체적 예: 완전유체¶
⚪ 메이: 구체적으로는 어떤 \(T_{\mu\nu}\)가 나오나요?
🟡 리나: 2가지 예를 볼게요. 먼저 완전유체는 결과만 보여줄게요——유체의 작용의 변분은 기술적으로 다소 복잡하니까요. 그 후, 스칼라장에서 변분의 전체 절차를 한 줄 한 줄 따라갈 거예요. 완전유체의 에너지-운동량 텐서는:
여기서 \(\rho\)는 에너지 밀도, \(p\)는 압력, \(u^\mu\)는 유체의 4원 속도예요.
이것이 변분적 정의로부터 나오는 것을 확인하려면, 완전유체의 작용 \(S_M = -\int d^4x\,\sqrt{-g}\,\rho\)를 \(g^{\mu\nu}\)로 변분하면 돼요(자세한 내용은 「일반상대론」편 「일반상대론」편 부록 C의 연습문제를 참조).
G.4.3 구체적 예: 스칼라장¶
🟡 리나: 「장의 양자론」편 「장의 양자론」편 제 3 장에서 배운 스칼라장 \(\phi\)의 작용:
이것을 \(g^{\mu\nu}\)로 변분해요. 피적분함수를 \(\mathcal{L}_M\sqrt{-g}\)로 쓰면:
🔵 카이: G.3.1에서 했던 \(\delta\sqrt{-g}\)가 여기서 다시 나오네요.
🟡 리나: 그래요, 도구가 재활용돼요. 제1항: \(\mathcal{L}_M = -\frac{1}{2}g^{\alpha\beta}\partial_\alpha\phi\,\partial_\beta\phi - V(\phi)\)를 \(g^{\mu\nu}\)로 미분하면:
제2항: \(\delta\sqrt{-g} = -\frac{1}{2}\sqrt{-g}\,g_{\mu\nu}\,\delta g^{\mu\nu}\)를 사용하면:
합치면:
정의 \(T_{\mu\nu} = -\frac{2}{\sqrt{-g}}\frac{\delta S_M}{\delta g^{\mu\nu}}\)에 대입하면:
🔵 카이: 「장의 양자론」편 「장의 양자론」편 제 3 장에서 본 스칼라장의 에너지-운동량 텐서와 같은 형태네요!
🟡 리나: 그래요. 다만 휘어진 시공간에서는 \(\eta_{\mu\nu} \to g_{\mu\nu}\)로 치환되어 있어요.
⚪ 메이: 변분적 정의의 절차——"\(\delta S_M\)을 쓰고 \(\delta g^{\mu\nu}\)의 계수를 읽어낸다"——를 실제로 하면, 이렇게 직접적으로 나오는 거네요.
✅ 이해도 체크: 에너지-운동량 텐서 \(T_{\mu\nu}\)는 물질의 작용 \(S_M\)을 사용하여 어떻게 정의될까요?
답
\(T_{\mu\nu} \equiv -\frac{2}{\sqrt{-g}}\frac{\delta S_M}{\delta g^{\mu\nu}}\)로 정의된다.
G.5 Einstein 방정식의 완성¶
G.5.1 변분 원리로부터의 도출¶
🟡 리나: 전체 작용 \(S = S_{\text{grav}} + S_M\)의 변분을 0으로 놓아요:
%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart LR
S["전체 작용 S = S_grav + S_M"] --> SG["S_grav = 1/(16πG) ∫√-g (R-2Λ) d⁴x"]
S --> SM["S_M[g, φ]"]
SG -->|δ/δg^μν| LHS["(R_μν - ½g_μν R + Λg_μν) / (16πG)"]
SM -->|δ/δg^μν| RHS["-½ T_μν"]
LHS --> EQ["δS = 0"]
RHS --> EQ
EQ --> EINSTEIN["G_μν + Λg_μν = 8πG T_μν"]
그림 G.3: 전체 작용의 변분으로부터 Einstein 방정식으로의 도출
\(\delta g^{\mu\nu}\)는 임의이니까, 피적분함수가 0:
\(16\pi G\)를 곱하고 정리하면:
이것이 우주상수항 포함 Einstein 방정식이에요. Einstein 텐서 \(G_{\mu\nu} \equiv R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R\)을 사용하면:
🔵 카이: 드디어 나왔어요! G.3에서 3개로 나눠 계산한 것이 전부 여기서 합류해서, 깔끔하게 Einstein 방정식이 되는 거구나.
⚪ 메이: 제 6 장에서 본 식과 같은 형태네요. 그때는 결과를 그냥 받아들였는데, 이제는 4가지 요청에서 작용을 정하고 변분했을 뿐인데 같은 식이 나왔어요——도중에 "이렇게 정하자"라고 자의적으로 선택한 부분이 없었다는 게 인상적이에요.
G.5.2 Bianchi 항등식과 에너지 보존¶
🟡 리나: 도출의 정합성 확인으로서, Bianchi 항등식을 확인해볼게요. 미분기하학의 항등식으로서(「일반상대론」편 「일반상대론」편 제 13 장 참조):
이것은 Riemann 텐서의 대칭성으로부터 순수하게 기하학적으로 성립해요. \(\nabla^\mu(\Lambda g_{\mu\nu}) = 0\)(\(\nabla^\mu g_{\mu\nu} = 0\)이니까)과 합치면:
Einstein 방정식의 우변에도 같은 조건이 부과돼요:
🔵 카이: \(\nabla^\mu T_{\mu\nu} = 0\)이라는 건, 평탄한 시공간에서의 \(\partial^\mu T_{\mu\nu} = 0\)(에너지-운동량 보존)의 일반화인가요? 하지만 휘어진 시공간에서는 "보존"의 의미가 달라질 것 같은데……
🟡 리나: 좋은 직감이에요. 휘어진 시공간에서 \(\nabla^\mu T_{\mu\nu} = 0\)은 국소적인 보존법칙에 대응해요. 평탄한 시공간에서는 \(\nabla^\mu \to \partial^\mu\)가 되어 통상적인 에너지-운동량 보존 \(\partial^\mu T_{\mu\nu} = 0\)으로 돌아가요. 다만 휘어진 시공간에서는 "전 우주의 에너지 총량"을 정의하는 것 자체가 일반적으로는 어려워요——중력장 자체의 에너지를 어떻게 셈하느냐는 문제가 있거든요(「일반상대론」편 「일반상대론」편 제 15 장 참조). 여기서는 깊이 들어가지 않지만, 기억해두세요.
중요한 것은, 이 보존법칙이 Einstein 방정식의 귀결로서 자동으로 나온다는 것이에요. 작용의 일반 좌표 불변성(\(S\)가 좌표변환에서 불변)으로부터 Noether 정리(「장의 양자론」편 「장의 양자론」편 제 3 장 참조)로 \(\nabla^\mu T_{\mu\nu} = 0\)이 보장돼요.
⚪ 메이: 즉 보존법칙을 별도로 가정할 필요 없이, 대칭성에서 자동으로 나오는 거네요.
🟡 리나: 바로 그래요. 여기서 주목해야 할 것은, Bianchi 항등식 \(\nabla^\mu G_{\mu\nu} = 0\)은 \(\nu = 0, 1, 2, 3\)의 4개 항등식을 준다는 것이에요. Einstein 방정식은 \(g_{\mu\nu}\)의 대칭성으로 10개 성분의 방정식이지만——
🔵 카이: 잠깐요. 4개의 항등식이 항상 성립한다는 건…… 10개 성분 중 4개가 독립이 아니라는 거예요?
🟡 리나: 바로 그래요. 10개 성분의 방정식에 4개의 Bianchi 항등식이 있으니까, 독립적인 방정식은 6개예요. 이것은 계량 \(g_{\mu\nu}\)의 10개 성분에서 4개의 좌표 자유도를 뺀 6자유도와 일치해요.
🔵 카이: 음? "좌표 자유도를 뺀다"는 게 뭐예요? 전에 전자기학에서 \(A_\mu\)의 4성분에서 게이지 자유도를 빼서 물리적 자유도가 줄어든다는 얘기가 있었잖아요(「장의 양자론」편 「장의 양자론」편 제 3 장). 그거랑 비슷한가요?
🟡 리나: 바로 그래요. 전자기학에서는 \(A_\mu \to A_\mu + \partial_\mu\chi\)라는 게이지 자유도가 1개 있어서, 4성분에서 1을 뺀 3자유도——더 나아가 운동방정식의 구속으로 물리적으로는 횡파의 2자유도가 돼요. Maxwell 방정식에는 1개의 항등식(\(\partial_\mu J^\mu = 0\))이 대응해요. 중력에서는 좌표변환의 자유도가 4개 있어서, 4개의 Bianchi 항등식을 줘요. 구조가 완전히 같아요. 즉, 양쪽 다 "작용의 대칭성 → 보존법칙 → 방정식의 무모순성"이라는 삼단 구조를 이루고 있어요. 전자기학에서는 게이지 불변성 → 전하 보존 → Maxwell 방정식의 무모순성, 중력에서는 좌표 불변성 → 에너지-운동량 보존 → Einstein 방정식의 무모순성.
🔵 카이: 그러면 대칭성이 클수록 항등식이 많고, 독립 방정식이 줄어드는 거네요. 전자기학은 1개의 항등식으로 \(4-1=3\)개, 중력은 4개의 항등식으로 \(10-4=6\)개——패턴이 같아요.
🟡 리나: 바로 그래요. 대칭성이 이론을 "좁혀나가는" 거예요. 정량적으로 정리하면——전자기학에서는 "\(U(1)\) 게이지 불변성(1파라미터) → 전하 보존(1개의 항등식) → 4성분 중 독립 방정식 3개". 중력에서는 "일반 좌표 불변성(4파라미터) → 에너지-운동량 보존(4개의 항등식) → 10성분 중 독립 방정식 6개".
⚪ 메이: 정리하면, 전자기학은 "1파라미터의 대칭성 → 1개의 항등식 → 독립 방정식 \(4-1=3\)개", 중력은 "4파라미터의 대칭성 → 4개의 항등식 → 독립 방정식 \(10-4=6\)개". 대칭성의 파라미터 수가 그대로 항등식의 수가 되는 거네요.
🟡 리나: 그 관계를 그림으로 정리하면 그림 G.4「좌표 불변성과 Bianchi 항등식의 정합성」와 같아요.
%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart TD
A["작용 S의 일반 좌표 불변성"] -->|Noether 정리| B["∇^μ T_μν = 0<br>(에너지-운동량 보존)"]
A -->|미분기하학의 항등식| C["∇^μ G_μν = 0<br>(Bianchi 항등식)"]
C -->|Einstein 방정식의 좌변| D["G_μν + Λg_μν = 8πG T_μν"]
B -->|Einstein 방정식의 우변| D
D --> E["방정식의 무모순성이 보장된다"]
그림 G.4: 좌표 불변성과 Bianchi 항등식의 정합성
🟡 리나: 그래요. 이것이 작용 원리의 위력이에요.
G.5.3 Newton 극한과의 정합성¶
🟡 리나: 계수 \(8\pi G\)가 올바른지 확인해볼게요. 약한 중력장에서:
정적·비상대론적 물질(\(T^{00} \approx \rho\), 다른 성분은 거의 0, \(c = 1\))의 경우를 생각해요. 지표를 내리면 \(T_{00} = g_{0\alpha}g_{0\beta}T^{\alpha\beta}\). 약장 근사에서 \(g_{0i} \approx 0\)이고 \(T^{0i} \approx 0\), \(T^{ij} \approx 0\)이니까, 합에서 살아남는 것은 \(\alpha = 0\), \(\beta = 0\) 항뿐: \(T_{00} \approx g_{00}g_{00}T^{00} \approx (-1)(-1)\rho = \rho\).
🔵 카이: \(T^{0i} \approx 0\)은 왜 그런 거예요? 에너지 밀도가 0이 아닌데 운동량 밀도는 0인가요?
🟡 리나: "비상대론적"이란 물질이 거의 정지해 있다는 뜻이에요. \(T^{0i}\)는 운동량 밀도——즉 물질의 흐름 속도에 대응해요. 물질이 움직이지 않으면 운동량 밀도는 0이에요. 정적·비상대론적 극한에서는 압력도 0이므로 \(T_{00} \approx \rho\), 다른 성분은 무시할 수 있어요.
⚪ 메이: "거의 멈춰 있는 물질"만 생각해서 Newton 극한을 재현할 수 있는지 확인하는 거네요.
🟡 리나: 그래요. Einstein 방정식을 그대로 \(00\) 성분으로 사용하면 \(R_{00} - \frac{1}{2}g_{00}R = 8\pi G\,\rho\)이지만, \(R\)을 소거하기 위해 먼저 트레이스를 취하는 게 보기 좋아요.
스텝 1: 트레이스 취하기
Einstein 방정식 \(G_{\mu\nu} = 8\pi G\,T_{\mu\nu}\)의 양변에 \(g^{\mu\nu}\)를 곱해요. 좌변은 \(g^{\mu\nu}G_{\mu\nu} = g^{\mu\nu}R_{\mu\nu} - \frac{1}{2}g^{\mu\nu}g_{\mu\nu}R = R - \frac{1}{2}\cdot 4 \cdot R = R - 2R = -R\). 우변은 \(8\pi G\,g^{\mu\nu}T_{\mu\nu} = 8\pi G\,T\)(\(T \equiv g^{\mu\nu}T_{\mu\nu}\)는 에너지-운동량 텐서의 트레이스). 따라서:
🔵 카이: \(g^{\mu\nu}g_{\mu\nu} = 4\)인 건, 4차원이니까요?
🟡 리나: 그래요. \(g^{\mu\nu}g_{\mu\nu} = \delta^\mu_\mu = 4\)(\(D\)차원이면 \(D\)).
스텝 2: 트레이스 반전형
이것을 원래 방정식 \(R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R = 8\pi G\,T_{\mu\nu}\)에 대입해서 \(R\)을 소거하면:
이 형태를 트레이스 반전형이라 불러요.
스텝 3: \(00\) 성분을 취하기
정적·비상대론적 물질에서는 \(T_{00} \approx \rho\). 완전유체의 식에서 \(p = 0\)으로 하면 \(T_{ij} = \rho\,u_i u_j\)이지만, 비상대론적 극한에서는 \(u_i \approx 0\)(아까와 같은 논의)이므로 \(T_{ij} \approx 0\). 또한 비상대론적이란 \(u^i \approx 0\)(물질이 거의 정지)을 의미해요. 4원 속도의 규격화 조건 \(g_{\mu\nu}u^\mu u^\nu = -1\)에 약장 근사 \(g_{00} \approx -1\), \(u^i \approx 0\)을 대입하면 \(-u^0 u^0 \approx -1\)이므로 \(u^0 \approx 1\). G.4.2의 식에서 \(T_{0i} = (\rho + p)u_0 u_i + p\,g_{0i}\)를 사용해요. \(p = 0\)이므로 제2항은 사라져요. 제1항에는 \(u_i\)가 포함되는데, 지표를 내리면 \(u_i = g_{i\mu}u^\mu = g_{i0}u^0 + g_{ij}u^j\). 약장 근사에서 \(g_{i0} \approx 0\)이고 비상대론적 극한에서 \(u^j \approx 0\)이니까, \(u^0 \approx 1\)이어도 \(u_i \approx 0\). 따라서 \(T_{0i} \approx 0\). 약장 근사에서는 \(g^{\mu\nu} \approx \eta^{\mu\nu}\)이니까, 부호 규약 \((-,+,+,+)\)에서 \(g^{00} \approx \eta^{00} = -1\), \(g^{0i} \approx \eta^{0i} = 0\), \(g^{ij} \approx \eta^{ij} = \delta^{ij}\). 따라서 트레이스는 \(T = g^{\mu\nu}T_{\mu\nu}\). 축약규칙으로 \(\mu, \nu\)를 0부터 3까지 돌리면 \(T = \sum_{\mu=0}^{3}\sum_{\nu=0}^{3} g^{\mu\nu}T_{\mu\nu}\). 이것을 \(\mu, \nu\)의 값으로 경우 분류하면 \(T = g^{00}T_{00} + g^{0i}T_{0i} + g^{i0}T_{i0} + g^{ij}T_{ij}\)(\(i\)는 1, 2, 3을 돌린다). 대칭성 \(g^{0i} = g^{i0}\), \(T_{0i} = T_{i0}\)에서 제2항과 제3항은 같은 값이므로 \(T = g^{00}T_{00} + 2g^{0i}T_{0i} + g^{ij}T_{ij}\). 약장 근사에서 \(g^{00} \approx -1\), \(g^{0i} \approx 0\), \(g^{ij} \approx \delta^{ij}\)이고, \(T_{00} \approx \rho\), \(T_{0i} \approx 0\), \(T_{ij} \approx 0\)이니까:
🔵 카이: 트레이스가 \(-\rho\)가 되는 건, \(g^{00} = -1\)의 부호가 작용하는 거네요.
🟡 리나: 바로 그래요. \(g_{00} \approx -1\)(약장 근사 \(|\Phi| \ll 1\)에서 \(-(1+2\Phi) \approx -1\))이므로, 트레이스 반전형의 우변의 \(00\) 성분은 \(8\pi G(T_{00} - \frac{1}{2}g_{00}T)\)에 \(T_{00} \approx \rho\), \(g_{00} \approx -1\), \(T \approx -\rho\)를 대입하면:
스텝 4: 좌변 \(R_{00}\)을 Newton 퍼텐셜로 쓰기
선형 근사에서 \(R_{00} \approx -\frac{1}{2}\nabla^2 h_{00}\)(「일반상대론」편 「일반상대론」편 제 8 장 참조). 약장 근사에서는 \(g_{00} \approx -(1+2\Phi)\)(\(\Phi\)는 Newton 퍼텐셜, \(|\Phi| \ll 1\))이니까:
이것을 대입하면:
스텝 5: 포아송 방정식
스텝 3과 4를 등치하면:
🔵 카이: 오오, Newton의 포아송 방정식이에요! Einstein 방정식이 Newton 중력으로 귀착됐어요!
🟡 리나: 이것은 Newton의 포아송 방정식 그 자체예요. 계수가 일치함으로써 \(8\pi G\)가 확정돼요.
📝 연습문제:
- Newton 극한의 확인 → 문제 M-2. Einstein-Hilbert의 Newton 극한
✅ 이해도 체크: 도출 결과로 얻어지는 Einstein 방정식(우주상수 포함)을 써주세요.
답
\(R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R + \Lambda g_{\mu\nu} = 8\pi G\,T_{\mu\nu}\)(자연단위계 \(c=1\)).
✅ 이해도 체크: Einstein 방정식 우변의 계수 \(8\pi G\)는 어떤 조건으로부터 결정될까요?
답
약한 중력장의 극한에서 Newton의 포아송 방정식 \(\nabla^2\Phi = 4\pi G\rho\)로 귀착되는 조건으로부터 결정된다.
G.6 도출의 의미와 끈이론으로의 전망¶
G.6.1 작용 원리의 위력¶
🟡 리나: 이 도출이 보여주는 것을 정리할게요.
- Einstein 방정식은 "하늘에서 떨어진 것"이 아니다 — 가장 단순한 일반 좌표 불변 작용 \(\int\sqrt{-g}\,R\,d^4x\)의 변분에서 필연적으로 나온다
- 대칭성이 방정식을 결정한다 — "일반 좌표 불변" "계량과 그 미분으로만 구성" "2계 미분까지" "가장 단순"이라는 요청만으로 작용의 형태가 거의 유일하게 결정된다(우주상수의 자유도를 제외하면)
- 보존법칙이 자동으로 보장된다 — 작용의 대칭성 → Bianchi 항등식 → \(\nabla^\mu T_{\mu\nu} = 0\)
- 양자화의 출발점 — 경로적분 \(\int\mathcal{D}[g]\,e^{iS_{EH}/\hbar}\)은 (자외 발산 문제가 있지만) 양자중력의 형식적 출발점
🔵 카이: 2번이 대단하네요. "대칭성을 정하면 방정식이 정해진다"는 건, 거꾸로 말하면 대칭성을 잘못 잡으면 전부 틀린다는 거잖아요.
🟡 리나: 바로 그래요. 그래서 "올바른 대칭성을 찾는 것"이 이론 구축의 가장 중요한 단계가 돼요. 역사적으로도, Maxwell이 전자기학을 게이지 대칭성으로 정리하고, Einstein이 일반 좌표 불변성을 요청하고, Yang-Mills가 비가환 게이지 대칭성을 도입했어요——모두 대칭성의 발견이 결정적 진보였어요. 그리고 대칭성이 클수록 이론의 자유도가 줄어서 방정식이 좁혀져요——대칭성이 부족하면 후보가 너무 많아서 유일하게 결정되지 않아요.
⚪ 메이: 즉, 아까의 4가지 요청으로 작용이 거의 유일하게 결정된 것은, 대칭성에 의한 제약이 강했기 때문이네요.
🟡 리나: 바로 그래요. 구체적으로 말하면, 일반 좌표 불변성은 Lorentz 불변성보다 훨씬 큰 대칭성이니까, 허용되는 작용의 형태를 강하게 좁혀요. 예를 들어 중력을 Lorentz 불변성만으로 기술하려고 하면, 대칭성이 부족해서 정합적인 이론이 되지 않아요. G.5.2에서 본 Bianchi 항등식도 이 "좁혀짐"의 구체적 예——대칭성이 4개의 항등식을 만들어, 독립 방정식을 10개에서 6개로 줄이고 있었죠.
G.6.2 끈이론으로의 연결 {#string-appendix-g-connection-to-string-theory}}¶
🔵 카이: 끈이론에서는 어떻게 되나요?
🟡 리나: 제 13 장에서 보게 될 Polyakov 작용:
은, 2차원 세계면 위의 스칼라장 \(X^\mu\)의 작용으로, 세계면의 계량 \(h_{ab}\)가 독립적인 동역학적 변수로 들어 있어요. Einstein-Hilbert 작용과 공통되는 것은 "계량을 포함하는 작용을 계량으로 변분한다"는 구조예요. \(h_{ab}\)가 세계면의 계량, \(X^\mu\)가 매입 좌표(끈 위의 각 점이 시공간의 어디에 있는지를 나타내는 함수, 자세한 것은 제 13 장에서 도입)예요.
🔵 카이: G.4에서 \(g^{\mu\nu}\)로 변분해서 \(T_{\mu\nu}\)를 얻은 것과, \(h^{ab}\)로 변분하는 것은 완전히 같은 정신이네요.
🟡 리나: 바로 그래요.
%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart TD
subgraph GR["일반상대론 (4차원 시공간)"]
A1["동역학적 변수: g_μν"] --> A2["작용: S_EH = ∫d⁴x √-g R"]
A2 -->|δ/δg^μν = 0| A3["Einstein 방정식"]
end
subgraph ST["끈이론 (2차원 세계면)"]
B1["동역학적 변수: h_ab, X^μ"] --> B2["작용: S_P = -T/2 ∫d²σ √-h h^ab ∂_a X^μ ∂_b X_μ"]
B2 -->|δ/δh^ab = 0| B3["구속조건 T_ab = 0"]
B2 -->|δ/δX^μ = 0| B4["파동방정식"]
end
GR -.->|"같은 변분 원리의 정신<br>차원: 4→2"| ST
그림 G.5: 중력 작용과 끈 작용의 구조적 유사성
변분의 정신은 완전히 같아요: - \(h^{ab}\)로 변분 → 세계면 위의 에너지-운동량 텐서 \(= 0\)(구속조건) - \(X^\mu\)로 변분 → 끈의 운동방정식(파동방정식)
🔵 카이: 아, 세계면의 계량 \(h_{ab}\)로 변분하는 것이 Einstein 방정식의 \(g_{\mu\nu}\)로 변분하는 것에 대응하는 거구나(그림 G.5「중력 작용과 끈 작용의 구조적 유사성」).
⚪ 메이: 차원이 4에서 2로 바뀌었을 뿐, 하는 것은 같네요.
🟡 리나: 그래요. 더 나아가 끈이론의 저에너지 유효 작용으로부터는, 고차원에서의 Einstein 방정식(+ 고차 보정항)이 나와요. 즉 끈이론은 Einstein의 중력을 "포함하고" 있어요. 이것이 끈이론이 양자중력의 후보로 여겨지는 이유 중 하나예요.
G.6.3 과학철학적 주의¶
🟡 리나: 마지막으로 하나. 이 도출은 아름답지만, 잊어서는 안 되는 것이 있어요.
Einstein 방정식은 모델이에요. "가장 단순한 작용"을 선택한 것은 인간의 미적 판단이지, 자연이 그것에 따른다는 보장은 없어요. 실제로:
- 고에너지에서는 \(R^2\) 항이나 \(R_{\mu\nu}R^{\mu\nu}\) 항이 중요해질 수 있다(고차 중력 모델)
- 양자효과로 작용 자체가 수정될 수 있다
- 끈이론은 \(\alpha'\)(끈의 장력의 역수)의 전개로 무한 개의 고차 보정을 예언한다
🔵 카이: 즉, Einstein 방정식이 "옳다"가 아니라, "현재까지 실험과 맞는 가장 심플한 모델"이라는 거예요?
🟡 리나: 바로 그래요. 작용의 형태를 "가장 단순하게" 선택한 것은, 현재의 실험 정밀도로 검증 가능한 범위에서는 옳기 때문이에요. 하지만 그것은 영원한 진리가 아니라, 더 정밀한 실험으로 수정될 가능성이 항상 있어요.
🔵 카이: 만약 장래에 더 정밀한 관측으로 \(R^2\) 항이 발견되면, 작용을 고쳐쓰기만 하면 되나요?
🟡 리나: 바로 그래요. 작용 원리의 틀 자체는 남기고, 작용의 내용을 수정해요. 이것이 작용 원리의 또 하나의 장점——이론의 확장이 체계적으로 가능하다는 것이에요. 즉 변분 원리의 절차 자체는 변하지 않고, 내용만 교체하면 돼요. 다시 말해, 작용 원리는 "답"이 아니라 "물음을 세우는 방법"을 제공하고 있으며, 내용은 실험으로 결정해요. 과학철학에서 말하는 "반증 가능성", 즉 실험으로 부정될 가능성을 항상 갖고 있는 것이 물리학의 강점이에요. 스스로 판단하는 자세를 잊지 마세요.
⚪ 메이: 그렇군요, 틀은 고정하고 내용을 교체한다——그래서 \(R^2\) 항을 더해도, 하는 것은 같은 "변분해서 0으로 놓기"인 거네요.
📝 연습문제:
- 우주상수항을 추가한 경우의 변분 → 문제 M-3. 우주상수항의 변분
✅ 이해도 체크: 작용으로서 \(R\)(스칼라 곡률)이 선택되는 이유는 무엇일까요?
답
\(R\)이 계량텐서의 2계 미분을 포함하는 가장 단순한 일반 좌표 불변 스칼라이기 때문이다. 다만 이것은 "가장 단순하다"는 미적 판단에 기초한 선택이며, 고에너지에서는 수정될 가능성이 있다.
G.7 연습문제¶
이 부록에서 등장한 연습문제를 재게시한다.
📝 연습문제:
- \(\delta\sqrt{-g}\)의 도출 → 문제 M-1. \(\delta\sqrt{-g}\) 의 유도
- Newton 극한의 확인 → 문제 M-2. Einstein-Hilbert의 Newton 극한
- 우주상수항을 추가한 경우의 변분 → 문제 M-3. 우주상수항의 변분
다음 장 예고¶
이 부록에서 Einstein 방정식의 변분적 도출을 완료했다. 제 13 장에서는 같은 변분 원리의 정신을 끈에 적용하여, Polyakov 작용으로부터 끈의 운동방정식과 구속조건을 도출한다.
참고문헌¶
- Sean Carroll, Spacetime and Geometry, Ch.4 "Einstein 방정식의 도출" — Palatini의 항등식과 경계항의 상세한 논의
- David Tong, Lectures on General Relativity, Ch.4: "The Einstein Equations" — 변분 계산의 명쾌한 해설
- Robert Wald, General Relativity, Ch.E "변분 원리" — Gibbons-Hawking-York 경계항의 엄밀한 취급
- Barton Zwiebach, A First Course in String Theory, Ch.12: "Relativistic quantum open strings" — 끈의 작용과 변분의 유사성
- 「일반상대론」편 제14장 — Einstein 방정식의 도출(동등 내용의 상세판. 기독자는 이 부록을 skip 가능)
- 「일반상대론」편 Appendix C — 변분법과 최소 작용의 원리
- 「장의 양자론」편 제3장 — 고전장 이론, Lagrangian과 Noether 정리
Feedback on this page
Let us know if something was unclear, incorrect, or could be improved.
