Appendix C 장의 Lagrangian과 Euler–Lagrange 방정식¶
지금까지의 이야기: 부록 B 에서는 텐서곱 \(\otimes\)의 정의와 계산 법칙을 배우고, 반변 텐서 공간 \(T^r(V)\)의 구조를 이해했다. Einstein의 축약 기법을 도입하여, 텐서의 성분 표시와 다중선형사상으로서의 관점 사이의 대응을 확인했다. 이러한 도구를 갖춤으로써 장 방정식을 성분으로 써내릴 준비가 되었다. 이 장에서는 그 성분 표기를 활용하면서, 장의 작용 원리와 운동방정식의 도출로 나아간다. 참고로, C.6 이후에서는 제 12 장 에서 배운 공변미분의 지식도 사용한다. 최소작용의 원리(제 1 장)는 장 전체를 통해 기초가 된다.
이 장의 목표
- 입자의 작용 원리를 장(field)으로 확장한다
- Lagrangian 밀도(Lagrangian density)의 개념을 도입하고, 장의 Euler–Lagrange 방정식을 도출한다
- 나아가, 휘어진 시공간에서의 장의 작용 표현법을 배우고, Einstein–Hilbert 작용(Einstein–Hilbert action)으로의 길을 제시한다
C.1 왜 "장"의 작용 원리가 필요한가¶
🟡 리나: 제 1 장에서 입자의 운동방정식을 최소작용의 원리로부터 도출했었지. 그때 역학 변수는 "입자의 위치 \(x^i(t)\)"——즉 시간의 함수가 유한 개 있을 뿐이었어.
실제 경로(실선) 주변에 미소한 변위 \(\delta x^i\)(점선)를 더해 작용이 극값이 되는 조건을 구했지(그림 C.1「변분법의 개념」). 장 이론에서는 이 \(\delta x^i\)가 장의 미소 변위 \(\delta\phi\)로 바뀌는 거야——그게 이 장의 주제야.
그림 C.1: 그림 C.1:변분법의 개념. 실제 배위(실선) 주변에 미소한 변위(점선)를 더해 작용이 극값이 되는 조건을 구한다. 입자역학에서는 \(\delta x^i\), 장 이론에서는 \(\delta\phi\)가 이 변위에 대응한다.
🔵 카이: 네. 3차원 공간이면 \(x^1(t), x^2(t), x^3(t)\)의 3개요.
🟡 리나: 하지만 일반상대성이론의 주인공은 뭐였지?
🔵 카이: 음……계량, 인가요?
🟡 리나: 맞아, 계량장 \(g_{\mu\nu}(x)\)야. 이건 "유한 개의 좌표"가 아니라 시공간의 각 점에 값이 붙어 있는 거야. 즉 역학 변수가 무한 개 있어. 입자의 작용 원리를 그대로 쓸 수는 없으니——장 이론용으로 확장할 필요가 있는 거야.
🔵 카이: 입자의 경우는 "경로를 조금 움직여서 작용이 극값이 되는 조건"을 구했는데요. 장의 경우는요?
🟡 리나: "장의 값을 각 점에서 조금 움직여서 작용이 극값이 되는 조건"을 구하는 거야. 하는 일의 정신은 완전히 같아. 다만 적분이 시간만이 아니라 시공간 전체에 걸치게 돼.
✅ 이해도 체크: 입자의 작용 원리와 장의 작용 원리의 본질적인 차이는 무엇일까요?
답
입자의 경우 역학 변수가 유한 개의 좌표 \(x^i(t)\)이며, 작용은 시간만의 적분이지만, 장의 경우 역학 변수가 시공간의 각 점에 값을 갖는 장 \(\phi(x^\mu)\)(무한 개의 자유도)이며, 작용은 시공간 전체에 걸친 적분이 된다. 다만 "변분하여 극값 조건을 구한다"는 정신은 같다.
C.2 입자에서 장으로——대응 관계¶
🟡 리나: 먼저 입자역학과 장 이론의 대응을 정리해 두자(표 C.1「입자역학과 장 이론의 대응 관계」).
표 C.1: 입자역학과 장 이론의 대응 관계
| 입자역학 | 장 이론 |
|---|---|
| 일반화 좌표 \(q(t)\) | 장 \(\phi(x^\mu)\) |
| 일반화 속도 \(\dot{q}\) | 장의 미분 \(\partial_\mu \phi\) |
| Lagrangian \(L(q, \dot{q})\) | Lagrangian 밀도 \(\mathcal{L}(\phi, \partial_\mu \phi)\) |
| 작용 \(S = \int dt \, L\) | 작용 \(S = \int d^4x \, \mathcal{L}\) |
⚪ 메이: 이산적인 첨자 \(i\)(좌표의 번호)가 연속적인 시공간 좌표 \(x^\mu\)로 바뀌는 거네.
🔵 카이: \(d^4x\)가 뭐예요?
🟡 리나: 4차원 시공간의 부피 요소야. \(d^4x = dt\,dx\,dy\,dz\). 장의 Lagrangian 밀도 \(\mathcal{L}\)은 "단위 부피당 Lagrangian"이니까, 전 공간에 걸쳐 적분하면 전체 Lagrangian \(L\)이 돼:
거기에 시간으로도 적분하면 작용 \(S\)가 되고:
⚪ 메이: 그래서 \(\mathcal{L}\)을 "Lagrangian 밀도"라고 부르는 거구나. 밀도니까, 적분하면 전체 양이 되는 거지.
✅ 이해도 체크: Lagrangian 밀도 \(\mathcal{L}\)과 Lagrangian \(L\), 작용 \(S\)의 관계를 서술해 보세요.
답
Lagrangian 밀도 \(\mathcal{L}\)은 단위 부피당 Lagrangian이며, 공간 전체에서 적분하면 Lagrangian \(L = \int d^3x\,\mathcal{L}\)이 된다. 거기에 시간으로도 적분하면 작용 \(S = \int d^4x\,\mathcal{L}\)을 얻는다.
C.3 구체적 예로 감 잡기——현의 진동¶
🟡 리나: 추상적인 이야기 전에, 고등학교에서도 익숙한 예로 감을 잡아 보자. 장력 \(\mathcal{T}\), 선밀도 \(\rho\)인 현을 생각할게. 현의 각 점의 변위를 \(\psi(x,t)\)라 하자.
🔵 카이: 기타 줄 같은 거군요.
🟡 리나: 맞아. 이 계의 Lagrangian 밀도는:
🔵 카이: \(\frac{\partial \psi}{\partial t}\)는 현의 각 점의 속도니까, \(\frac{1}{2}\rho v^2\)로 운동 에너지 밀도……그건 알겠어요. 그런데 두 번째 항은 왜 \(\left(\frac{\partial\psi}{\partial x}\right)^2\)인 거예요? 기울기의 제곱이 에너지가 되는 이유가 잘 와닿지 않는데요.
🟡 리나: 좋은 질문이야. 현이 기울어진 부분은 수평에 비해 길이가 늘어나 있어——그 늘어남에 저항하는 장력 \(\mathcal{T}\)가 일을 하니까 에너지가 저장되는 거야. 미소 구간 \(dx\)의 현의 실제 길이는 \(\sqrt{1 + (\partial_x\psi)^2}\,dx \approx (1 + \frac{1}{2}(\partial_x\psi)^2)\,dx\)이니까, 늘어난 양은 \(\frac{1}{2}(\partial_x\psi)^2\,dx\)에 비례해. 장력을 곱하면 에너지 밀도 \(\frac{\mathcal{T}}{2}(\partial_x\psi)^2\)가 나오지.
🟡 리나: 이 예의 포인트는, 역학 변수가 \(\psi(x,t)\)라는 장이라는 것. 현의 각 점 \(x\)가 "일반화 좌표의 첨자" 역할을 하고 있어서, 역학 변수가 연속 무한 개인 거야.
✅ 이해도 체크: 현의 진동 예에서, 현의 각 점 \(x\)는 입자역학의 어떤 개념에 대응할까요?
답
현의 각 점 \(x\)는 입자역학에서의 일반화 좌표의 "첨자"(이산적인 번호 \(i\))에 대응한다. 입자역학에서는 유한 개의 좌표 \(q_i(t)\)가 있는 반면, 현에서는 연속적인 위치 \(x\)마다 변위 \(\psi(x,t)\)가 있어서 역학 변수가 연속 무한 개가 된다.
📝 연습문제:
- 현의 Lagrangian 밀도의 편미분 → 문제 B-3. 줄의 Lagrangian 편미분
C.4 장의 Euler–Lagrange 방정식의 도출¶
🟡 리나: 자, 본론이야. 스칼라장 \(\phi(x^\mu)\)의 작용이
로 주어질 때, \(\delta S = 0\)으로부터 운동방정식을 도출해 보자.
단계 1:장의 변분¶
🟡 리나: 장을 미소하게 움직여:
경계 조건으로서, 적분 영역 \(D\)의 경계 위에서 \(\delta\phi = 0\)으로 둬. 입자의 경우에 끝점에서 \(\delta x^i = 0\)으로 한 것과 같은 정신이야.
단계 2:작용의 변분을 계산¶
🟡 리나: 작용의 1차 변화는:
이건 다변수 함수의 전미분과 같은 발상이야. \(\mathcal{L}\)은 \(\phi\)와 \(\partial_\mu\phi\) 두 종류의 변수에 의존하니까, \(\phi\)가 \(\delta\phi\)만큼 변했을 때의 기여와, \(\partial_\mu\phi\)가 변했을 때의 기여를 합한 거야——고등학교에서 배운 \(df = \frac{\partial f}{\partial x}dx + \frac{\partial f}{\partial y}dy\)의 확장이지. 여기서 \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\)라는 표기법은 "\(\partial_\mu\phi\)를 \(\phi\)와는 독립인 변수로 보고 편미분한다"는 의미야——입자역학에서 \(L(q,\dot{q})\)의 \(\frac{\partial L}{\partial\dot{q}}\)를 계산할 때 \(q\)와 \(\dot{q}\)를 별개로 취급한 것과 같은 발상이야. 구체적인 계산법은 C.5에서 한 단계씩 보여줄 테니, 지금은 "이런 기호가 있다"고 생각해 둬.
⚪ 메이: C.2의 표(표 C.1「입자역학과 장 이론의 대응 관계」)에서 본 \(q \to \phi\), \(\dot{q} \to \partial_\mu\phi\)의 대응이 그대로 식에 나타나 있네.
🟡 리나: 맞아. \(q \to \phi\), \(\dot{q} \to \partial_\mu \phi\)에 대응하는 항이 각각 나란히 있는 게 보이지.
🔵 카이: \(\delta(\partial_\mu \phi)\)는 뭐예요?
🟡 리나: 결론부터 말하면, 변분과 편미분의 순서는 교환할 수 있어서 \(\delta(\partial_\mu \phi) = \partial_\mu(\delta\phi)\)야.
🔵 카이: 에? 순서를 바꿔도 되는 건가요? 왜요?
🟡 리나: 직관적으로는, \(\delta\phi\)는 "장의 미소한 변위"로서, 각 점 \(x^\mu\)에서의 장의 값을 조금 바꾸지만, 좌표 \(x^\mu\) 자체의 위치는 움직이지 않아——입자역학에서 끝점을 고정한 채 경로의 형태를 바꾼 것과 같은 정신이지. 그래서 \(x^\mu\)로 미분하는 연산 \(\partial_\mu\)와 장의 값을 움직이는 연산 \(\delta\)는 서로 간섭하지 않아——"움직인 다음 미분"과 "미분한 다음 움직이기"는 같은 결과가 되는 거야.
🔵 카이: 좌표는 고정하고 장의 값만 움직이니까, 편미분과 변분은 간섭하지 않는다……는 뜻인가요?
🟡 리나: 맞아. 좌표로 미분하는 연산과 장의 값을 움직이는 연산이 독립이니까 교환할 수 있어. 좀 더 구체적으로 확인해 볼게. \(\partial_\mu\phi\)의 정의는 "\(x^\mu\) 방향으로 미소량 \(\epsilon\)만큼 나아갔을 때의 \(\phi\)의 변화율", 즉:
장을 \(\phi \to \phi + \delta\phi\)로 움직이면, 이 정의식 안의 \(\phi\)가 모두 \(\phi + \delta\phi\)로 바뀔 뿐이니까, 변화분은:
즉 \(\delta(\partial_\mu\phi) = \partial_\mu(\delta\phi)\)가 성립해.
🔵 카이: 오오, 정의로 돌아가서 써보면 그대로 나오는군요. 깔끔해졌어요.
단계 3:부분적분¶
🟡 리나: 두 번째 항에 부분적분을 적용해. 입자의 경우와 완전히 같은 발상이야. \(\partial_\mu\)는 \(x^\mu\)에 의한 보통의 편미분이니까, 고등학교에서 배운 곱의 법칙을 그대로 쓸 수 있어. \(f\,g' = (fg)' - f'\,g\)의 4차원 버전을 쓰면:
🔵 카이: \(f = \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\), \(g = \delta\phi\)로 놓고 \((fg)' = f'g + fg'\)를 써서 \(fg'\)를 좌변에 가져온 형태네요!
🟡 리나: 맞아. 첫 번째 항은 전미분(total divergence)——즉 \(\partial_\mu(\text{무언가})\)의 형태를 하고 있어. 이런 항을 전 공간에서 적분하면, Gauss의 정리(발산 정리)에 의해 경계면 위의 적분으로 변환할 수 있어.
🔵 카이: 발산 정리는 고등학교에서 배운 "체적 적분을 면적분으로 바꾸는" 그건가요?
🟡 리나: 맞아, 그것의 일반화야. 1차원이라면 \(\int_a^b f'(x)\,dx = f(b) - f(a)\)——미분한 것을 적분하면 끝(경계)의 값만 남지. 3차원이라면 체적 적분이 경계면의 면적분이 되고. 4차원에서도 완전히 같은 원리로, 4차원 체적의 적분이 3차원 경계면의 적분이 돼. 식으로 쓰면 \(\int_D \partial_\mu V^\mu\,d^4x = \oint_{\partial D} V^\mu\,dS_\mu\)라는 형태——좌변의 "내부의 발산의 적분"이 우변의 "경계면 위의 적분"과 같아지는 거야. 여기서 \(dS_\mu\)는 경계면의 "방향이 있는 면적 요소"로, 3차원 발산 정리에서 면적분에 나타나는 법선 벡터 \(\vec{n}\,dA\)의 4차원 버전이라고 생각하면 돼.
🔵 카이: 4차원 면적 요소는 솔직히 이미지가 안 되는데……지금은 "경계의 값만 남는다"는 1차원의 경우와 같은 정신이라고 생각해 두면 될까요?
🟡 리나: 그 이해면 충분해. 그리고 지금의 경우, \(V^\mu = \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\delta\phi\)로 놓고 있어. \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\)는 \(\mu\)의 값마다 하나의 수를 주는——즉 4개의 성분을 가진 양이고, \(\delta\phi\)(스칼라)를 곱해도 4성분 그대로야. 그래서 \(V^\mu\)는 발산 정리에 등장하는 "4성분의 벡터적인 양"의 역할을 할 수 있어. 경계 \(\partial D\) 위에서는 \(\delta\phi = 0\)이라 가정했으니, \(V^\mu\)도 경계에서 영——따라서 우변은 영이야. 즉 이 항은 사라져.
⚪ 메이: 입자역학에서도 끝점에서 \(\delta q = 0\)으로 해서 경계항을 없앴는데, 완전히 같은 논법이 4차원으로 확장된 것뿐이네.
단계 4:Euler–Lagrange 방정식¶
🟡 리나: 나머지를 정리하면:
임의의 \(\delta\phi(x)\)에 대해 이것이 영이어야 해. 만약 괄호 안의 내용이 어떤 점 \(x_0\)에서 양(예를 들어)이라면, 연속성에 의해 \(x_0\)의 근방에서도 양인 채야. 거기서 \(x_0\) 근처에서만 양의 값을 갖고 다른 곳에서는 영이 되는 \(\delta\phi\)를 선택하면, 적분이 양이 되어 \(\delta S = 0\)에 모순이 생겨.
🔵 카이: "\(x_0\) 근처에서만 양이고 다른 곳에서는 영"인 함수가 정말 만들 수 있나요? 경계에서 \(\delta\phi = 0\)이라는 조건도 만족해야 하잖아요……
🟡 리나: 만들 수 있어. 예를 들어, \(x_0\)을 중심으로 하는 작은 구의 내부에서만 매끄럽게 솟아오르고, 구 바깥에서는 정확히 영이 되는 함수가 존재한다는 것이 알려져 있어. 수학에서는 이런 함수를 "받침(support)이 컴팩트한 함수"라고 불러——"받침"이란 함수가 영이 아닌 영역을 말하고, "컴팩트"란 대략적으로 말하면 그 영역이 유한한 범위에 들어 있다(무한 멀리까지 퍼지지 않는다)는 의미야. 경계는 적분 영역의 끝이니까, \(x_0\)이 내부에 있는 한 구를 충분히 작게 잡으면 경계 조건에도 저촉되지 않아.
🔵 카이: 그렇군요, 내부의 어디든 그런 "검사 함수"를 놓을 수 있으니까, 도망칠 곳이 없는 거네요.
🟡 리나: 맞아. 그래서 괄호 안의 내용은 어떤 점에서든 영이어야 해:
이것이 장의 Euler–Lagrange 방정식이야.
⚪ 메이: C.2의 표(표 C.1「입자역학과 장 이론의 대응 관계」)에서 본 \(q \to \phi\), \(\dot{q} \to \partial_\mu\phi\)의 대응이 그대로 반영되어 있어서, 입자의 경우와 완전히 평행한 구조가 되어 있네.
🔵 카이: 구조가 같으니까 외우기 쉽겠다! 그런데 \(\partial_\mu\)는 \(\mu = 0,1,2,3\)의 합이잖아요? 구체적으로 계산하면 어떻게 되는 거지……
🟡 리나: 좋은 질문이야. 다음 절에서 실제로 해볼게.
📝 연습문제:
- \(\partial\mathcal{L}/\partial\phi\)의 계산 → 문제 B-1. Klein-Gordon의 \(\partial \mathcal{L}/\partial \phi\), \(\partial\mathcal{L}/\partial(\partial_\mu\phi)\)의 계산 → 문제 B-2. Klein-Gordon의 \(\partial \mathcal{L}/\partial(\partial\phi)\), \(\phi^4\) 이론의 편미분 → 문제 B-4. \(\phi^4\) 이론의 \(\partial \mathcal{L}/\partial \phi\), 2차원의 Euler–Lagrange 방정식 → 문제 B-6. 2차원 스칼라장의 Euler–Lagrange 방정식
C.5 구체적 예:자유 스칼라장의 운동방정식¶
🟡 리나: 도출한 방정식을 사용해서 구체적인 운동방정식을 얻어 보자. 4차원 Minkowski 시공간에서의 자유 스칼라장——"자유"란 다른 장과의 상호작용이 없는, 즉 \(\phi\)만으로 닫힌 계라는 의미——의 Lagrangian 밀도는:
전체에 마이너스가 붙어 있어서 놀랄 수도 있지만, 이건 \(\eta^{00} = -1\)이라 전개하면 시간 미분 항이 양이 되도록 설계된 거야——바로 뒤에서 확인할게. 먼저 이 식이 어디에서 왔는지 설명할게. C.3의 현의 Lagrangian 밀도 \(\frac{\rho}{2}(\partial_t\psi)^2 - \frac{\mathcal{T}}{2}(\partial_x\psi)^2\)를 4차원으로 확장하고, 나아가 Lorentz 불변——즉 특수상대론의 좌표 변환(Lorentz 변환)을 해도 식의 형태가 바뀌지 않도록——쓴 것이 이거야. 현에서는 시간 미분과 공간 미분이 따로 쓰여 있었지만, \(\eta^{\mu\nu}\)를 사용하면 시간과 공간을 합쳐서 하나의 식으로 표현할 수 있어. 왜 Lorentz 불변이 되느냐 하면, \(\eta^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi)\)는 첨자가 모두 축약된 스칼라 양——Lorentz 변환으로 각 성분은 변하지만, 축약(합을 취하는 연산)의 결과는 변하지 않아. 마치 벡터의 내적 \(\vec{a}\cdot\vec{b}\)가 회전에 불변인 것과 같은 원리야.
🔵 카이: 아, 내적의 불변성과 같은 구조이군요. 그럼 \(-\frac{m^2}{2}\phi^2\) 쪽은요?
🟡 리나: \(-\frac{m^2}{2}\phi^2\)는 현에는 없었던 질량항——왜 "질량"이라 부르느냐 하면, 이 Lagrangian에서 도출되는 운동방정식(곧 도출할 거야)에 평면파 해 \(\phi \propto e^{i(\vec{k}\cdot\vec{x} - \omega t)}\)——Appendix A에서 배운 복소지수함수에 의한 파동 표기지——를 대입하면, 분산 관계 \(\omega^2 = |\vec{k}|^2 + m^2\)를 얻거든. 이건 상대론적 에너지와 운동량의 관계 \(E^2 = |\vec{p}|^2 + m^2\)(제 4 장에서 배웠지)와 같은 형태야. 즉 \(m\)은 장의 양자(입자)의 정지 질량에 대응하는 매개변수야. 왜 그렇게 말할 수 있는지는, 이 절의 마지막에서 Klein–Gordon 방정식을 도출한 후에 확인할게. 지금 단계에서는 "\(m\)이 클수록 장이 진동하기 어려워지는 무게 매개변수"라고 생각해 두면 충분해.
⚪ 메이: 즉 \(\eta^{\mu\nu}\) 항이 현의 "\(T - V\)"를 상대론적으로 합친 것이고, \(m^2\) 항이 질량에 의한 추가적인 퍼텐셜이라는 거네.
🟡 리나: 여기서 \(\eta^{\mu\nu}\)는 Minkowski 계량 \(\eta_{\mu\nu} = \mathrm{diag}(-1,+1,+1,+1)\)의 역행렬이야. 대각행렬의 역행렬은 각 성분의 역수를 나열한 것이니까, \(1/(-1) = -1\), \(1/1 = 1\)로 \(\eta^{\mu\nu} = \mathrm{diag}(-1,+1,+1,+1)\)과 성분이 같아져. 참고로 여기서는 자연단위계(\(c = \hbar = 1\))를 채택하고 있어. \(c = 1\)은 제 4 장에서 도입한 단위계——거리와 시간을 같은 차원으로 만드는 것. 여기서는 \(\hbar = 1\)(Planck 상수를 1로)도 더해서, 에너지·질량·길이의 역수·시간의 역수를 모두 같은 차원으로 통일하는 거야(자세한 건 제 25 장 참조). 이렇게 하면 식이 간결해지는 대신, 원래 단위로 돌리고 싶을 때는 차원 해석으로 \(c\)나 \(\hbar\)를 적절한 곳에 복원해야 해.
🔵 카이: \(c = \hbar = 1\)로 하면, 이 식의 \(m\)의 차원은 어떻게 되나요?
🟡 리나: \(c = \hbar = 1\)에서는 질량·에너지·운동량·길이의 역수·시간의 역수가 모두 같은 차원이 돼——제 25 장에서 확인했지. 그래서 Klein–Gordon 방정식에 나타나는 \(m\)은 "길이의 역수"의 차원을 가져——\(m\)이 클수록 Compton 파장 \(1/m\)이 짧아진다고 생각하면 돼.
🔵 카이: 어? 전체에 마이너스가 붙어 있는데, 현일 때는 \(+\frac{\rho}{2}(\dot\psi)^2 - \cdots\)였잖아요? 전개하면 정말로 양이 되나요?
🟡 리나: 확인해 보자. \(\eta^{\mu\nu}\)의 시간 성분이 \(\eta^{00} = -1\)이니까, \(-\frac{1}{2}\eta^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi)\)의 \(\mu=\nu=0\) 항은 \(-\frac{1}{2}\times(-1)\times(\partial_t\phi)^2 = +\frac{1}{2}(\partial_t\phi)^2\)이 돼. 봐, 마이너스와 마이너스가 상쇄되어 양이 됐지. 질량항의 \(-\frac{m^2}{2}\phi^2\)도, Lagrangian의 "\(T - V\)" 구조의 \(-V\) 부분——퍼텐셜 에너지 밀도 \(V = \frac{m^2}{2}\phi^2 \geq 0\)에 마이너스가 붙은 형태야.
🔵 카이: \(\eta^{\mu\nu}\)를 써서 전개하면 어떻게 되나요?
🟡 리나: \(\eta^{\mu\nu} = \mathrm{diag}(-1,+1,+1,+1)\)이니까, 대각 성분만 살아남아. 먼저 전개해 볼게:
각 성분의 값을 대입하면:
여기서 \((\nabla\phi)^2 = (\partial_x\phi)^2 + (\partial_y\phi)^2 + (\partial_z\phi)^2\)는 공간 미분의 제곱합이야. 앞의 \(-\frac{1}{2}\)과 합치면:
질량항도 더해서:
⚪ 메이: 첫 번째 항이 "운동 에너지 밀도", 나머지가 "퍼텐셜 에너지 밀도". 현일 때와 같은 \(T - V\) 구조네.
🟡 리나: 자, Euler–Lagrange 방정식을 계산해 보자.
단계 1: \(\phi\)에 의한 편미분:
단계 2: \(\partial_\mu \phi\)에 의한 편미분. 최종 결과를 먼저 보여줄게:
🟡 리나: "왜 이렇게 되는지"를 아래에서 한 단계씩 도출할 테니, 먼저 이 식의 읽는 법을 확인해 두자. 우변의 \(\nu\)는 \(\eta^{\mu\nu}\)(위첨자)와 \(\partial_\nu\phi\)(아래첨자) 양쪽에 나타나 있어——부록 B에서 배운 Einstein의 축약 규칙에 의해, 같은 첨자가 위아래로 한 번씩 나타나면 \(\nu = 0,1,2,3\)의 합을 취하는 거였지. 즉 \(\nu\)는 "합을 취하기 위한 첨자"(더미 첨자). 반면 \(\mu\)는 좌변에도 우변에도 한 번씩밖에 나타나지 않는 "자유 첨자"——이쪽은 합을 취하지 않고, \(\mu\)의 값을 하나 고정할 때마다 1개의 식이 얻어지니까, 이 식은 총 4개의 식을 모아서 표현하고 있어.
🔵 카이: 왜 \(\eta^{\mu\nu}\partial_\nu\phi\)가 나오는 건가요? 애초에 \(\partial_\mu\phi\)로 미분한다는 게, 뭘 고정하고 뭘 움직이는 건지 감이 안 오는데요……
🟡 리나: 여기서의 포인트는, \(\partial_\mu\phi\)를 독립변수로서 취급하는 거야. 기억해 봐——입자역학의 Lagrangian \(L(q, \dot{q})\)에서도, \(q\)와 \(\dot{q}\)는 물리적으로는 "\(q\)를 시간 미분한 것"이지만, 편미분을 계산할 때는 형식적으로 별개의 변수로 취급했잖아. \(\frac{\partial L}{\partial q}\)를 계산할 때는 \(\dot{q}\)를 고정하고, \(\frac{\partial L}{\partial \dot{q}}\)를 계산할 때는 \(q\)를 고정해. 왜 그러냐 하면, Lagrangian을 "\(q\)와 \(\dot{q}\)라는 2개의 입력 슬롯을 가진 함수"로 보고 있기 때문이야. 물리적인 운동 위에서는 \(\dot{q} = dq/dt\)라는 관계가 있지만, 편미분 단계에서는 "만약 \(\dot{q}\)만 바꾸고 \(q\)를 고정하면 \(L\)이 어떻게 변하나"를 묻고 있는 거야——실제 운동의 구속을 부과하는 건 편미분을 계산한 이후의 이야기야.
🔵 카이: 아, 입자일 때도 \(q\)와 \(\dot{q}\)를 "별개"로 취급했었죠. 장의 경우도 같은 발상으로, \(\phi\)와 \(\partial_0\phi, \partial_1\phi, \partial_2\phi, \partial_3\phi\)를 별개의 변수로 본다는 뜻인가요?
🟡 리나: 맞아. 총 5개를 형식적으로 독립인 변수로 취급하는 거야. 보통의 다변수 함수 \(f(u, v, w)\)에서 \(\frac{\partial u}{\partial v} = 0\)이 되는 것과 같은 발상——\(u, v, w\)가 독립변수라면, \(v\)를 움직여도 \(u\)는 변하지 않지. 여기서는 \(\phi, \partial_0\phi, \partial_1\phi, \partial_2\phi, \partial_3\phi\)가 그 "독립변수"에 해당하는 거야. 그래서 \(\frac{\partial(\partial_\alpha\phi)}{\partial(\partial_\mu\phi)} = \delta^\mu{}_\alpha\)가 돼. \(\delta^\mu{}_\alpha\)는 Kronecker(크로네커) 델타——\(\alpha = \mu\)일 때 1, 그 외에는 0이 되는 기호지(제 6 장이나 부록 B에서도 나왔어). 첨자의 위아래가 다른 건 표기상의 관례로, 여기서는 단순히 "\(\alpha\)와 \(\mu\)가 같은 값인지 아닌지"를 판정하는 기호라고 생각하면 OK야. 보통의 다변수 함수에서 \(\frac{\partial x_i}{\partial x_j} = \delta_{ij}\)(\(i = j\)면 1, \(i \neq j\)면 0)라고 쓰는 것과 완전히 같은 발상——다만 첨자가 위아래로 나뉘어 있을 뿐이야. 예를 들어 \(\mu = 1\)로 고정해 보면, \(\frac{\partial(\partial_1\phi)}{\partial(\partial_1\phi)} = 1\)이지만, \(\frac{\partial(\partial_0\phi)}{\partial(\partial_1\phi)} = 0\)——\(\partial_0\phi\)와 \(\partial_1\phi\)는 독립인 변수이니까, 한쪽으로 미분해도 다른 쪽은 움직이지 않아.
⚪ 메이: Kronecker 델타가 "같은 변수인지 아닌지의 필터" 역할을 하는 거네.
🟡 리나: 참고로, 질량항 \(-\frac{m^2}{2}\phi^2\)는 \(\partial_\mu\phi\)를 포함하지 않으니까, \(\partial_\mu\phi\)로 미분하면 영——기여하는 건 운동항 \(-\frac{1}{2}\eta^{\alpha\beta}(\partial_\alpha\phi)(\partial_\beta\phi)\)뿐이야. 여기서 원래 식의 더미 첨자 \(\mu, \nu\)를 \(\alpha, \beta\)로 바꾼 건, 미분하는 변수의 첨자 \(\mu\)와 충돌하지 않게 하기 위해서——더미 첨자는 "합을 취하기 위한 일회용 문자"이니까, 이름을 바꿔도 물리적 의미는 변하지 않아.
자, \(\mathcal{L}\)의 정의식에서는 \(\eta^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi)\)라고 썼지만, 여기서의 \(\mu, \nu\)는 더미 첨자(합을 취하기 위한 첨자)였지. 그런데 지금 "\(\partial_\mu\phi\)로 미분한다"고 할 때의 \(\mu\)는 자유 첨자——즉 고정된 값을 나타내는 첨자야. 같은 문자를 두 가지 의미로 쓰면 혼란스러우니까, Lagrangian 밀도 안의 더미 첨자를 \(\alpha, \beta\)로 바꿀게. \(\eta^{\alpha\beta}(\partial_\alpha\phi)(\partial_\beta\phi)\)는 원래의 \(\eta^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi)\)와 완전히 같은 양——문자만 바꾼 거야. 이렇게 하면 미분하는 변수의 첨자 \(\mu\)와 합의 첨자가 충돌하지 않게 돼.
🔵 카이: 첨자의 충돌을 피하기 위해 문자를 바꾸는 거군요. 내용은 같으니까 안심……
🟡 리나: 이걸 \(\partial_\mu \phi\)로 미분할게. 여기서 \(\eta^{\alpha\beta}(\partial_\alpha\phi)(\partial_\beta\phi)\)는 \(\alpha, \beta\) 각각 \(0,1,2,3\)의 이중합이니까, 전개하면 \(\partial_0\phi, \partial_1\phi, \partial_2\phi, \partial_3\phi\)라는 4개의 독립변수의 2차식이 되어 있어. 예를 들어 \(\mu = 1\)로 미분한다면, "\(\partial_1\phi\)가 나타나는 항만 살아남는다"고 생각하면 돼. \(\eta^{\alpha\beta}\)는 Minkowski 계량의 성분으로 \(\partial_\mu\phi\)에 의존하지 않는 상수이니까, 미분 밖으로 꺼낼 수 있어——보통의 미분에서 \(\frac{d}{dx}[c \cdot f(x)] = c\frac{df}{dx}\)로 하는 것과 같지. 일반적인 \(\mu\)에 대해 곱의 미분 법칙을 쓰면:
우변의 제1항은 "앞의 인수 \((\partial_\alpha\phi)\)를 미분해서 \(\delta^\mu{}_\alpha\)가 나온" 것, 제2항은 "뒤의 인수 \((\partial_\beta\phi)\)를 미분해서 \(\delta^\mu{}_\beta\)가 나온" 것——보통의 \(\frac{d}{dx}[f(x)g(x)] = f'g + fg'\)와 같은 구조야. 제1항에서는 \(\delta^\mu{}_\alpha\)가 "\(\alpha = \mu\) 이외를 전부 없애는" 작용을 해——\(\alpha\)에 대해 \(0,1,2,3\)의 합을 취해도 \(\alpha = \mu\)인 항만 살아남으니까, 결과는 \(\eta^{\mu\beta}\partial_\beta\phi\)가 돼. 예를 들어 \(\mu = 1\)이면, \(\delta^1{}_0 = 0\), \(\delta^1{}_1 = 1\), \(\delta^1{}_2 = 0\), \(\delta^1{}_3 = 0\)이니까, \(\alpha = 0,2,3\)의 항은 전부 사라지고 \(\alpha = 1\)의 항만 남아서 \(\eta^{1\beta}\partial_\beta\phi\)가 얻어져. 마찬가지로 제2항에서는 \(\delta^\mu{}_\beta\)가 \(\beta = \mu\)인 항만 남기니까, \(\beta\)의 합이 사라져서 \(\eta^{\alpha\mu}\partial_\alpha\phi\)가 남아. 즉:
🔵 카이: 오오, Kronecker 델타가 합 속에서 하나의 항만 골라내 주는 거군요!
🟡 리나: \(\eta^{\mu\nu}\)는 대칭(\(\eta^{\alpha\mu} = \eta^{\mu\alpha}\))이니까, 제2항의 \(\eta^{\alpha\mu}\partial_\alpha\phi\)는 \(\eta^{\mu\alpha}\partial_\alpha\phi\)로 쓸 수 있어. 나아가 더미 첨자 \(\alpha\)를 \(\nu\)로, 제1항의 더미 첨자 \(\beta\)도 \(\nu\)로 바꾸면(합을 취하는 문자는 아무거나 상관없으니까), 둘 다 \(\eta^{\mu\nu}\partial_\nu\phi\)가 돼. 합치면 \(2\eta^{\mu\nu}\partial_\nu\phi\). Lagrangian 밀도의 운동항 \(-\frac{1}{2}\eta^{\alpha\beta}(\partial_\alpha\phi)(\partial_\beta\phi)\)에 걸려 있던 계수 \(-\frac{1}{2}\)과 곱하면 \(-\frac{1}{2} \times 2\eta^{\mu\nu}\partial_\nu\phi = -\eta^{\mu\nu}\partial_\nu\phi\)가 돼.
⚪ 메이: 대칭성 덕분에 2개의 항이 같은 형태로 합쳐져서, 계수 \(\frac{1}{2}\)과 딱 상쇄되는 거네. 기분 좋다.
단계 3: \(\partial_\mu\)를 작용시킨다.
🟡 리나: 단계 2의 결과 \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)} = -\eta^{\mu\nu}\partial_\nu\phi\)는 "\(\mu\)를 하나 고정했을 때의 식"——예를 들어 \(\mu=0\)이면 \(-\eta^{0\nu}\partial_\nu\phi\), \(\mu=2\)이면 \(-\eta^{2\nu}\partial_\nu\phi\)라는 식이야.
🔵 카이: 단계 2에서는 \(\mu\)를 고정해서 계산했는데, Euler–Lagrange 방정식에 대입할 때는 \(\mu\)로 합을 취하나요? 뭔가 모순 아닌가요?
🟡 리나: 좋은 질문이야. 모순은 없어. Euler–Lagrange 방정식의 제2항은 \(\partial_\mu\!\left(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right)\)라는 형태를 하고 있어서, 바깥쪽의 \(\partial_\mu\)와 안쪽의 \(\mu\)가 같은 문자——즉 여기서는 \(\mu = 0,1,2,3\)의 합을 취하는 구조야. 단계 2에서는 "\(\mu\)를 하나 고정하면 어떻게 되는지"를 먼저 계산해 놓고, 마지막에 모든 \(\mu\)에 대해 합산하는——2단계로 나눠 계산하고 있을 뿐이야. 구체적으로 써보면 \(\partial_0(-\eta^{0\nu}\partial_\nu\phi) + \partial_1(-\eta^{1\nu}\partial_\nu\phi) + \partial_2(-\eta^{2\nu}\partial_\nu\phi) + \partial_3(-\eta^{3\nu}\partial_\nu\phi)\)라는 4개 항의 합——이걸 축약 기법으로 정리한 것이 다음 식이야. 계산하면:
여기서 \(\mu\)는 위(\(\eta^{\mu\nu}\))와 아래(\(\partial_\mu\))에 한 번씩 나타나니까, \(\mu = 0,1,2,3\)의 합을 취하고 있어——바로 앞에 써놓은 4개 항의 합을 정리한 표기야.
두 번째 등호에서는 \(\eta^{\mu\nu}\)가 상수(좌표에 의존하지 않음)임을 이용했어. Minkowski 계량 \(\eta^{\mu\nu} = \mathrm{diag}(-1,1,1,1)\)은 평평한 시공간의 계량이니까, 어떤 점에서도 같은 값——즉 좌표 \(x^\mu\)로 미분하면 영이 되는 거야. 그래서 \(\partial_\mu(\eta^{\mu\nu}\partial_\nu\phi) = \eta^{\mu\nu}\partial_\mu\partial_\nu\phi\)로 미분이 \(\partial_\nu\phi\)에만 작용해. 참고로, C.6에서 다루는 휘어진 시공간에서는 계량 \(g^{\mu\nu}\)가 좌표에 의존하니까, 이 간략화를 할 수 없게 돼.
🔵 카이: 그렇군요, Minkowski 시공간이니까 계량이 상수여서 미분 밖으로 꺼낼 수 있는 거네요.
🟡 리나: 여기서 \(\eta^{\mu\nu}\partial_\mu\partial_\nu\)라는 조합은 제 19 장에서도 등장한 d'Alembert(달랑베르) 연산자 \(\Box\)야. 다시 한번 확인해 둘게. "연산자"란 함수에 작용해서 다른 함수를 돌려주는 조작——여기서는 \(\Box\)가 \(\phi\)에 작용하면, \(\phi\)의 2계 편미분의 특정한 조합을 돌려줘:
여기서 \(x^0 = t\)(자연단위계 \(c = 1\)이므로 \(x^0 = ct\)가 아니라 \(x^0 = t\))로 하고 있어. \(c\)를 복원할 때는 \(x^0 = ct\)로 돌리니까, \(\partial_0 = \frac{\partial}{\partial(ct)} = \frac{1}{c}\frac{\partial}{\partial t}\)가 되어, \(\eta^{00}\partial_0\partial_0 = (-1)\frac{1}{c^2}\frac{\partial^2}{\partial t^2}\)로 \(\Box = -\frac{1}{c^2}\frac{\partial^2}{\partial t^2} + \nabla^2\)가 돼——본편 제 19 장에서는 이 형태로 썼었지. 공간 부분을 합쳐서 \(\nabla^2 = \frac{\partial^2}{\partial x^2} + \frac{\partial^2}{\partial y^2} + \frac{\partial^2}{\partial z^2}\)(라플라시안)이라 쓰면, \(c = 1\) 하에서 \(\Box = -\frac{\partial^2}{\partial t^2} + \nabla^2\)로 간결하게 표현할 수 있어. 이 기호를 쓰면, 위의 결과는 \(-\Box\phi\)로 쓸 수 있어.
단계 4: Euler–Lagrange 방정식에 대입:
🟡 리나: Euler–Lagrange 방정식은 \(\frac{\partial\mathcal{L}}{\partial\phi} - \partial_\mu\!\left(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right) = 0\)이었지. 단계 1에서 \(\frac{\partial\mathcal{L}}{\partial\phi} = -m^2\phi\), 단계 3에서 \(\partial_\mu\!\left(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right) = -\Box\phi\). 대입하면:
두 번째 항이 \(-(-\Box\phi) = +\Box\phi\)가 되는 건, Euler–Lagrange 방정식의 구조가 "제1항 빼기 제2항 \(= 0\)"이기 때문이야.
이것이 Klein–Gordon(클라인-고르돈) 방정식——상대론적 스칼라장의 기본 방정식이야. 참고로, 교과서에 따라서는 \(\Box\)의 부호 규약이 반대(\(\Box = +\partial_t^2 - \nabla^2\))인 것도 있어서, 그 경우에는 \((\Box + m^2)\phi = 0\)으로 쓰여. 다른 책을 읽을 때는 계량의 부호 규약을 확인해 줘.
⚪ 메이: Lagrangian 밀도를 하나 정하는 것만으로, Euler–Lagrange 방정식을 통해 운동방정식이 자동으로 나오는 거네.
🔵 카이: \(m = 0\)이면 \(\Box\phi = 0\)이 되는데……이거 파동방정식이죠? 전개하면 \(-\frac{\partial^2\phi}{\partial t^2} + \nabla^2\phi = 0\)이니까. 그럼 \(m \neq 0\)일 때는, 파동과는 다른 거동을 하나요?
🟡 리나: 좋은 착안점이야. \(m = 0\)이면 광속으로 전파하는 파동의 방정식 그 자체야. 빛(전자기파)의 방정식도 본질적으로 이 형태를 하고 있어. \(m \neq 0\)의 경우는 파동의 분산 관계가 바뀌어서, 다른 파장의 성분이 다른 속도로 전파하게 돼——질량이 파동의 전파에 영향을 미치는 거야. 자세한 건 양자역학편에서 다룰게. 여기까지는 평평한 Minkowski 시공간에서의 이야기였는데, 다음은 휘어진 시공간으로 확장할 거야.
✅ 이해도 체크: 장의 Euler–Lagrange 방정식의 역할을 한마디로 서술해 보세요.
답
장의 작용 \(S = \int \mathcal{L}\,d^4x\)를 극값으로 만드는 장의 배위를 결정하는 방정식. 입자의 운동방정식의 장 이론 버전으로, Lagrangian 밀도 \(\mathcal{L}\)로부터 운동방정식이 도출된다.
📝 연습문제:
- d'Alembert 연산자의 전개 → 문제 B-5. d'Alembert 연산자의 명시적 전개, 현의 파동방정식 도출 → 문제 M-1. 줄의 파동방정식의 Euler–Lagrange 유도, \(\phi^4\) 이론의 운동방정식 → 문제 M-2. \(\phi^4\) 이론의 운동방정식
C.6 휘어진 시공간에서의 장의 작용¶
🟡 리나: 여기까지는 평평한 Minkowski 시공간에서의 이야기였어. 일반상대성이론에서는 시공간이 휘어 있으니까, 작용을 휘어진 시공간용으로 다시 써야 해.
부피 요소의 수정¶
🔵 카이: 뭐가 달라지나요?
🟡 리나: 먼저, 부피 요소가 달라져. 평평한 시공간에서는 \(d^4x\)면 됐지만, 휘어진 시공간에서는 좌표의 잡는 방식에 따라 "같은 좌표 폭이어도 실제 부피가 다르다"는 일이 생겨. 올바른 부피 요소는:
여기서 \(g = \det(g_{\mu\nu})\)는, 계량 텐서의 성분을 \(4 \times 4\) 행렬로 나열했을 때의 행렬식(determinant)이야. 행렬식이란, 행렬이 공간을 얼마나 "늘이고 줄이는지"를 하나의 수로 나타낸 것. \(2\times 2\) 행렬 \(\begin{pmatrix}a & b\\c & d\end{pmatrix}\)라면 행렬식은 \(ad - bc\)로, 이건 2개의 벡터 \((a,c)\)와 \((b,d)\)가 만드는 평행사변형의 부호 있는 넓이와 같아. \(4\times 4\)의 일반적인 계산법은 선형대수에서 배우지만, 여기서 필요한 건 "대각행렬의 행렬식은 대각 성분의 곱"이라는 사실뿐이야. Minkowski 시공간에서 \(\eta_{\mu\nu} = \mathrm{diag}(-1,1,1,1)\)이면 \(g = (-1)\times 1 \times 1 \times 1 = -1\)이니까 \(\sqrt{-g} = \sqrt{1} = 1\)로 원래대로 돌아가. \(\sqrt{-g}\)에서 "\(-g\)"로 한 건, Lorentz 부호의 계량에서는 시간 성분 때문에 \(g < 0\)이 되니까——마이너스를 붙여 \(-g > 0\)으로 만든 다음 제곱근을 취함으로써, 항상 양의 실수가 나오도록 한 거야. 일반적인 계량에서는 비대각 성분도 있으니까 계산은 더 복잡해지지만, 개념으로는 "행렬이 공간을 얼마나 신축시키는지를 나타내는 하나의 수"라고 생각하면 돼.
🔵 카이: 왜 행렬식의 제곱근이 부피의 보정이 되는 건가요?
🟡 리나: 간단한 예로 생각해 봐. 2차원 극좌표 \((r, \theta)\)에서는, 면적 요소가 \(dx\,dy = r\,dr\,d\theta\)지. \(r\)이 클수록 같은 각도 폭 \(d\theta\)여도 호의 길이가 \(r\,d\theta\)로 길어지니까, 면적이 커져——그 보정이 \(r\)이라는 인수야. 일반적인 좌표계에서는 이 보정 인수가 \(\sqrt{|\det(g_{ij})|}\)가 돼. 4차원 Lorentz 부호의 경우는 \(\det(g_{\mu\nu}) < 0\)이니까, \(\sqrt{-g}\)로 쓰는 거야.
⚪ 메이: 즉 \(\sqrt{-g}\)는 극좌표의 \(r\)과 같은 역할——좌표 잡는 방식에 의한 부피의 신축을 보정하는 인수인 거네.
🟡 리나: 이 인수는, 다변수의 좌표 변환에서 부피가 어떻게 신축하는지를 나타내는 양의 일반화가 되어 있어. 수학에서는 이 "좌표 변환에 의한 부피의 신축률"을 Jacobian(야코비안)이라 불러——아까 극좌표 예에서 말하면, \(r\)이 바로 Jacobian에 해당하는 거야.
편미분의 수정¶
🟡 리나: 또 하나. 평평한 시공간에서의 편미분 \(\partial_\mu\)는, 휘어진 시공간에서는 공변미분 \(\nabla_\mu\)로 대체해야 하는 경우가 있어. 왜냐하면, 벡터장이나 텐서장을 보통으로 편미분하면, 좌표 변환했을 때 텐서로서의 변환 법칙을 만족하지 않게 되거든——제 12 장에서 배운 대로지. 직관적으로 말하면, 휘어진 공간에서는 "이웃 점의 벡터"와 "이 점의 벡터"를 단순히 빼기 할 수 없어(기저의 방향이 점마다 바뀌니까). 공변미분은 그 "기저의 회전"을 보정해서, 좌표계에 의존하지 않는 올바른 미분을 해줘. 다만 스칼라장의 경우는 \(\nabla_\mu \phi = \partial_\mu \phi\)이니까, 편미분 그대로 OK야.
🔵 카이: 왜 스칼라장만 특별한 건가요?
🟡 리나: 공변미분이 편미분과 다른 건, Christoffel 기호 \(\Gamma\)——휘어진 공간에서 기저 벡터가 점마다 어떻게 회전하는지를 나타내는 계수——에 의한 보정항이 붙기 때문이었지(제 8 장 참조). 벡터장 \(V^\mu\)라면 \(\nabla_\nu V^\mu = \partial_\nu V^\mu + \Gamma^\mu{}_{\nu\alpha}V^\alpha\)처럼, 기저의 변화를 보정하는 \(\Gamma\) 항이 더해져(제 12 장 참조). 하지만 스칼라장에는 첨자가 없어——즉 \(\Gamma\)가 "잡을" 첨자가 없으니까, 보정항이 영이 되는 거야. 그래서 \(\nabla_\mu\phi = \partial_\mu\phi\).
🔵 카이: 그런데, \(\partial_\mu\phi\)는 첨자가 하나 붙어 있으니까 벡터적인 양이잖아요? 그걸 더 미분할 때는 공변미분이 필요해지지 않나요?
🟡 리나: 날카로운데. 확실히 \(\partial_\mu\phi\)는 공변 벡터이니까, 그걸 더 미분한다면 공변미분이 필요해——실제로 C.4와 같은 변분 절차를 \(\sqrt{-g}\)를 포함한 작용에 대해 행하면, 부분적분할 때 \(\sqrt{-g}\)도 함께 미분되니까, 운동방정식은 \(\frac{1}{\sqrt{-g}}\partial_\mu(\sqrt{-g}\,g^{\mu\nu}\partial_\nu\phi) - m^2\phi = 0\)처럼 \(\sqrt{-g}\)가 얽힌 형태가 돼.
⚪ 메이: 평평한 시공간에서는 안 보이던 \(\sqrt{-g}\)가, 휘어진 시공간에서는 운동방정식에까지 얼굴을 내미는 거네.
🟡 리나: 사실 이 \(\frac{1}{\sqrt{-g}}\partial_\mu(\sqrt{-g}\,g^{\mu\nu}\partial_\nu\phi)\)는, 공변미분을 사용해 쓰면 \(g^{\mu\nu}\nabla_\mu\nabla_\nu\phi\)($ = \nabla^\mu\nabla_\mu\phi$)와 같은 것이야——즉 "스칼라장의 공변미분을 2번 취하는" 조작을 좌표 성분으로 풀어쓴 형태인 거야. 왜 같아지는지 직감만 한마디 해두면, 공변미분 \(\nabla_\mu\)는 편미분 \(\partial_\mu\)에 Christoffel 기호의 보정을 더한 것이었지. 스칼라장에 대해서는 \(\nabla_\mu\phi = \partial_\mu\phi\)이지만, 그걸 다시 공변미분할 때——즉 공변 벡터 \(\partial_\nu\phi\)를 미분할 때——Christoffel 기호가 나타나. 그 Christoffel 기호 안에 \(\sqrt{-g}\)의 미분이 포함되어 있어서, 결과적으로 \(\frac{1}{\sqrt{-g}}\partial_\mu(\sqrt{-g}\,\cdots)\)라는 형태와 일치하게 되는 거야. 자세한 계산은 연습 문제 문제 M-3. 휘어진 시공간의 질량 없는 스칼라장에서 확인해 줘. 평평한 시공간에서는 \(\sqrt{-g} = 1\)(상수)이고 \(g^{\mu\nu} = \eta^{\mu\nu}\)이니까, C.5의 \(\Box\phi - m^2\phi = 0\)으로 돌아가——정합하지. 하지만 지금 단계에서는 Lagrangian 밀도의 내용을 써내리는 것뿐이니까, 거기에 나타나는 \(\partial_\mu\phi\)는 "스칼라장 \(\phi\)의 공변미분 \(\nabla_\mu\phi\)"와 같은 것(\(\nabla_\mu\phi = \partial_\mu\phi\)). 즉 Lagrangian 밀도 \(g^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi)\)는 공변미분으로 써도 편미분으로 써도 같은 식이 돼——그러니 안심하고 \(\partial_\mu\phi\) 그대로 쓸 수 있어. 운동방정식을 도출할 때의 "한 번 더 미분하는" 조작은, 변분원리가 \(\sqrt{-g}\)도 포함해서 올바르게 처리해 줘.
휘어진 시공간에서의 자유 스칼라장의 작용¶
🟡 리나: 이상을 바탕으로, 휘어진 시공간에서의 자유 스칼라장의 작용은:
🔵 카이: \(\eta^{\mu\nu} \to g^{\mu\nu}\)로 바뀌고, \(\sqrt{-g}\)가 붙은 것뿐이네요.
🟡 리나: 맞아. 이 "평평한 시공간의 식에서 \(\eta^{\mu\nu} \to g^{\mu\nu}\), \(d^4x \to \sqrt{-g}\,d^4x\)"라는 치환은 최소 결합(minimal coupling)이라 불리는 처방이야. 물질장을 휘어진 시공간에 올릴 때의 기본적인 방법이야.
📝 연습문제:
- \(\sqrt{-g}\)의 계산(Minkowski) → 문제 B-7. Minkowski 계량의 \(\sqrt{-g}\), \(\sqrt{-g}\)의 계산(Schwarzschild) → 문제 B-8. Schwarzschild 계량의 \(\sqrt{-g}\), 휘어진 시공간에서의 운동방정식 도출 → 문제 M-3. 휘어진 시공간의 질량 없는 스칼라장
C.7 중력장 자체의 작용——Einstein–Hilbert 작용¶
🔵 카이: 물질장의 작용은 알겠는데요……그럼 계량장 \(g_{\mu\nu}\) 자체의 운동방정식도, 같은 방식으로 작용 원리에서 나올 수 있나요?
🟡 리나: 나올 수 있어. 그리고 거기서 나오는 것이 바로 Einstein 방정식이야. 그 작용이 Einstein–Hilbert(아인슈타인-힐베르트) 작용이야:
앞의 계수 \(\frac{1}{16\pi G}\)(\(G\)는 Newton의 만유인력 상수)는, 약한 중력의 극한에서 이 이론이 Newton의 중력 법칙을 올바르게 재현하도록 정해진 규격화 상수야. 그리고 \(R\)은 Ricci(리치) 스칼라 곡률——시공간의 각 점에서 "얼마나 휘어 있는지"를 하나의 수치로 나타내는 스칼라 양이야. 이건 Riemann 텐서로부터 구성돼. Riemann 텐서란 곡률의 완전한 정보를 담은 양으로, 직관적으로는 "벡터를 작은 루프를 따라 평행이동했을 때, 원래 장소로 돌아왔을 때 얼마나 방향이 어긋나는지"를 나타내는 것——평평한 공간이면 어긋남이 영이지만, 휘어진 공간에서는 영이 아니게 돼. 그 Riemann 텐서 \(R^\alpha{}_{\beta\mu\nu}\)는 4개의 첨자를 가져——왼쪽부터 순서대로 제1첨자 \(\alpha\), 제2첨자 \(\beta\), 제3첨자 \(\mu\), 제4첨자 \(\nu\)야. 여기서 정보를 "압축"해 가는 거야.
🔵 카이: 4개나 첨자가 있는 양에서 최종적으로 첨자 없는(스칼라) 것까지 축약해 가는 거군요.
🟡 리나: 먼저, Riemann 텐서 \(R^\sigma{}_{\rho\mu\nu}\)의 제1첨자(위첨자 \(\sigma\))와 제3첨자(아래첨자 \(\mu\))로 축약해——즉, 이 2개의 첨자를 같은 문자로 만들어 합을 취하는 거야. 구체적으로는 더미 첨자로 \(\lambda\)를 써서 \(R^\lambda{}_{\rho\lambda\nu}\)라고 쓰면, \(\lambda\)가 위와 아래에 한 번씩 나타나니까, Einstein의 축약 규칙(부록 B에서 배웠지)에 의해 \(\lambda = 0,1,2,3\)의 합을 취하게 돼——즉 \(R^0{}_{\rho 0\nu} + R^1{}_{\rho 1\nu} + R^2{}_{\rho 2\nu} + R^3{}_{\rho 3\nu}\)라는 4개 항의 합이야. 이렇게 해서 4계 텐서가 2계 텐서로 "축약"돼——얻어진 양이 Ricci 텐서 \(R_{\rho\nu}\)야.
거기서 한 단계 더, 계량을 써서 \(R = g^{\mu\nu}R_{\mu\nu}\)로 축약하면, 2계 텐서가 스칼라(0계 텐서)가 돼——이것이 Ricci 스칼라 \(R\)이야. 자세한 구성은 부록 D의 공식집에 정리해 두었으니, 여기서는 "시공간의 휘어진 정도를 하나의 수치로 재는 스칼라"라고 생각해 줘.
🔵 카이: 엄청 단순하네요……
🟡 리나: 맞아. \(R\)은 Christoffel 기호(계량의 1계 미분으로 만들어짐)를 더 미분해서 구성되니까, 계량의 2계 미분을 포함하고 있어(Riemann 텐서의 성분 표시 \(R^\sigma{}_{\rho\mu\nu} = \partial_\mu\Gamma^\sigma{}_{\nu\rho} - \partial_\nu\Gamma^\sigma{}_{\mu\rho} + \cdots\)를 떠올려 봐——제 13 장 참조). 그리고 휘어진 시공간에서 만들 수 있는 스칼라 양 중에서 계량의 2계 미분까지만 포함하는 것은 \(R\)뿐이야(상수항을 제외하면). "\(R^2\)이나 \(R_{\mu\nu}R^{\mu\nu}\)도 스칼라 아닌가?"라고 생각할 수 있지만, \(R\) 자체가 2계 미분을 포함하니까, 그걸 제곱하면 실질적으로 4계 미분의 정보가 들어가 버려——그래서 "2계 미분까지"라는 조건을 만족하지 않아. 따라서 가장 단순한 중력의 작용은 \(\sqrt{-g}\,R\)을 적분한 것이 되는 거야.
🔵 카이: 왜 "2계 미분까지"로 제한하는 건가요?
🟡 리나: 입자의 Lagrangian \(L(q, \dot{q})\)가 \(q\)와 그 1계 미분 \(\dot{q}\)만을 포함할 때, Euler–Lagrange 방정식은 2계 미분방정식이 됐었지. 마찬가지로 장의 Lagrangian 밀도가 장과 그 1계 미분만을 포함하면 운동방정식은 2계가 돼. 중력의 경우는 Lagrangian 밀도에 계량의 2계 미분(\(R\)에 포함됨)까지 들어가지만, 그래도 운동방정식(Einstein 방정식)은 계량의 2계 미분방정식에 수습돼. 이건 \(R\) 안의 2계 미분 부분이 사실은 전미분(경계항)으로 분리될 수 있어서, 변분에 기여하지 않는다는 기술적 이유 때문이야——C.4의 단계 3에서 "전미분 항은 경계 조건으로 사라진다"고 본 것과 같은 구조야. 자세한 건 본편 제 24 장에서 다루지만, 결론만 기억해 줘. 만약 3계 이상의 미분을 허용하면, 운동방정식이 고계가 되어 물리적으로 불안정한 해가 나타나기 쉬워져——그래서 "2계 미분까지"는 물리적으로 자연스러운 제약이야.
⚪ 메이: 즉 "단순함의 요구"와 "물리적 안정성"이 같은 방향을 향하고 있어서, 결과적으로 \(R\) 하나로 결정되는 거네.
✅ 이해도 체크: Einstein–Hilbert 작용이 \(\sqrt{-g}\,R\)이라는 형태를 취하는 이유를 간결하게 설명해 봅시다.
답
휘어진 시공간에서 구성할 수 있는 스칼라 양 중에서, 계량의 2계 미분까지만 포함하는 것은 Ricci 스칼라 \(R\)(과 상수)뿐이다. 따라서 가장 단순한 중력의 작용은 \(\sqrt{-g}\,R\)을 시공간 전체에서 적분한 것이 된다.
🔵 카이: 이 작용에서 운동방정식을 내려면, 뭘로 변분하는 건가요?
🟡 리나: 역학 변수가 계량장 \(g_{\mu\nu}\)이니까, 그 변분 \(\delta g_{\mu\nu}\)를 생각하는 거야. 다만 실제 계산에서는, 역계량 \(g^{\mu\nu}\)의 변분 \(\delta g^{\mu\nu}\)를 사용하는 쪽이 식이 간결해지는 경우가 많아. \(g_{\mu\nu}\)와 \(g^{\mu\nu}\)는 서로 역행렬 관계로 묶여 있으니까, 한쪽의 변분을 정하면 다른 쪽도 결정돼——어느 쪽으로 변분해도 같은 물리가 나와. \(\delta S_{\text{EH}} = 0\)으로 하면, 진공의 Einstein 방정식 \(G_{\mu\nu} = 0\)이 도출돼. 여기서 \(G_{\mu\nu} = R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R\)은 Einstein 텐서——Ricci 텐서와 Ricci 스칼라로 구성되는 양으로, 시공간의 휘어진 방식을 기술해. \(-\frac{1}{2}g_{\mu\nu}R\)이라는 항은 작용의 변분 계산에서 자연스럽게 나오는데, 그 결과가 에너지 보존법칙(\(\nabla_\mu T^{\mu\nu} = 0\))과 자동적으로 정합하는 건 Bianchi 항등식(\(\nabla_\mu G^{\mu\nu} = 0\)) 덕분이야——제 13 장과 제 15 장에서 배웠지.
🔵 카이: 그런데 역행렬의 변분이라니, \(\delta g^{\mu\nu}\)와 \(\delta g_{\mu\nu}\)는 어떤 관계인 건가요? 게다가 \(\sqrt{-g}\)나 \(R\)을 \(g^{\mu\nu}\)로 변분하는 건 엄청 힘들 것 같은데……
🟡 리나: 확실히 계산은 무거워. \(\delta g^{\mu\nu}\)와 \(\delta g_{\mu\nu}\)의 관계만 답해 둘게. \(g^{\mu\alpha}g_{\alpha\nu} = \delta^\mu_\nu\)(역행렬의 정의)의 양변을 변분하면, 우변의 \(\delta^\mu_\nu\)는 상수이니까 변분 영. 좌변은 곱의 법칙으로 \(\delta g^{\mu\alpha} \cdot g_{\alpha\nu} + g^{\mu\alpha} \cdot \delta g_{\alpha\nu} = 0\). 여기서 \(\delta g^{\mu\alpha}\)에 대해 풀면 \(\delta g^{\mu\nu} = -g^{\mu\alpha}g^{\nu\beta}\delta g_{\alpha\beta}\)가 나와——역행렬의 미분 공식의 일반화지. \(\sqrt{-g}\)나 \(R\)의 변분은 본편 제 24 장에서 한 단계씩 도출하니까, 여기서는 정신만 잡아 둬. 그 정신은 C.4의 Euler–Lagrange 방정식과 완전히 같아——장 \(\phi\) 대신 계량 \(g^{\mu\nu}\)가 역학 변수가 되어 있을 뿐이야.
⚪ 메이: 그렇구나. C.4에서는 \(\delta\phi\)의 계수를 영으로 놓아 Euler–Lagrange 방정식을 얻었어. 여기서도 마찬가지로 \(\delta g^{\mu\nu}\)의 계수를 영으로 놓으면 Einstein 방정식이 나오는 거지——역학 변수가 무엇이든, 변분원리의 논리 구조는 같은 거네.
🟡 리나: 맞아. 아까의 \(G_{\mu\nu} = 0\)은 중력만(진공)의 경우야. 현실의 우주에는 물질이 있으니까, 물질장의 작용 \(S_m\)도 더한 전체 작용
을 \(g^{\mu\nu}\)로 변분하면, 완전한 Einstein 방정식 \(G_{\mu\nu} = 8\pi G\, T_{\mu\nu}\)가 얻어져. 에너지-운동량 텐서 \(T_{\mu\nu}\)는 물질의 작용 \(S_m\)을 계량 \(g^{\mu\nu}\)로 "미분"한 것——정확히는 범함수 미분한 것——으로 정의돼.
🔵 카이: 범함수 미분? 보통 미분과는 다른 건가요?
🟡 리나: 보통의 편미분은 "유한 개의 변수 \(x_1, x_2, \ldots\) 중 하나를 조금 움직였을 때의 변화율"이지. 하지만 작용 \(S\)의 "변수"는 \(g^{\mu\nu}(x)\)라는 함수 그 자체——시공간 각 점에서의 값이라는 무한 개의 자유도를 갖고 있어. 그래서 "함수로 미분하는" 도구가 필요한 거야. 그게 범함수 미분이야.
먼저 "범함수"에 대해 한마디. 보통 함수는 수치를 입력하여 수치를 돌려주지만, 작용 \(S\)는 장 \(\phi(x)\)라는 함수 전체를 입력으로 받아 하나의 수치를 돌려줘. 이런 "함수에서 수치로의 대응"을 범함수(functional)라고 불러. \(S[\phi]\)라고 대괄호로 쓰는 게 그 표시야.
🔵 카이: 아, 그래서 작용을 \(S[\phi]\)라고 대괄호로 썼던 거군요! 보통 함수 \(f(x)\)와 구별하려고.
🟡 리나: 그리고 범함수 미분은, "작용 \(S_m\)이 \(g^{\mu\nu}(x)\)의 미소 변화 \(\delta g^{\mu\nu}(x)\)에 대해 얼마나 변하는지"를 나타내는 양이야. 구체적으로는, 작용의 변분이
로 쓸 수 있을 때, 그 계수 \(\frac{\delta S_m}{\delta g^{\mu\nu}(x)}\)가 범함수 미분이야. 여기서 \(\mu, \nu\)는 자유 첨자——합을 취하지 않고, 각 \((\mu,\nu)\) 조합(총 10개의 독립 성분)에 대해 1개씩 식이 성립하고 있어. "어? \(\mu\nu\)가 2번 나타나는데 합을 안 취하나요?"라고 생각할 수 있지만, 분모의 \(g^{\mu\nu}\)는 "무엇으로 미분하는지"를 지정하는 기호이지 텐서의 첨자가 아니니까 축약 규칙의 대상이 아니야. 기호가 보통 미분의 \(\frac{\partial}{\ }\)가 아니라 \(\frac{\delta}{\ }\)인 건, "함수로 미분한다"는 특수한 연산임을 구별하기 위해서야.
🟡 리나: 사실 C.4에서 이미 하고 있던 것 그 자체야. 그때 \(\delta S = \int[\cdots]\delta\phi\,d^4x\)로 써서, \(\delta\phi\)의 계수를 영으로 놓았잖아? 그 괄호 안의 내용 \(\frac{\partial\mathcal{L}}{\partial\phi} - \partial_\mu\left(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right)\)가 바로 \(\frac{\delta S}{\delta\phi(x)}\)에 다름 아닌 거야. 즉 범함수 미분은 새로운 계산법이라기보다, C.4에서 한 "변분해서 계수를 읽어내는" 조작에 이름을 붙인 거야.
⚪ 메이: 그렇구나, C.4의 절차가 그대로 범함수 미분의 정의가 되어 있었던 거네.
🔵 카이: 그렇군요……그런데 한 가지 궁금한 건, C.4에서는 \(\delta\phi\)가 "임의의 함수"였으니까 계수를 영으로 할 수 있었잖아요. \(\delta g^{\mu\nu}\)의 경우에도 정말 "임의"라고 말할 수 있나요? 계량은 대칭성이나 구속이 있을 것 같은데.
🟡 리나: 좋은 질문이야. \(g^{\mu\nu}\)는 대칭 텐서이니까 \(\delta g^{\mu\nu}\)도 대칭(\(\delta g^{\mu\nu} = \delta g^{\nu\mu}\))이라는 구속은 있어. 하지만 그 구속 범위 안에서 "임의의 대칭 변분"을 생각하면, 같은 논법으로 계수를 영으로 할 수 있어. 포인트는, \(\delta S = \int (\text{무언가})_{\mu\nu}\,\delta g^{\mu\nu}\,d^4x = 0\)에서 \(\delta g^{\mu\nu}\)가 대칭이면, 계수의 대칭 부분만이 영이 되어야 한다는 거야——즉 \((\text{무언가})_{\mu\nu} + (\text{무언가})_{\nu\mu} = 0\)이 요구돼. 결과로 나오는 Einstein 텐서 \(G_{\mu\nu}\)는 처음부터 대칭(\(G_{\mu\nu} = G_{\nu\mu}\))이니까, 이 조건은 \(G_{\mu\nu} = 0\)과 동치가 돼——정합성이 유지되는 거야.
⚪ 메이: 즉, 변분의 대칭성과 방정식의 대칭성이 제대로 맞아떨어지는 거네.
🟡 리나: 자, 에너지-운동량 텐서는 이 범함수 미분을 사용해서:
로 정의돼.
🔵 카이: \(\sqrt{-g}\)로 나누거나 \(2\)를 곱하거나 마이너스가 붙거나……이 계수들에 각각 의미가 있나요?
🟡 리나: 있어. 하나씩 설명할게. 먼저 \(\sqrt{-g}\)로 나누는 이유——C.6에서 봤듯이 \(\sqrt{-g}\,d^4x\)가 좌표에 의존하지 않는 "진짜 부피 요소"였어. \(S_m\)의 피적분 함수에는 \(\sqrt{-g}\)가 포함되어 있으니까, \(\frac{\delta S_m}{\delta g^{\mu\nu}}\)에는 \(\sqrt{-g}\) 인수가 남아. 그걸 \(\sqrt{-g}\)로 나눔으로써, \(T_{\mu\nu}\)가 "진짜 부피당 양"——즉 좌표 변환에서 올바르게 텐서로 변환되는 양——이 되는 거야.
🔵 카이: 그렇군요, \(\sqrt{-g}\)로 나누는 건 "좌표에 의존하지 않는 밀도"로 만들기 위해서군요.
🟡 리나: 다음으로 계수 \(2\)——이건 \(g^{\mu\nu}\)가 대칭 텐서(\(g^{\mu\nu} = g^{\nu\mu}\))인 것에서 유래하는 규약으로, 이렇게 정의해 두면 Einstein 방정식이 \(G_{\mu\nu} = 8\pi G\,T_{\mu\nu}\)라는 깔끔한 형태가 돼. 마지막으로 부호의 마이너스——이건 계량의 부호 규약 \((-,+,+,+)\) 하에서 \(T_{00}\)(에너지 밀도)이 양의 값이 되도록 조정한 거야. 요컨대, \(T_{\mu\nu}\)는 "물질의 작용을 계량으로 변분했을 때의 응답"——Lagrangian으로부터 자동적으로 얻어지는 거야. 구체적으로 C.5의 자유 스칼라장에서 \(T_{\mu\nu}\)를 계산하는 연습은 연습 문제(문제 M-4. 에너지-운동량 텐서의 도출)에서 다루니까, 꼭 직접 손을 움직여 봐.
🔵 카이: Lagrangian 하나를 쓰면, 운동방정식도 에너지-운동량 텐서도 전부 나오는구나……그런데 반대로 말하면, Lagrangian의 형태를 잘못 쓰면 전부 어긋난다는 거잖아요? 애초에 "올바른 Lagrangian"은 어떻게 정하는 건가요? 아무거나 되는 건 아니잖아요?
🟡 리나: 좋은 질문이야. 사실 "대칭성"이 강력한 구속을 주는 거야. 좌표 변환에 대해 작용이 불변인 것, 계량의 2계 미분까지만 포함하는 것——이런 조건을 부과하면, 선택지는 거의 좁혀져. 본편 제 24 장에서 "작용 원리의 3가지 요청"으로서 체계적으로 논의했었지. 이게 작용 원리의 위력이야. 좌표계에 의존하지 않는 형태로 물리법칙을 기술할 수 있고, 게다가 모든 방정식이 하나의 원리로부터 통일적으로 도출돼. 일반상대성이론처럼 "좌표계에 특권이 없는" 모델에 있어서 이보다 좋은 도구는 없어.
📝 연습문제:
- 에너지-운동량 텐서의 도출 → 문제 M-4. 에너지-운동량 텐서의 도출, 우주 상수와 수정 Einstein 방정식 → 문제 A-2. 우주 상수를 포함한 Einstein 방정식, Maxwell 방정식의 Lagrangian으로부터의 도출(발전 문제:전자기장의 Lagrangian 밀도 \(\mathcal{L}_{\text{EM}} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu}\)에서 출발) → 문제 A-1. 전자기장 Lagrangian으로부터의 Maxwell 방정식
C.8 여러 개의 장이 있는 경우¶
🟡 리나: 마지막으로, 여러 개의 장이 있는 경우에 대해 보충해 둘게. 현실의 우주에는 계량장뿐만 아니라, 전자기장이나 물질장이 공존하고 있어. 그 경우 전체 작용은:
처럼, 각 장의 기여와 상호작용의 합이 돼.
⚪ 메이: 그러면, 각 장에 대해 독립적으로 변분하면, 각각의 운동방정식이 나오는 건가?
🟡 리나: 맞아. \(g_{\mu\nu}\)로 변분하면 Einstein 방정식, \(\phi\)로 변분하면 Klein–Gordon 방정식, \(A_\mu\)로 변분하면 Maxwell 방정식——모두가 같은 작용 원리에서 나와.
🔵 카이: 하나의 작용 \(S\)에서 전부 나온다는 건 대단하지만……이 틀에 한계는 없나요? 예를 들어 양자역학과는 양립하나요?
🟡 리나: 좋은 질문이야. 사실 중력을 양자화하려 하면 이 틀에 심각한 곤란이 생겨. 그건 「양자중력 문제에의 도전」편에서 다루는 주제야.
🔵 카이: 그럼 이 이론에도 한계가 있는 거군요. 만약 한계가 있다면, 뭘 바꾸게 되는 건가요? 작용 원리 자체가 쓸 수 없게 되는 건지, 아니면 작용의 내용을 고쳐 쓰는 건지……
🟡 리나: 좋은 물음이야. 사실 어느 쪽 가능성도 연구되고 있어——작용 원리라는 "틀"은 유지하면서 내용물인 Lagrangian을 수정하는 방향과, 틀 자체를 근본부터 바꾸는 방향과. 다만 현 시점에서는 이 틀은 실험으로 반증되지 않은 최선의 가설이야. 그 예측 정밀도와 아름다움은, 인류가 손에 넣은 지적 도구 중에서도 최고봉이라고 생각해.
⚪ 메이: 즉, 어느 방향도 있을 수 있지만, 현재로서는 작용 원리가 살아남아 있다는 거네.
🔵 카이: 그렇구나……대칭성으로 형태가 결정된다는 건 아름답네요. 그런데 그건, 만약 미래에 더 정밀한 실험에서 Einstein 방정식으로부터의 어긋남이 발견되면, Lagrangian을 수정해야 한다는 뜻인가요?
🟡 리나: 맞아. 대칭성이나 간결함으로 후보를 크게 좁힐 수는 있지만, 최종적으로는 실험·관측과의 정합성이 판정 기준이 돼. 자연이 어떤 Lagrangian을 "선택하고 있는지"는 실험에 물어볼 수밖에 없어——그게 물리학의 본질적인 자세야.
🟡 리나: 이 장 전체를 돌아보면——Lagrangian 밀도 \(\mathcal{L}\)을 하나 정하면, 변분원리로부터 운동방정식이 나와. 물질장이면 Euler–Lagrange 방정식, 중력장이면 Einstein 방정식. C.8에서 봤듯이 여러 장이 있어도, 전체 작용을 각 장으로 변분하는 것뿐이야. "하나의 원리로부터 모든 것을 도출하는" 틀이지.
⚪ 메이: 입자의 작용 원리에서 시작해서, 장 이론, 휘어진 시공간, Einstein 방정식까지——전부가 같은 변분의 발상으로 연결되어 있는 구조가 보이기 시작했어.
🔵 카이: 확실히 하나의 원리로 전부 연결되어 있는 건 아름답다. ……하지만 역으로 말하면, 이 "실"이 양자중력에서 끊어질지도 모른다는 거잖아요.
🟡 리나: 그 "궁금함"을 소중히 해. 적어도 이 장에서 배운 "Lagrangian을 쓰고 변분한다"는 절차는, 양자장론의 경로적분에서도 중심적인 역할을 하고 있어. 그러니 작용 원리의 발상 자체는 양자 세계에서도 살아남아 있어——다만 중력을 양자화하려 하면 새로운 곤란이 나타나는 거야. 그건 「양자중력 문제에의 도전」편의 주제야.
다음 장 예고¶
부록 D 에서는, 본편에서 등장한 대표적인 시공간——Schwarzschild, 일반 구대칭, FRW 우주 모델, Minkowski——의 계량·Christoffel 기호·Riemann 텐서·Ricci 텐서·Ricci 스칼라를 공식집으로서 일람 정리한다. 처음부터 직접 계산하는 수고를 덜고, 계산 결과의 검산이나 문제 풀이의 "사전"으로서 반복 참조할 수 있는 실용적인 부록이다.
참고문헌¶
- D. Tong, Lectures on General Relativity, Chapter 2: The Principle of Least Action (Cambridge, 2019).
- T. Lancaster & S. J. Blundell, Quantum Field Theory for the Gifted Amateur, Chapter 11: Lagrangian Field Theory (Oxford University Press, 2014).
- S. Carroll, Spacetime and Geometry, Chapter 4: Gravitation (Cambridge University Press, 2019).
- L. D. Landau & E. M. Lifshitz, The Classical Theory of Fields, 4th ed., Chapter 2 (Butterworth-Heinemann, 1975).
Feedback on this page
Let us know if something was unclear, incorrect, or could be improved.
