콘텐츠로 이동

제4장 민코프스키 시공의 수학 — 계량·4원벡터·텐서

지난 이야기: 제 3 장에서, 상대성 원리와 광속 불변의 원리로부터 시공간격 \(ds^2 = -(cdt)^2 + dx^2 + dy^2 + dz^2\) 을 이끌어내고, \(ds^2\) 을 보존하는 좌표변환으로서 로렌츠 변환을 얻었다. 거기서 동시성의 상대성·시간 지연·길이 수축이라는 물리적 결과를 이끌어내어, 특수상대론의 「물리」는 한 통 조립이 끝났다. 그러나 일반상대론으로 나아가려면, 이 물리를 좌표계에 의존하지 않는 형태의 수식으로 다시 써야 한다.

이 장의 목표

  • 제 3 장에서 얻은 특수상대론의 물리를, 일반상대론으로 나아가기 위한 수학의 언어로 정비한다
  • 구체적으로는, 자연단위계(\(c = 1\)), 첨자 표기법과 아인슈타인 축약 규칙, 민코프스키 계량 \(\eta_{\mu\nu}\), 4원벡터(반변·공변), 그리고 텐서의 초보까지를 갖춘다
  • 이로써 「휘어진 시공」을 다룰 준비가 완료된다

4.1 민코프스키 시공과 계량 텐서

🟡 리나: 제 3 장의 섹션 3 첫머리에서 「1계 텐서(4원벡터)는 나중으로 미루겠다」고 말했었지. 로렌츠 변환과 그 물리적 결과를 먼저 정리했으니, 이제 텐서 계층의 계속——1계 텐서(4원벡터)와 2계 텐서(계량 \(\eta_{\mu\nu}\))——로 나아가자. 우선 준비로, 자연단위계와 첨자 표기법을 도입할게. 그 전에, 민코프스키 시공의 전체 모습을 그림 4.1「민코프스키 시공의 광원뿔」에서 확인해 두자.

민코프스키 시공의 광원뿔

그림 4.1: 민코프스키 시공의 광원뿔. 각 사건에서 보았을 때, 광선이 이루는 원뿔의 내부가 미래·과거(시간적으로 연결 가능), 외부가 공간적(인과적으로 분리). \(ds^2 = -(c\,dt)^2 + dx^2 + dy^2 + dz^2\)(이 장에서는 \(c = 1\)로 하여 \(ds^2 = -dt^2 + dx^2 + dy^2 + dz^2\))의 부호로 영역이 결정된다(\(< 0\):시간적, \(= 0\):광적, \(> 0\):공간적). 파란 선은 물질 입자의 세계선(반드시 광원뿔 내부에 들어간다).

🔵 카이: 그림 4.1「민코프스키 시공의 광원뿔」을 보면, 광원뿔 안쪽이 「인과적으로 연결 가능」이고, 바깥쪽은 「인과적으로 분리」……즉 빛보다 빠르게 정보가 전달되지 않으니까, 광원뿔 밖의 사건에는 영향을 미칠 수 없다는 거죠.

🟡 리나: 맞아. 그리고 물질 입자의 세계선(그림의 파란 선)은 반드시 광원뿔 내부에 들어간다——광속을 초과할 수 없으니까. \(ds^2\)의 부호가 이 구조를 수학적으로 표현하고 있어——\(ds^2 < 0\)이면 시간적(광원뿔 안쪽), \(ds^2 = 0\)이면 광적(광원뿔 표면), \(ds^2 > 0\)이면 공간적(광원뿔 바깥쪽).

\(c = 1\) 단위계(자연단위계)

🟡 리나: 여기서부터는, 수식을 보기 쉽게 하기 위해 \(c = 1\) 단위계를 사용할 거야. 이것은 「자연단위계 (natural units)」라고 불리는 단위계의 일종으로, 광속 \(c\)를 1로 놓아서 시간과 공간을 같은 단위로 다루는 방식이야.

🔵 카이: 광속을 1로 놓는다는 게, 어떤 뜻인가요?

🟡 리나: 시간을 「미터」로 측정하는 거야. 「1미터의 시간」이란, 빛이 1미터를 나아가는 데 걸리는 시간——즉 \(1/c \approx 3.3\) 나노초를 말해. 그러면

\[ c = \frac{1\;\text{m}}{1\;\text{m의 시간}} = 1 \]

반대로, 시간을 초로 측정하고, 길이를 「광초」(빛이 1초에 나아가는 거리 \(\approx 3 \times 10^8\) m)로 측정해도 \(c = 1\)이 돼. 요컨대 시간과 길이를 같은 단위로 측정한다는 것이야.

⚪ 메이: 구체적으로 어떻게 다시 쓰이는 거야?

✅ 이해도 체크: 자연단위계(\(c = 1\))란 어떤 단위계인가요? 또한, 그 장점은 무엇인가요?

광속 \(c\)를 1로 놓아서, 시간과 공간을 같은 단위로 다루는 단위계. 수식에서 \(c\)의 인자가 사라져서 간단해지고, 「\(c\)를 어디에 넣어야 하는지 고민하지 않아도 된다」는 것이 장점. SI 단위로 돌아가고 싶을 때는 차원 분석으로 \(c\)를 복원하면 된다.

🟡 리나: 몇 가지 나열해 볼게.

표 4.1: SI 단위계와 자연단위계에서의 물리식 비교

SI 단위 자연단위계(\(c=1\))
\(E = mc^2\) \(E = m\)
\(\tau = t\sqrt{1 - v^2/c^2}\) \(\tau = t\sqrt{1 - v^2}\)
\(\gamma = 1/\sqrt{1 - v^2/c^2}\) \(\gamma = 1/\sqrt{1 - v^2}\)
\(ds^2 = -c^2 dt^2 + dx^2 + dy^2 + dz^2\) \(ds^2 = -dt^2 + dx^2 + dy^2 + dz^2\)
\(v/c\)(무차원 속도) \(v\)(광속을 단위로 하는 속도, \(0 \le v \le 1\))

🔵 카이: 에너지와 질량이 같은 양이 되는 건가요?

🟡 리나: 맞아. 질량 \(m\) kg의 정지에너지는 \(E = mc^2\) 줄이지만, 자연단위계에서는 단순히 \(E = m\). 질량도 에너지도 같은 단위(예를 들어 kg, 또는 eV)로 측정할 수 있다고 생각하면 돼.

💡 익숙해질 때까지의 팁: 「질량을 kg으로 측정하고, 에너지도 kg으로 측정한다」고 하면 처음에는 혼란스러울 수 있어. 하지만 「에너지와 질량은 본질적으로 같은 것(\(E=mc^2\)로 교환 가능)」이라는 관점에서 보면 자연스러운 선택이야. 입자물리에서는, 반대로 질량도 에너지도 eV로 측정하는 것이 보통인데, 예를 들어 「전자의 질량은 511 keV」라고 써(정확히는 \(511\ \mathrm{keV}/c^2\)이지만, 자연단위계에서는 \(c\)를 생략해). 상대론 계산에서는 「단위를 신경 쓰지 않아도 된다」는 것이 최대의 장점이야.

⚪ 메이: 즉, SI 단위로 돌아가고 싶을 때는 차원 분석으로 \(c\)를 복원하면 되는 거네.

🟡 리나: 맞아. 예를 들어 \(E = m\)이라면, 에너지의 차원 \([\text{kg}\cdot\text{m}^2/\text{s}^2]\)과 질량의 차원 \([\text{kg}]\)을 맞추기 위해 \(c^2\)(차원 \([\text{m}^2/\text{s}^2]\))를 곱해서 \(E = mc^2\)으로 되돌려. 자연단위계는 「\(c\)를 어디에 넣어야 할지 고민하지 않아도 된다」는 것이 장점이야. 식을 쓸 때는 \(c = 1\)로 간단하게 쓰고, 마지막에 SI 단위에서의 수치가 필요하면 차원 분석으로 \(c\)를 복원해. 상대론 계산에서는 이 방식이 표준적이야.

관련되는 단위계

  • 자연단위계 (natural units): \(c = 1\). 상대론에서 사용. 이 장에서 채택.
  • 기하학적 단위계 (geometrized units): \(G = c = 1\). 뉴턴의 만유인력 상수도 1로 놓는다. 일반상대론에서는 제 8 장 이후에 사용하는 경우가 많다.
  • 플랑크 단위계 (Planck units): \(G = c = \hbar = 1\). 양자중력에서 사용(제 25 장에서 등장).
  • 입자물리의 자연단위계: \(\hbar = c = 1\). 양자역학·장의 양자론에서 사용.

이 책에서는 각 장 첫머리에 「이 장의 단위계」를 명시하므로, 혼동하지 않도록 주의해.

🟡 리나: 자연단위계에서는 로렌츠 변환이

\[ t' = \gamma(t - vx), \qquad x' = \gamma(x - vt) \]

으로 깔끔하게 쓸 수 있어. 시공간격도

\[ ds^2 = -dt^2 + dx^2 + dy^2 + dz^2 \]

이후의 장에서는, 특별히 언급하지 않는 한 자연단위계(\(c = 1\))를 사용할 거야. 필요에 따라 기하학적 단위계(\(G = c = 1\))로 전환하는 경우도 있으니, 각 장 첫머리의 「이 장의 단위계」를 확인해.

📝 연습문제:

좌표의 번호 매기기

🟡 리나: 여기서, 4개의 좌표를 한꺼번에 다루는 표기법을 도입할게.

\[ x^0 = t, \quad x^1 = x, \quad x^2 = y, \quad x^3 = z \]

위 첨자의 숫자는 거듭제곱이 아니라 첨자 (index)야. 4개의 좌표를 합쳐서 \(x^\mu\)(\(\mu = 0, 1, 2, 3\))라고 써. 왜 위 첨자냐 하면, 나중에 배우겠지만, 첨자에는 「위 첨자」와 「아래 첨자」의 2종류가 있어서 각각 변환되는 방식이 달라. 좌표의 미소 변위 \(dx^\mu\)는 로렌츠 변환에서 \(\Lambda\)를 곱해서 변환되는 양으로, 이런 양을 「반변벡터」라고 부르며, 위 첨자로 쓰는 약속으로 되어 있어——그래서 좌표는 위 첨자가 자연스러운 위치인 거야. 「반변벡터」의 정확한 의미는 섹션 2에서 정의하니까, 지금은 「좌표는 위 첨자로 쓴다」는 약속만 기억해 둬.

🔵 카이: \(x^2\)이 「\(x\)의 제곱」인지 「\(y\) 좌표」인지, 헷갈리지 않나요?

🟡 리나: 처음에는 헷갈리지만, 문맥으로 구별할 수 있게 돼. 구분하는 팁을 알려줄게——첨자로 사용할 때는, \(x^\mu\)처럼 그리스 문자 \(\mu, \nu, \alpha, \beta, \ldots\)가 붙어 있는 것이 표시야. 숫자가 직접 붙어 있는 경우(\(x^2\) 등)는, 전후 문맥에서 「좌표 성분을 나열하고 있다」면 첨자, 「계산 도중」이면 거듭제곱. 이 책에서는, 거듭제곱과 헷갈리는 경우 \((x)^2\)이나 \(x^2\)(기울임꼴 없음)처럼 구분해서 쓰기도 할 거야.

표기법의 약속: - 그리스 문자 첨자(\(\mu, \nu, \alpha, \beta, \ldots\))는 \(0, 1, 2, 3\)을 달리며, 시공의 전체 4성분을 가리킨다 - 라틴 문자 첨자(\(i, j, k, \ldots\))는 \(1, 2, 3\)을 달리며, 공간의 3성분만을 가리킨다

아인슈타인 축약 규칙

🟡 리나: 첨자 표기법을 도입한 김에, 일반상대론을 배우는 데 있어 가장 중요한 표기법의 약속을 소개할게.

아인슈타인 축약 규칙 (Einstein summation convention): 하나의 항 안에서, 같은 첨자가 위와 아래에 하나씩 나타나면, 그 첨자에 대해 0부터 3까지 합을 취한다. 합의 기호 \(\sum\)는 생략한다.

🔵 카이: 구체적으로 어떻게 되는 건가요?

🟡 리나: 먼저 가장 간단한 예부터. 4원벡터 \(A^\mu = (A^0, A^1, A^2, A^3)\)이 있을 때, \(A^\mu\)의 첨자 \(\mu\)에 구체적인 값을 넣으면 각 성분이 나와. 그럼, \(A^\mu\)(위 첨자)와 다른 양 \(B_\mu\)(아래 첨자)를 곱해서 \(A^\mu B_\mu\)라고 쓰면? 여기서 \(B_\mu\)의 첨자가 아래 첨자로 되어 있는 것에 주목했지. \(B_\mu\)의 정확한 정의는 섹션 3에서 도입하지만, 지금은 「위 첨자와는 다른 종류의 4성분의 양으로, 역시 4개의 수의 조 \((B_0, B_1, B_2, B_3)\)」라고만 생각해 둬——예를 들어 \(B_\mu = (5, 2, 0, 3)\)처럼, 구체적인 수가 4개 나열되어 있을 뿐이라고 생각하면 OK. 왜 위 첨자와 아래 첨자를 구별하는지는 나중에 알게 되니까, 지금 단계에서는 「위와 아래에 같은 첨자가 나오면 합을 취한다」는 규칙만 기억해 둬. 실제로 전개해 보면, \(\mu\)가 위(\(A^\mu\))와 아래(\(B_\mu\))에 하나씩 나타나고 있으니, \(\mu = 0, 1, 2, 3\)을 대입해서 더해:

\[ A^\mu B_\mu = A^0 B_0 + A^1 B_1 + A^2 B_2 + A^3 B_3 \]

4개 항의 합. \(\sum\)을 쓰지 않아도, 첨자의 위치만으로 「더한다」는 것을 알 수 있지?

🔵 카이: 오, \(\sum_{\mu=0}^{3}\)을 생략하고 있을 뿐이군요.

🟡 리나: 맞아. 또 하나 예를 봐보자. 로렌츠 변환을 첨자 표기법으로 쓰면 \(x^{\mu'} = \Lambda^{\mu'}{}_{\nu}\,x^\nu\)가 돼. 여기서 \(x^{\mu'}\)는 변환 후의 관성계 \(S'\)의 좌표로, 첨자에 프라임(\('\))을 붙여서 「\(S'\)계의 양」임을 나타내고 있어. \(x^\nu\)는 원래 관성계 \(S\)의 좌표. \(\Lambda^{\mu'}{}_{\nu}\)는 변환 행렬의 \(\mu'\)\(\nu\)열의 성분——위 첨자의 \(\mu'\)가 「변환 후(\(S'\)계)의 성분 번호」, 아래 첨자의 \(\nu\)가 「변환 전(\(S\)계)의 성분 번호」를 나타내고 있어. \(\nu\)가 위(\(x^\nu\))와 아래(\(\Lambda^{\mu'}{}_{\nu}\))에 하나씩 나타나고 있으니, 축약 규칙으로 합을 취해:

\[ x^{\mu'} = \Lambda^{\mu'}{}_{\nu}\,x^\nu = \Lambda^{\mu'}{}_{0}\,x^0 + \Lambda^{\mu'}{}_{1}\,x^1 + \Lambda^{\mu'}{}_{2}\,x^2 + \Lambda^{\mu'}{}_{3}\,x^3 \]

⚪ 메이: 둘 다, 첨자 하나에 대해 4항의 합을 취한다——같은 패턴이네.

🟡 리나: 맞아. 그리고 이 「성분을 하나씩 곱해서 더하는」 구조는, 고등학교에서 배운 내적과 같은 형태야. 첨자 하나의 축약은, 본질적으로 내적과 같은 연산인 거야.

🔵 카이: 내적의 일반화 같은 건가요.

🟡 리나: 맞아. 그럼 다음으로, 첨자가 2개인 양——계량 텐서 \(\eta_{\mu\nu}\)——을 사용해서 시공간격을 다시 써보자.

✅ 이해도 체크: 아인슈타인 축약 규칙이란 무엇인가요?

하나의 항 안에서 같은 첨자가 위와 아래에 하나씩 나타나면, 그 첨자에 대해 0부터 3까지 합을 취한다. 합의 기호 \(\sum\)는 생략한다.

용어 정리: 축약 규칙으로 합을 취하는 첨자(같은 문자가 위아래에 나타나는 첨자)를 더미 첨자 (dummy index)라고 부른다. 더미 첨자는 어떤 문자를 사용해도 결과가 같다. 예를 들어 \(A^\mu B_\mu = A^\nu B_\nu\). 한편, 합을 취하지 않는 첨자를 자유 첨자 (free index)라고 부른다.

민코프스키 계량 \(\eta_{\mu\nu}\)

🟡 리나: 다음은, 시공간격을 첨자 표기법으로 다시 쓰고 싶어. \(ds^2 = -dt^2 + dx^2 + dy^2 + dz^2\)에는 4개의 좌표의 미소 변위가 들어 있지만, 이것을 \(ds^2 = \eta_{\mu\nu}\,dx^\mu\,dx^\nu\)로 한 번에 쓸 수 있다면, 좌표가 몇 개든 같은 형태로 다룰 수 있어. 그러기 위해 필요한 것이 「계량」(metric)이라는 개념이야. 먼저 직감을 잡아보자.

🔵 카이: 계량이 뭔가요?

🟡 리나: 한마디로 말하면 「」——공간(이나 시공) 안에서 「두 점 사이의 거리를 어떻게 측정하는가」의 규칙을 알려주는 도구야. 3가지 예로 단계적으로 봐보자. 먼저 전체 모습을 그림 4.2「계량의 3가지 예. 왼쪽: 평면(계량은 상수 \(\mathrm{diag}(1,1)\)). 가운데: 구면(계량이 좌표 \(\theta\)의 함수」에 정리해 둘게.

계량의 3가지 예

그림 4.2: 계량의 3가지 예. 왼쪽: 평면(계량은 상수 \(\mathrm{diag}(1,1)\)). 가운데: 구면(계량이 좌표 \(\theta\)의 함수 — 장소에 따라 「자의 눈금」이 변한다). 오른쪽: 시공(시간 항에 마이너스 부호가 붙어, 유클리드 기하와는 다른 구조를 가진다).

예 1: 평평한 종이 위

보통의 평면에서는, 두 점 사이의 거리는 피타고라스 정리로 결정된다:

\[ d\ell^2 = dx^2 + dy^2 \]

이 「\(dx^2\) 앞에 1, \(dy^2\) 앞에 1, 교차항 없음」이라는 정보가, 평면의 계량. 행렬로 쓰면

\[ g_{ij} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} \]

단위행렬——이것이 「평평한 공간」의 계량이야.

예 2: 지구의 표면(휘어진 면)

🟡 리나: 다음으로, 지구의 표면을 생각해 봐(그림 4.2「계량의 3가지 예. 왼쪽: 평면(계량은 상수 \(\mathrm{diag}(1,1)\)). 가운데: 구면(계량이 좌표 \(\theta\)의 함수」의 가운데). 지구 위의 위치를 지정하는 데, 2개의 각도를 사용해. 첫 번째는 극각 \(\theta\)(세타)——북극을 \(\theta = 0\)으로 하여, 거기서 남쪽으로 향해 측정한 각도. 북극이 \(\theta = 0\)(= 0°), 적도가 \(\theta = \pi/2\)(= 90°), 남극이 \(\theta = \pi\)(= 180°). 지리에서 사용하는 「위도」는 적도를 0°로 하여 북쪽을 양·남쪽을 음으로 잡지만, 물리의 극각은 북극을 0으로 하여 남쪽으로 향할수록 증가해——방향이 반대이므로 주의해. 두 번째는 경도 \(\phi\)(파이)——동서 방향의 각도로, \(0\)에서 \(2\pi\)(= 360°)의 범위를 가져. 지리의 경도(\(-180°\) ~ \(+180°\))와 방향은 같지만, 시작점과 범위가 약간 달라. 이 2개의 각도를 사용하면, 지구 표면 위의 미소 거리는

\[ d\ell^2 = R^2\,d\theta^2 + R^2\sin^2\theta\,d\phi^2 \]

왜 이렇게 되는지 직감적으로 말하면——위도 방향(남북)으로 \(d\theta\)만큼 움직이면, 반지름 \(R\)의 대원(지구 중심을 지나는 단면의 원)을 따라 \(R\,d\theta\)만큼 나아가. 경도 방향(동서)으로 \(d\phi\)만큼 움직이면, 그 위도에서의 「소원」(위선의 원)의 반지름은 \(R\sin\theta\)이므로, \(R\sin\theta\,d\phi\)만큼 나아가. 왜 \(R\sin\theta\)냐 하면, 지구의 자전축에서 위선의 원까지의 거리가 \(R\sin\theta\)이기 때문이야——북극(\(\theta = 0\))에서는 \(\sin 0 = 0\)으로 반지름 제로(점), 적도(\(\theta = \pi/2\))에서는 \(\sin(\pi/2) = 1\)로 반지름 \(R\)(최대)이 돼. 그리고 이 2방향(남북과 동서)은 구면 위에서 서로 직교하고 있어——지구본을 보면, 경선과 위선은 항상 직각으로 교차하지. 미소한 범위에서는 곡면도 평면으로 볼 수 있으므로(지구 표면이 국소적으로는 평평하게 보이는 것과 같아), 직교하는 2방향의 미소 변위에 피타고라스 정리를 적용하면

\[ d\ell^2 = (R\,d\theta)^2 + (R\sin\theta\,d\phi)^2 = R^2\,d\theta^2 + R^2\sin^2\theta\,d\phi^2 \]

이 돼.

🔵 카이: 잠깐만요. \(R\sin\theta\)가 위선의 원의 반지름이 되는 건, 왜인가요? 지구의 반지름은 \(R\)인데, 왜 \(\sin\theta\)가 곱해지나요?

🟡 리나: 좋은 질문이야. 지구의 단면도를 상상해 봐. 자전축에서 위선의 원까지의 수평 거리는, 삼각함수로 \(R\sin\theta\)가 돼——북극(\(\theta = 0\))에서는 자전축 위이므로 거리 제로, 적도(\(\theta = \pi/2\))에서는 자전축에서 가장 멀어져서 거리 \(R\). 즉 \(\sin\theta\)는 「자전축에서 얼마나 떨어져 있는가」의 비율을 나타내고 있어.

🔵 카이: 아, 그렇구나. 그래서 \(\sin^2\theta\)가 들어 있으면, 장소에 따라 경도 방향의 「1도당 거리」가 변하는 거군요. 적도 부근(\(\theta \approx \pi/2\))에서는 \(\sin^2\theta \approx 1\)로 크지만, 극 부근(\(\theta \approx 0\))에서는 \(\sin^2\theta \approx 0\)으로 거의 제로.

🟡 리나: 맞아. 장소에 따라 「자의 눈금」이 변한다——이것이 계량이 좌표의 함수 \(g_{ij}(\theta)\)가 된다는 것이야.

\[ g_{ij} = \begin{pmatrix} R^2 & 0 \\ 0 & R^2\sin^2\theta \end{pmatrix} \]

예 1의 단위행렬과 달리, 대각 성분이 장소(\(\theta\))에 의존하고 있지.

🔵 카이: 평면의 계량은 상수 행렬이고, 구면의 계량은 좌표의 함수……그럼 계량이 좌표에 의존하는지 여부로 「평평한지」 「휘어져 있는지」를 알 수 있는 건가요?

🟡 리나: 좋은 착안점이지만, 실은 그렇게 단순하지는 않아. 평면에서도 극좌표 \((r, \theta)\)를 사용하면 계량은 \(d\ell^2 = dr^2 + r^2 d\theta^2\)으로 좌표의 함수가 돼. 「계량이 좌표의 함수 = 휘어져 있다」고는 할 수 없어. 정말로 휘어져 있는지를 판정하려면, 더 정밀한 도구(곡률 텐서, 제 12 장에서 등장)가 필요해. 하지만 지금 단계에서는 「계량이 상수가 아니다 → 휘어져 있을 가능성이 있다」 정도의 직감으로 충분해.

예 3: 시공

🟡 리나: 그리고 시공(그림 4.2「계량의 3가지 예. 왼쪽: 평면(계량은 상수 \(\mathrm{diag}(1,1)\)). 가운데: 구면(계량이 좌표 \(\theta\)의 함수」의 오른쪽). 제 3 장의 섹션 2에서 유도한 시공간격

\[ ds^2 = -dt^2 + dx^2 + dy^2 + dz^2 \]

도, 실은 계량으로 쓸 수 있어. 공간만이라면 전부 플러스이지만, 시간 항에 마이너스가 붙어. 이것이 「시공은 보통의 공간과는 다른 기하학을 가진다」는 것의 핵심으로, 제 3 장의 섹션 2.3에서 광속 불변으로부터 유도한 결론이야.

🔵 카이: 즉 계량은 「거리의 측정 방법」을 결정할 뿐만 아니라, 공간의 성질 그 자체를 나타내고 있는 거군요.

🟡 리나: 바로 그래. 그리고 일반상대론에서는, 이 계량이 장소에 따라 변하는 \(g_{\mu\nu}(x)\)가 돼——지구 표면에서 \(\sin^2\theta\)가 장소에 따라 변했던 것과 같은 구조야. 뉴턴의 중력 퍼텐셜 \(\Phi\)의 역할을, 일반상대론에서는 계량 텐서 \(g_{\mu\nu}\)가 담당해. 계량이 「자」인 동시에 「중력장 그 자체」이기도 하다——이것이 일반상대론의 핵심적인 아이디어야. 하지만 그건 나중 이야기. 우선은 평탄한 시공의 계량을 첨자 표기법으로 써보자.

⚪ 메이: 3개의 예에서 단계적으로 난이도가 올라갔네——상수인 계량, 좌표에 의존하는 계량, 그리고 부호가 혼재하는 계량.

🟡 리나: 맞아. 그리고 특수상대론에서는 세 번째——부호가 혼재하지만 상수인 계량——을 다뤄. 축약 규칙을 사용해서, 시공간격을 첨자 표기법으로 다시 쓰자. \(ds^2 = -dt^2 + dx^2 + dy^2 + dz^2\)은,

\[ ds^2 = \eta_{\mu\nu}\,dx^\mu\,dx^\nu \]

로 쓸 수 있어. 여기서 \(\eta_{\mu\nu}\)(에타)민코프스키 계량 (Minkowski metric)이라고 불리는 양으로, 성분을 \(4 \times 4\) 행렬로 나열하면

\[ \eta_{\mu\nu} = \begin{pmatrix} -1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix} \]

🔵 카이: \(\eta_{\mu\nu}\,dx^\mu\,dx^\nu\)는, \(\mu\)\(\nu\)가 각각 0에서 3까지 달리니까……전부 합하면 16항이죠?

🟡 리나: 맞아. 식 \(\eta_{\mu\nu}\,dx^\mu\,dx^\nu\)를 잘 봐——\(\mu\)라는 문자가 2번 나타나지. 1번째는 \(\eta_{\mu\nu}\) 안에서 아래 첨자, 2번째는 \(dx^\mu\) 안에서 위 첨자. 위와 아래에 하나씩 나타나므로, 축약 규칙으로 \(\mu = 0, 1, 2, 3\)의 합을 취해. \(\nu\)도 마찬가지로, \(\eta_{\mu\nu}\) 안에서 아래 첨자, \(dx^\nu\) 안에서 위 첨자——그러니 이것도 합을 취해. 결과적으로 \(\mu\)\(\nu\)의 이중합으로 \(4 \times 4 = 16\)항. 하지만 \(\eta_{\mu\nu}\)대각행렬——즉 행 번호와 열 번호가 다른 성분(\(\mu \neq \nu\))은 모두 제로. 예를 들어 \(\eta_{01} = 0\), \(\eta_{12} = 0\) 등. 따라서 16항 중 \(\mu \neq \nu\)인 12항은 사라지고, 남는 것은 \(\mu = \nu\)인 4항뿐:

\[ \begin{aligned} &\eta_{00}\,dx^0\,dx^0 + \eta_{11}\,dx^1\,dx^1 + \eta_{22}\,dx^2\,dx^2 + \eta_{33}\,dx^3\,dx^3 \\ &= (-1)\,dt^2 + (1)\,dx^2 + (1)\,dy^2 + (1)\,dz^2 \\ &= -dt^2 + dx^2 + dy^2 + dz^2 \quad \checkmark \end{aligned} \]

🔵 카이: 오, 12항이 한꺼번에 사라지고 4항만 남는다! 대각행렬이면 이야기가 간단하네요.

⚪ 메이: 즉, \(\eta_{\mu\nu}\,dx^\mu\,dx^\nu\)라는 표현 하나로 「어떤 성분의 제곱에 어떤 부호를 붙이는가」가 전부 결정되는 거네——계량만 지정하면, 시공간격의 식이 자동적으로 나와.

🟡 리나: 맞아. 이 \(\eta_{\mu\nu}\)가, 민코프스키 시공의 「자」——계량 텐서——야. 일반상대론에서는, 이것이 장소에 따라 변하는 \(g_{\mu\nu}(x)\)로 바뀌어. 그것이 「시공이 휘어진다」는 것의 수학적 표현이야.

📝 연습문제:

이 책의 표기법 약속

여기까지 여러 기호가 나왔으므로, 한번 정리해 둘게. 4원벡터인지 행렬(텐서)인지, 3차원인지 4차원인지, 문자의 종류로 구분할 수 있도록 되어 있어.

종류 기호
4원벡터(그리스 첨자 \(\mu,\nu,\ldots\)) 대문자 라틴 \(A^\mu\), \(B_\mu\), \(V^\mu\), \(U^\mu\)(4원속도)
2계 텐서(계량) 소문자 그리스 \(\eta_{\mu\nu}\), \(g_{\mu\nu}\)
2계 이상의 텐서(기타) 대문자 라틴 \(T^{\mu\nu}\), \(R_{\mu\nu\rho\sigma}\)
변환행렬 대문자 그리스 \(\Lambda^{\mu'}{}_{\nu}\)(로렌츠 변환)
좌표·변위 전통적인 소문자 \(x^\mu\), \(dx^\mu\)
3차원 벡터 소문자 + 화살표 \(\vec{v}\), \(\vec{r}\), \(\vec{p}\), \(\vec{F}\)
3차원 벡터의 성분(라틴 첨자 \(i,j = 1,2,3\)) 소문자 \(v^i\), \(v^x\), \(v^y\), \(v^z\)

대략적으로 말하면 「4원벡터는 대문자, 계량은 소문자 그리스, 3차원은 화살표」. 다만 하나만 예외가 있어——4원운동량 \(p^\mu\)만은 역사적 관습으로 소문자를 사용해. 물리 교과서에서 보편적으로 이렇게 쓰이고 있으므로, 그대로 채택할게.


4.2 4원벡터

왜 4원벡터가 필요한가

🟡 리나: 뉴턴 역학에서는, 위치 \((x, y, z)\)나 속도 \((v_x, v_y, v_z)\)는 3성분의 벡터였어. 하지만 특수상대론에서는 시간과 공간이 뒤섞여. 그래서, 물리량을 시간 성분을 포함한 4성분의 벡터——4원벡터 (four-vector)——로 표현할 필요가 있어.

🔵 카이: 구체적으로 어떤 건가요?

변위 4원벡터

🟡 리나: 가장 기본적인 4원벡터는, 두 사건 사이의 미소 변위

\[ dx^\mu = (dt,\, dx,\, dy,\, dz) \]

이것이 로렌츠 변환으로 어떻게 변하는지를 첨자 표기법(성분 표시)으로 쓰면,

\[ dx^{\mu'} = \Lambda^{\mu'}{}_{\nu}\,dx^\nu \]

🔵 카이: 이건 행렬의 식과는 다른 건가요?

🟡 리나: 달라. 이건 행렬 그 자체가 아니라, 어떤 하나의 성분을 나타낸 식이야. \(\mu'\)는 성분 번호(0, 1, 2, 3 중 하나)를 추상적으로 나타내고 있어서, 예를 들어 \(\mu' = 0\)을 대입하면 \(dt'\)의 식이, \(\mu' = 1\)을 대입하면 \(dx'\)의 식이 나와. 한 줄의 식으로 4개의 성분을 한꺼번에 쓰고 있는 거야.

🟡 리나: 여기서 \(\Lambda\)(람다)는 로렌츠 변환의 행렬이고, \(\Lambda^{\mu'}{}_{\nu}\)는 그 \((\mu', \nu)\) 성분이야. \(x\) 방향으로 속도 \(v\)의 부스트 (boost)의 경우,

\[ \Lambda = \begin{pmatrix} \gamma & -\gamma v & 0 & 0 \\ -\gamma v & \gamma & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix} \]

🟡 리나: 예를 들어 \(\mu' = 0\) 성분을 계산해 봐. 축약 규칙으로 \(\nu\)에 대해 합을 취하니까——

🔵 카이: 음, \(\nu = 0, 1, 2, 3\)을 대입해서 더하면……\(\Lambda^{0'}{}_{0}\,dx^0 + \Lambda^{0'}{}_{1}\,dx^1 + \Lambda^{0'}{}_{2}\,dx^2 + \Lambda^{0'}{}_{3}\,dx^3\). 행렬의 성분을 넣으면 \(\gamma\,dt - \gamma v\,dx\)?

⚪ 메이: 즉 \(dt' = \gamma(dt - v\,dx)\)——아까의 로렌츠 변환과 일치하네.

4원벡터의 정의

🟡 리나: 지금 본 \(dx^\mu\)는, 로렌츠 변환으로 \(dx^{\mu'} = \Lambda^{\mu'}{}_{\nu}\,dx^\nu\)라는 형태로 뒤섞였지. 실은, 물리에 등장하는 양 중에는, \(dx^\mu\)와 완전히 같은 방식으로 뒤섞이는 것이 다른 것도 많이 있어——속도, 운동량, 전류밀도……. 그래서, 이 「뒤섞이는 규칙」을 공유하는 양을 묶어서 이름을 붙여 두면 편리한 거야.

🔵 카이: 「같은 방식으로 뒤섞인다」는 게, 구체적으로 어떤 건가요?

🟡 리나: 4개 양의 조 \(V^\mu = (V^0, V^1, V^2, V^3)\)이 있다고 하자. 관성계를 \(S\)에서 \(S'\)로 갈아탔을 때, 변환행렬 \(\Lambda\)(람다)를 사용해서

\[ V^{\mu'} = \Lambda^{\mu'}{}_{\nu}\,V^\nu \]

라고 쓸 수 있다——즉 \(dx^\mu\)같은 행렬 \(\Lambda\)로 변환된다. 이 성질을 가진 양을 반변벡터 (contravariant vector)라고 불러. 아까의 \(dx^\mu\) 자체가, 반변벡터의 첫 번째 예야.

🔵 카이: 이 식을 좀 더 풀어서 설명해 주실 수 있나요?

🟡 리나: 좋아. \(V^{\mu'} = \Lambda^{\mu'}{}_{\nu}\,V^\nu\)를 읽어보자. \(\nu\)가 위(\(V^\nu\))와 아래(\(\Lambda^{\mu'}{}_{\nu}\))에 나타나니까, 섹션 1.3의 축약 규칙으로 합을 취해. 즉 이 식은

\[ V^{\mu'} = \sum_{\nu=0}^{3} \Lambda^{\mu'}{}_{\nu}\,V^\nu = \Lambda^{\mu'}{}_{0}\,V^0 + \Lambda^{\mu'}{}_{1}\,V^1 + \Lambda^{\mu'}{}_{2}\,V^2 + \Lambda^{\mu'}{}_{3}\,V^3 \]

의 축약형. 4항의 합이지. \(\mu'\)에 구체적인 값(0, 1, 2, 3)을 넣으면, \(S'\)계의 각 성분이 나와.

🔵 카이: 아까 메이가 \(dx^{0'} = \gamma\,dt - \gamma v\,dx\)를 계산한 것과 같은 구조네요.

🟡 리나: 맞아. 직감적으로 말하면, 이 식은 「\(S\)계의 성분 \(V^0, V^1, V^2, V^3\)을, \(\Lambda\)라는 환산 규칙으로 섞어서, \(S'\)계의 성분 \(V^{\mu'}\)를 만든다」는 거야. 3차원 벡터를 좌표 회전했을 때, \((v_x, v_y, v_z)\)가 회전행렬로 뒤섞이는 것과 같은 구조야. 성분의 수치는 변하지만, 벡터 그 자체(물리적 내용)는 변하지 않아.

🔵 카이: 즉, \(\Lambda\)를 곱해서 계산한 \(V^{\mu'}\)의 각 성분이, \(S'\)계에서 실제로 측정한 값과 일치하면 반변벡터, 라는 건가요?

🟡 리나: 바로 그래. 4개의 수의 조가 있으면 \(\Lambda\)를 곱하는 계산 자체는 언제든지 할 수 있어. 하지만, 계산 결과가 \(S'\)계에서의 올바른 값과 일치한다고는 할 수 없어. 실은, 좌표의 변환과 「같은 방향」으로 성분이 변하는 양과, 「반대 방향」으로 변하는 양이 있어——이것이 「공변벡터」와 「반변벡터」의 구별이며, 자세한 것은 섹션 3에서 다룰게. 지금 단계에서는 「위 첨자(반변)와 아래 첨자(공변)로 변환 방식이 반대」라는 것만 기억해 둬.

🔵 카이: 「\(\Lambda\)를 곱해서 올바른 답이 나오는지」 여부가, 반변벡터인지 아닌지의 판정 기준인 거군요.

🟡 리나: 맞아. \(\Lambda\)의 역행렬로 변환되는 양(아래 첨자 \(V_\mu\))을 공변벡터 (covariant vector)라고 불러. 이름의 유래는 co = 「함께」, contra = 「거슬러」. 무엇에 대해 「함께」 「거슬러」냐 하면——좌표 눈금의 변화에 대해서야. 눈금을 크게 하는 변환에서 성분도 커지는 것이 공변(co = 함께 변한다), 성분이 작아지는 것이 반변(contra = 거슬러서 변한다). 다음의 구체적인 예에서 감각을 잡아봐. 공변벡터의 대표적인 예는 기울기——어떤 스칼라장(예를 들어 중력 퍼텐셜 \(\Phi\)와 같은, 시공의 각 점에서 값이 정해지는 양)의 편미분 \(\partial\Phi/\partial x^\mu\)은 공변벡터가 돼. 이것은 뒤의 장에서 정식으로 유도하지만, 지금은 「변위 \(dx^\mu\)가 반변의 대표, 기울기가 공변의 대표」라고만 기억해 둬. 직감적으로 말하면——좌표 눈금을 2배로 늘리는 변환을 생각해 봐.

구체적인 예를 들어볼게. 수직선을 떠올려 봐. 1차원에서, 어떤 막대의 길이가 원래 좌표에서 \(\Delta x = 3\) 눈금이었다고 하자. 눈금 간격을 2배로 늘린다——즉 새로운 1눈금은 원래 2눈금분의 물리적 길이에 대응해. 물리적 위치는 변하지 않았는데, 눈금이 커졌으니 같은 위치를 새 좌표에서 읽으면 수치는 절반이 돼——좌표로 쓰면 \(x' = x/2\). 그러면 같은 막대를 다시 측정하면 \(\Delta x' = 3/2 = 1.5\) 눈금밖에 안 돼——눈금이 커진 만큼, 변위의 수치는 절반이 됐어. 기저(눈금의 단위벡터)가 「크게」 되는 변환인데, 변위의 성분은 「작아」진다. 이것이 「반변 = 기저의 변환과 반대 방향으로 변한다」의 의미야.

🔵 카이: 아, 자가 늘어나면 수치는 줄어드는 거군요. 눈금과 반대 방향이니까 「반변」.

한편, 비탈길의 기울기(기울기)를 생각해 봐. 원래 좌표에서 「1눈금 나아가면 높이가 4 m 올라간다」고 하자. 눈금을 2배로 늘리면, 새로운 1눈금은 원래 2눈금분의 거리에 대응해. 그래서 새 좌표에서 「1눈금 나아가면」, 실제로는 원래 2눈금분만큼 나아가고 있으므로, 높이는 \(4 \times 2 = 8\) m 올라가——기울기의 수치는 2배가 돼. 좌표가 「크게」 되는 변환에서, 기울기도 「크게」 된다. 이것이 「공변 = 좌표변환과 같은 방향으로 변한다」의 의미야.

정리하면——같은 「눈금을 2배로 늘리는」 변환에 대해, 변위의 성분은 절반(반대 방향 = 반변), 기울기의 성분은 2배(같은 방향 = 공변). 변환을 기술하는 행렬이 다르다(\(\Lambda\)인가 \(\Lambda^{-1}\)인가)——그것이 본질적인 구별이야.

🔵 카이: 지금 예는 1차원이었는데, 4차원 시공에서도 같은 생각이 성립하나요?

🟡 리나: 맞아. 4차원에서도 본질은 같아——좌표 눈금의 변경 방법(\(\Lambda\))에 대해, 성분이 반대 방향으로 변하는 것이 반변, 같은 방향으로 변하는 것이 공변. 구체적인 변환식과 사용법은 섹션 3에서 자세히 할 테니, 지금은 「위 첨자와 아래 첨자로 변환 방식이 반대」라는 것만 기억해 둬. 반변벡터와 공변벡터를 합쳐서 4원벡터 (four-vector)라고 총칭해.

%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart TB
    all["<b>4성분의 수의 조</b><br/>예: (t, x, m, 0) 등 아무거나"]
    all -->|"Λ 또는 Λ⁻¹로 변환"| four["<b>4원벡터</b>"]
    all -->|"변환 규칙을 갖지 않음"| not4["4원벡터가 아님<br/>예: (t, x, m, 0)"]
    four --> contra["<b>반변벡터</b> Vᵘ(위 첨자)<br/>Λ로 변환<br/>예: dxᵘ, Uᵘ, pᵘ"]
    four --> co["<b>공변벡터</b> V_μ(아래 첨자)<br/>Λ⁻¹로 변환<br/>예: 기울기 ∂φ/∂xᵘ"]

    style all fill:#f0f0f0,stroke:#666
    style four fill:#d1ecf1,stroke:#0c5460
    style not4 fill:#ffcccc,stroke:#721c24
    style contra fill:#d4edda,stroke:#155724
    style co fill:#fff3cd,stroke:#856404
그림 4.3: 4원벡터의 분류와 변환 규칙의 관계

🟡 리나: 그림 4.3「4원벡터의 분류와 변환 규칙의 관계」에 정리한 것처럼, 중요한 포인트를 강조해 둘게. 4개의 수를 나열한 것만으로는 4원벡터라고 할 수 없어——로렌츠 변환에서 올바른 변환 규칙을 따르는 것이 4원벡터야. 그리고 4원벡터에는 2종류가 있어——위 첨자 \(V^\mu\)(반변)와 아래 첨자 \(V_\mu\)(공변).

⚪ 메이: 즉, 변환 규칙을 가지는지 여부가 본질이고, 가지는 경우에도 \(\Lambda\)로 변환되는지 \(\Lambda^{-1}\)로 변환되는지로 2종류로 나뉘는 거네.

🟡 리나: 맞아. 왜 2종류가 있는지, 구체적으로 어떻게 구분해서 사용하는지는 섹션 3에서 자세히 할게. 지금은 우선, \(dx^\mu\)와 같은 변환 규칙을 따르는 반변벡터에 집중하자.

🔍 Dive Deep: 「공변성」과 「공변벡터」는 다른 의미

제 2 장에서 「물리의 모델이 모든 좌표계에서 같은 형태를 취한다」는 것을 공변성 (covariance)이라고 불렀어. 한편, 이 섹션에서 나온 공변벡터 (covariant vector)는 「\(\Lambda\)의 역행렬로 변환되는 양」이야. 같은 「공변」이라는 단어지만, 의미가 달라.

  • 공변성 (covariance): 방정식의 형태가 좌표계에 의존하지 않는다는 성질
  • 공변벡터 (covariant vector): 특정한 변환 규칙을 따르는 벡터의 종류

헷갈리지만, 역사적으로 이렇게 불리고 있으니 익숙해질 수밖에 없어. 중요한 것은, 반변벡터도 공변벡터도, 둘 다 「공변성을 가지는 방정식」을 쓰기 위한 도구라는 거야.

그럼, 반변벡터의 구체적인 예를 봐보자.

4원속도

🟡 리나: 구체적인 예를 보자. 입자의 4원속도 (four-velocity) \(U^\mu\)는, 세계선을 따른 좌표 \(x^\mu\)의 미분으로 정의돼. 다만, 미분의 파라미터로 좌표시간 \(t\)가 아닌, 고유시간 (proper time) \(\tau\)(타우)를 사용해.

🔵 카이: 고유시간이 뭔가요?

🟡 리나: 입자 자신이 가지고 다니는 시계가 새기는 시간이야. 그림으로 비교해 보자.

고유시간의 직감적 이해

그림 4.4: 고유시간의 직감적 이해. 왼쪽 — \(S\)계(관측자)에서 보면, 입자는 속도 \(v\)로 움직이고 있으므로 세계선이 비스듬히 기운다. 오른쪽 — 입자 자신의 정지계 \(S'\)에서 보면, 자신은 항상 원점 \(x' = 0\)에 있고, \(c\tau\)축을 따라 곧장 나아갈 뿐이다. 이 \(\tau\)가 고유시간.

🟡 리나: 그림 4.4「고유시간의 직감적 이해. 왼쪽」의 오른쪽을 봐. 입자 자신의 정지계 \(S'\)에서는, 입자가 움직이지 않아——공간 좌표는 항상 제로이고, 단지 시간만 나아가. 그 「자기 자신의 시계가 새기는 시간」이 고유시간 \(\tau\)야.

⚪ 메이: 그렇구나, \(S\)계에서 보면 세계선이 비스듬히 기울지만, 입자 자신에서 보면 자기는 곧장 시간 방향으로 나아가고 있을 뿐——그 시간이 \(\tau\)인 거네.

🟡 리나: 맞아. 그리고 중요한 포인트는, 어떤 관측자도, 이 입자의 고유시간 \(\tau\)를 사용해서 속도 등의 물리량을 정의한다는 거야. 왜냐하면, 좌표시간 \(t\)는 관성계마다 다른 값을 가지지만, 고유시간 \(\tau\)는 불변량——어느 관성계에서 계산해도 같은 값이 나오니까. 불변량으로 나누면, 결과도 불변량(또는 올바른 변환 규칙을 따르는 양)이 돼.

🔵 카이: 「불변량으로 나누면 결과도 올바른 변환 규칙을 따른다」는 게, 좀 더 구체적으로 말하면 어떤 건가요?

🟡 리나: 예를 들어 \(dx^\mu\)는 반변벡터——로렌츠 변환에서 \(\Lambda\)를 곱해서 변환되는 양이지. 이것을 \(d\tau\)(스칼라, 즉 변환에서 값이 변하지 않는 양)로 나누면, 분자만 \(\Lambda\)로 변환되고 분모는 불변이니까, 결과 \(dx^\mu / d\tau\)도 역시 반변벡터의 변환 규칙을 따라. 만약 좌표시간 \(dt\)로 나누면, \(dt\) 자체가 관성계마다 변하니까, 결과가 반변벡터가 되지 않아.

⚪ 메이: 그래서 좌표시간 \(t\)가 아닌 고유시간 \(\tau\)로 나눌 필요가 있는 거구나. 변환 규칙을 깨뜨리지 않기 위해서.

🟡 리나: 그럼, 고유시간을 수식으로 정의하려면 어떻게 해야 할까? 「입자의 정지계에서의 시간」이니까, 입자의 정지계(\(dx = dy = dz = 0\))에서 \(d\tau = dt\)가 되는 양이 필요해. 게다가, 어느 관성계에서 계산해도 같은 값이 나와야(불변량이어야) 해——그렇지 않으면 「입자 자신의 시계」라는 의미가 좌표계에 의존해 버리니까.

🔵 카이: 불변량……아, \(ds^2\)인가요?

🟡 리나: 맞아. 제 3 장의 섹션 2에서, \(ds^2\)은 모든 관성계에서 같은 값을 가지는 불변량임을 유도했었지. 근접하는 두 사건 사이의 「시공적 거리」를 좌표의 미소 변위로부터 직접 계산할 수 있는 불변량이 \(ds^2\)야. 거기서, 입자의 정지계——즉 입자 자신과 함께 움직이는 관성계——에서 \(ds^2\)을 계산해 보자. 이 계에서는 입자가 움직이지 않으니까, 공간 좌표는 변화하지 않아. 그래서 \(dx = dy = dz = 0\). 대입하면 \(ds^2 = -dt^2 + 0 + 0 + 0 = -dt^2\). 여기서 「정지계의 \(dt\)」는, 입자와 함께 움직이는 시계——즉 입자 바로 옆에 놓인 시계——가 새기는 시간 그 자체야(그림 4.4「고유시간의 직감적 이해. 왼쪽」의 오른쪽에서, 입자가 움직이지 않고 시간축을 따라 나아가는, 그 시간). 마이너스가 붙어 있으니 \(ds^2 < 0\)이야. 그리고 \(ds^2\)는 불변량이니까, 다른 관성계에서 \(ds^2 = -dt^2 + dx^2 + dy^2 + dz^2\)를 계산해도, 같은 수치가 나와——정지계에서 얻은 \(-dt^2\)과 일치해.

🔵 카이: \(ds^2\)이 음수……시간의 제곱인데 마이너스라니, 괜찮은 건가요?

🟡 리나: 좋은 의문이야. 바로 거기가 포인트야. 우리가 하고 싶은 것은 「입자 자신의 시계가 새기는 시간 \(d\tau\)」를 정의하는 것——즉 실수의 시간을 얻고 싶어. 그래서 \(d\tau^2\)은 양의 양이어야 곤란해. 그런데 \(ds^2\)은 음이 돼 버려. 왜 음이냐 하면——정지계(\(dx = dy = dz = 0\))에서는 \(ds^2 = -dt^2 < 0\). 그리고 \(ds^2\)은 불변량이니까, 정지계에서 음이면 다른 어떤 관성계에서도 음이야.

🔵 카이: 즉, 광속 미만으로 움직이는 입자라면, 어느 관성계에서 계산해도 반드시 \(ds^2 < 0\)이 된다는 거군요.

🟡 리나: 맞아. 일반적인 관성계에서도 직접 확인할 수 있어——입자의 속력은 \(v^2 = (dx^2 + dy^2 + dz^2)/dt^2\)이니까, \(v < 1\)(광속 미만)이면 \(v^2 < 1\). 양변에 \(dt^2 > 0\)을 곱하면 \(dx^2 + dy^2 + dz^2 < dt^2\), 따라서 \(ds^2 = -dt^2 + dx^2 + dy^2 + dz^2 < 0\).

그래서, \(ds^2 < 0\)이면 제곱근을 취해서 실수의 「시간」을 얻을 수 없어. 해결책은 단순해——마이너스를 붙여서 \(-ds^2 > 0\)으로 해. 정지계에서는 \(-ds^2 = -(-dt^2) = dt^2\)——바로 「입자 자신의 시계의 시간의 제곱」이야. 게다가 \(ds^2\)이 불변량이니까 \(-ds^2\)도 불변량. 그래서 고유시간을

\[ d\tau^2 \equiv -ds^2 = dt^2 - dx^2 - dy^2 - dz^2 \]

으로 정의해.

🔵 카이: 마이너스를 붙이는 것만으로 해결되는군요. 부호의 약속이 중요하네요.

🟡 리나: 이 정의라면, 정지계(\(dx = dy = dz = 0\))에서는 \(d\tau^2 = dt^2\), 즉 \(d\tau = dt\)——제대로 「입자 자신의 시계」에 대응하고 있어. 그리고 \(ds^2\)이 모든 관성계에서 같은 값을 가지는 불변량이었으니(제 3 장의 섹션 2에서 유도했었지), \(-ds^2\)도 당연히 불변량——부호를 반전했을 뿐이니까. 따라서 \(d\tau\)는 불변량이고, 어느 관성계에서 계산해도 같은 값이 나와.

🔵 카이: 그렇구나, 정지계에서 \(d\tau = dt\)가 되도록 역산해서 정의를 만든 거군요. \(ds^2\)이 음수이니까 마이너스를 붙여서 양으로 만들어——그러면 \(d\tau\)가 실수가 된다는 거야.

🟡 리나: 맞아.

보충: 이 정의는 \(ds^2 < 0\)(시간적)일 때만 \(d\tau^2 > 0\)이 되어, \(d\tau\)가 실수로서 의미를 가진다. 즉 고유시간은, 광속 미만으로 움직이는 입자——인과적으로 도달 가능한 경로——의 세계선을 따라서만 정의된다. 빛(\(ds^2 = 0\))이나 광속을 초과하는 가상적인 경로에는 고유시간을 정의할 수 없다.

⚪ 메이: 입자의 정지계에서는 \(dx = dy = dz = 0\)이니까 \(d\tau = dt\). 즉 고유시간은 「입자와 함께 움직이는 시계의 시간」이야.

🔵 카이: 그럼, 입자가 움직이고 있는 \(S\)계에서 보면 \(d\tau\)는 어떻게 되나요? \(dx \neq 0\)이니까 \(d\tau < dt\)가 되나요?

🟡 리나: 맞아. \(S\)계에서는 입자가 움직이고 있으니 \(dx^2 + dy^2 + dz^2 > 0\)이고, \(d\tau^2 = dt^2 - (dx^2 + dy^2 + dz^2) < dt^2\)——\(d\tau > 0\), \(dt > 0\)(미래를 향해 나아가므로)이니까 \(d\tau < dt\). 움직이는 입자의 고유시간은, \(S\)계의 좌표시간보다 짧아. 이것은 제 3 장의 섹션 4.2에서 본 「움직이는 시계는 느려진다」와 같은 거야. 구체적으로 얼마나 짧은지는, 지금부터 계산할게.

🟡 리나: 4원속도의 정의는

\[ U^\mu \equiv \frac{dx^\mu}{d\tau} \]

\(d\tau\)는 스칼라(불변량)이고, \(dx^\mu\)는 반변벡터야. 아까 설명한 것처럼, 스칼라는 로렌츠 변환에서 값이 변하지 않으니까, \(dx^\mu / d\tau\)의 변환 규칙은 분자 \(dx^\mu\)의 변환 규칙 그 자체——즉 \(\Lambda\)가 하나 걸리는 반변벡터의 변환 규칙을 따라. 따라서 \(U^\mu\)반변벡터가 돼.

🔵 카이: 구체적으로 성분을 계산하면 어떻게 되나요?

🟡 리나: 정의 \(U^\mu = dx^\mu / d\tau\)에 따라, 각 성분을 좌표시간 \(t\)로 나타내 보자. 먼저 \(d\tau\)\(dt\)로 바꿔 쓸 필요가 있어. 아까의 정의 \(d\tau^2 = dt^2 - dx^2 - dy^2 - dz^2\)의 우변을 \(dt^2\)으로 묶으면,

\[ d\tau^2 = dt^2\!\left(1 - \frac{dx^2 + dy^2 + dz^2}{dt^2}\right) \]

여기서 \(dx^2/dt^2\)이라는 표기는 헷갈리지만, \((dx)^2/(dt)^2 = (dx/dt)^2\)이라는 뜻이야——미소량의 제곱의 비는, 미분의 제곱과 같아.

🔵 카이: 음, \(dt^2\)으로 묶는다는 건 구체적으로 어떤 계산인가요?

🟡 리나: \(d\tau^2 = dt^2 - dx^2 - dy^2 - dz^2\)의 우변 4항 전부를 \(dt^2\)으로 나누고, 밖으로 \(dt^2\)을 묶어내는 거야. \(dt^2/dt^2 = 1\), \(dx^2/dt^2 = (dx/dt)^2\), \(dy^2/dt^2 = (dy/dt)^2\), \(dz^2/dt^2 = (dz/dt)^2\). 그래서 \(d\tau^2 = dt^2\bigl(1 - (dx/dt)^2 - (dy/dt)^2 - (dz/dt)^2\bigr)\). 3차원 속력의 제곱 \(v^2 \equiv (dx/dt)^2 + (dy/dt)^2 + (dz/dt)^2\)(\(c = 1\) 단위계이므로 \(0 \le v < 1\))를 사용하면, $$ d\tau^2 = dt^2(1 - v^2) $$

제곱근을 취하면(\(dt > 0\), \(d\tau > 0\)이므로 양의 근을 취한다) \(d\tau = dt\sqrt{1 - v^2}\), 즉

\[ \frac{dt}{d\tau} = \frac{1}{\sqrt{1 - v^2}} = \gamma \]

🔵 카이: 아, \(\gamma\)가 나왔다! 고유시간과 좌표시간의 비가 바로 로렌츠 인자였군요.

🟡 리나: 맞아. 따라서, \(\tau\)에 의한 미분을 \(t\)에 의한 미분으로 바꿔 쓰면(연쇄법칙 \(dx^\mu/d\tau = (dx^\mu/dt)(dt/d\tau)\)를 사용),

\[ U^\mu = \frac{dx^\mu}{d\tau} = \frac{dx^\mu}{dt}\cdot\frac{dt}{d\tau} = \gamma\frac{dx^\mu}{dt} = \gamma\!\left(\frac{dt}{dt},\, \frac{dx}{dt},\, \frac{dy}{dt},\, \frac{dz}{dt}\right) = \gamma(1,\, v^x,\, v^y,\, v^z) \]

여기서 \(v^i = dx^i/dt\)는 보통의 3차원 속도. 괄호 안의 시간 성분이 1이 되는 것은 \(dx^0/dt = dt/dt = 1\)이기 때문(거기에 \(\gamma\)가 곱해져서 \(U^0 = \gamma\)).

🔵 카이: 이 \(U^\mu\)의 「크기」는 어떻게 계산하나요? 3차원이면 \(|\vec{v}|^2 = v_x^2 + v_y^2 + v_z^2\)인데요.

🟡 리나: 4차원 시공에서는, 벡터의 「크기의 제곱」에 해당하는 양——노름 (norm)이라고 부르는——을 계량 \(\eta_{\mu\nu}\)를 사용해서 계산해. 3차원의 \(|\vec{v}|^2 = v_x^2 + v_y^2 + v_z^2\)에 대응하는 것이

\[ \eta_{\mu\nu}\,U^\mu\,U^\nu \]

야. 섹션 1.3의 축약 규칙으로 전개하면 \((-1)(U^0)^2 + (U^1)^2 + (U^2)^2 + (U^3)^2\). 3차원과 달리 시간 성분에 마이너스가 붙으니까, 노름이 음의 값을 가질 수도 있어——3차원의 「길이의 제곱」은 반드시 양이었지만, 시공에서는 부호가 물리적 의미(시간적·공간적·광적)를 가져. 실제로 \(U^\mu = \gamma(1, v^x, v^y, v^z)\)를 대입해 봐.

⚪ 메이: 대입하면,

\[ \eta_{\mu\nu}\,U^\mu\,U^\nu = \gamma^2(-1 + v^2) = -\gamma^2(1 - v^2) = -\gamma^2 \cdot \frac{1}{\gamma^2} = -1 \]

🔵 카이: 4원속도의 크기는 항상 \(-1\)! 속력에 관계없이 일정하군요.

🟡 리나: 맞아. 이것은 고유시간의 정의로부터 자동적으로 따르는 성질이야. 노름이 \(-1\)(마이너스)이라는 것은, 4원속도가 시간적 벡터 (timelike vector)——즉 \(\eta_{\mu\nu} V^\mu V^\nu < 0\)을 만족하는 벡터——임을 의미해. 제 3 장의 섹션 2.3에서 \(ds^2 < 0\)인 간격을 「시간적」이라고 불렀던 것과 같은 분류를, 벡터에도 적용하고 있는 거야——벡터의 노름이 음이면 시간적, 제로면 광적, 양이면 공간적. 시간적 벡터는 광원뿔의 내부를 향하고 있어.

🔵 카이: 노름이 \(-1\)로 일정하다는 것은, 4원속도의 「크기」는 바꿀 수 없다는 건가요?

🟡 리나: 맞아. 직감적으로 말하면 이런 거야——입자의 정지계에서는 \(U^\mu = (1, 0, 0, 0)\). 즉 시간 방향으로 「속력 1」(= 광속)으로 나아가고 있어. 공간 방향으로는 움직이지 않아.

⚪ 메이: 다른 관성계에서 보면 \(U^\mu = \gamma(1, v, 0, 0)\)으로, 공간 성분이 나타나. 하지만 노름은 \(-1\) 그대로야.

🟡 리나: 맞아. 4원속도 벡터는, 노름(크기)을 유지한 채로, \(t\)-\(x\) 평면에서 기울어질 뿐이야——제 3 장의 섹션 3.7에서 본 쌍곡선 회전과 같은 구조야. 공간 방향으로 빠르게 움직일수록, 시간 성분 \(\gamma\)도 커져서, 노름이 \(-1\)로 유지돼.

🔵 카이: ……그렇다면, 공간 방향으로 빠르게 움직일수록 시간 성분도 커져서 노름이 유지되는 거군요. 왠지, 누구나 시공 속을 「광속」으로 나아가고 있고, 그 방향이 시간 쪽인지 공간 쪽인지의 차이일 뿐——같은 이미지가 떠오르는데요, 이게 맞는 건가요?

🟡 리나: 재미있는 직감이네. 다만 주의가 필요해——「광속으로 나아간다」는 것은 어디까지나 비유이고, 정확히는 「4원속도의 노름이 \(-1\)(\(c\)를 복원하면 \(-c^2\))으로 일정하다」는 거야. 광자의 노름은 0이니까, 질량을 가진 입자와 광자가 같은 의미로 「광속으로 나아가고 있다」는 것은 아니야. 이 비유는 일반 대중용 책에서 자주 사용되지만, 수식의 의미와는 약간 다르니까, 시험에서 쓰면 감점당할지도 모르겠어(웃음).

🔵 카이: 그럼 정확히는 어떻게 말하면 좋을까요?

🟡 리나: 정확히 다시 말하면——모든 질량을 가진 입자의 4원속도의 노름은 바꿀 수 없다. 공간 방향으로 빠르게 움직이면, 그만큼 시간 성분 \(U^0 = \gamma\)가 커져서 노름 \(-1\)을 유지해. 결과적으로 고유시간의 진행이 느려져——이것이 제 3 장의 섹션 4.2에서 본 「움직이는 시계는 느려진다」의 4원속도에 의한 바꿔 말하기야.

🔵 카이: 그럼 광자의 경우는 어떻게 되나요? 질량이 제로이면 \(U^\mu = dx^\mu/d\tau\)\(d\tau\)가 제로가 되어 정의할 수 없게 되지 않나요?

🟡 리나: 날카롭네. 맞아, 광자에는 고유시간이 정의되지 않아(\(ds^2 = 0\)이니까 \(d\tau = 0\)). 그래서 광자에는 4원속도를 사용할 수 없어. 그럼 광자의 운동은 어떻게 기술하느냐?——그것은 4원운동량을 도입한 후의 「질량 제로인 입자」에서 다룰게.

✅ 이해도 체크: 왜 4원속도의 정의에서, 좌표시간 \(t\)가 아닌 고유시간 \(\tau\)로 미분하나요?

좌표시간 \(t\)는 관성계마다 다른 값을 가지지만, 고유시간 \(\tau\)는 불변량(어느 관성계에서 계산해도 같은 값)이기 때문이다. 불변량으로 나눔으로써, 결과가 올바른 변환 규칙(반변벡터의 변환 규칙)을 따르는 것이 보장된다.

4원운동량

🟡 리나: 4원속도가 만들어졌으면, 4원운동량 (four-momentum) \(p^\mu\)도 자연스럽게 정의할 수 있어.

\[ p^\mu \equiv mU^\mu = m\gamma(1,\, v^x,\, v^y,\, v^z) = (\gamma m,\, \gamma m v^x,\, \gamma m v^y,\, \gamma m v^z) \]

여기서 \(m\)은 입자의 (정지)질량.

🔵 카이: 공간 성분 \(p^i = \gamma m v^i\)는……아, 저속이면 \(\gamma \approx 1\)이니까 뉴턴의 운동량 \(mv^i\)로 돌아가는군요. 그럼 시간 성분 \(p^0 = \gamma m\)은 무엇을 나타내나요?

🟡 리나: \(c = 1\) 단위계에서는 \(p^0 = \gamma m = E\)——에너지와 같은 값이야. SI 단위계로 되돌리려면, 섹션 1.1에서 배운 차원 분석을 사용해. \(p^\mu = (p^0, p^1, p^2, p^3)\)의 공간 성분 \(p^i = \gamma m v^i\)는 운동량의 차원 \([\text{kg}\cdot\text{m/s}]\)을 가져.

🔵 카이: 시간 성분 \(p^0\)도 같은 차원이어야 하나요?

🟡 리나: 맞아. 로렌츠 변환 \(p^{\mu'} = \Lambda^{\mu'}{}_{\nu} p^\nu\)를 전개하면, 우변은 \(p^0, p^1, p^2, p^3\)의 덧셈이 돼. 덧셈을 하려면, 모든 성분이 같은 차원이어야 물리적으로 의미가 있어——「3 kg·m/s + 5 줄」은 더할 수 없잖아.

🔵 카이: 아, 맞아요. 덧셈할 수 있는 건 같은 차원의 양뿐이네요.

🟡 리나: 맞아. SI에서는 공간 성분 \(p^i = \gamma mv^i\)(\(v^i\)는 m/s의 차원)는 운동량의 차원 \([\text{kg}\cdot\text{m/s}]\)을 가져. 그래서 시간 성분도 같은 차원이어야 해. 자연단위계에서는 \(p^0 = \gamma m\)이었지만, SI로 되돌리면 어떻게 될까? 섹션 1.1의 차원 분석을 사용할게. 자연단위계의 식에서 \(c = 1\)로 놓고 사라진 \(c\)를 복원해. \(\gamma m\)의 차원은 \([\text{kg}]\)이고, 공간 성분의 차원 \([\text{kg}\cdot\text{m/s}]\)보다 \([\text{m/s}]\)가 부족해. 그래서 \(c\)(차원 \([\text{m/s}]\))를 보충하면, SI에서의 올바른 표현은 \(p^0 = \gamma mc\)——이것으로 \([\text{kg}\cdot\text{m/s}]\)가 돼. 한편, 에너지의 SI 표현은 \(E = \gamma mc^2\)(차원: \([\text{kg}\cdot\text{m}^2/\text{s}^2]\)). 그러면 \(E/c = \gamma mc\)(차원: \([\text{kg}\cdot\text{m/s}]\))——공간 성분과 같은 차원이 되지. 즉 SI 단위계에서는 \(p^0 = E/c\)로 쓰면 모든 성분의 차원이 맞아.

보충: 교과서에 따라서는, 처음부터 시간 좌표를 \(x^0 = ct\)(길이의 차원)로 정의해서 모든 성분의 차원을 맞추는 방식도 있다. 그 경우 \(U^0 = dx^0/d\tau = c\,dt/d\tau = \gamma c\), \(p^0 = mU^0 = \gamma mc = E/c\)가 되어, 결론은 같다. 이 장에서는 \(c = 1\)로 통일하고 있으므로, \(p^0 = E\)로 간단히 쓸 수 있다.

정리하면——이 장(\(c = 1\))에서는 \(p^0 = E\). SI 단위로 되돌리면 \(p^0 = E/c\). SI에서의 구체적인 수치가 필요하면, 섹션 1.1에서 배운 차원 분석으로 \(c\)를 복원하면 돼. 저속으로 전개하면 \(E \approx m + \frac{1}{2}mv^2\)(\(c = 1\)), \(c\)를 복원하면 \(E \approx mc^2 + \frac{1}{2}mv^2\)——정지에너지와 운동에너지의 합. 이 전개의 유도는 바로 뒤의 「저속 극한과 뉴턴 역학과의 접속」에서 자세히 할게.

🟡 리나: 4원운동량의 불변 노름을 계산해 보자. \(p^\mu = mU^\mu\)이니까,

\[ \eta_{\mu\nu}\,p^\mu\,p^\nu = m^2\,\eta_{\mu\nu}\,U^\mu\,U^\nu = m^2 \cdot (-1) = -m^2 \]

성분으로 쓰면 \(-(p^0)^2 + |\vec{p}|^2 = -m^2\). \(c = 1\)에서는 \(p^0 = E\)이니까 \(-E^2 + |\vec{p}|^2 = -m^2\), 즉 \(E^2 = |\vec{p}|^2 + m^2\). 이것이 \(c = 1\)에서의 에너지·운동량 관계식이야.

🔵 카이: 오, 노름의 불변성을 사용하는 것만으로 에너지와 운동량의 관계가 나오는군요!

🟡 리나: \(c\)를 복원하려면, 섹션 1.1의 차원 분석을 사용해. \(c = 1\)인 식 \(E^2 = |\vec{p}|^2 + m^2\)의 각 항은, SI에서는 서로 다른 차원을 가져——좌변 \(E^2\)은 에너지의 제곱으로 차원 \([\text{kg}^2\cdot\text{m}^4/\text{s}^4]\), \(|\vec{p}|^2\)은 운동량의 제곱으로 차원 \([\text{kg}^2\cdot\text{m}^2/\text{s}^2]\), \(m^2\)은 질량의 제곱으로 차원 \([\text{kg}^2]\). 각 항을 좌변의 차원 \([\text{kg}^2\cdot\text{m}^4/\text{s}^4]\)에 맞추려면——\(|\vec{p}|^2\)에는 \([\text{m}^2/\text{s}^2]\)가 부족하니 \(c^2\)를 곱하고, \(m^2\)에는 \([\text{m}^4/\text{s}^4]\)가 부족하니 \(c^4\)를 곱하면 돼. 따라서

\[ E^2 = |\vec{p}|^2 c^2 + m^2 c^4 \]

⚪ 메이: 노름의 불변성으로부터, 에너지와 운동량의 관계가 단번에 나오는 거네.

🔵 카이: \(\vec{p} = 0\)(정지)일 때 \(E^2 = m^2 c^4\), 즉 \(E = mc^2\)이 되는군요——\(E = mc^2\)은 이 식의 특수한 경우였군요! 그런데 잠깐만요. 반대로 \(m = 0\)을 넣으면 \(E = |\vec{p}|c\)로, 질량이 제로인데 에너지를 가질 수 있게 되지 않나요? 그게 이상하지 않아요?

🟡 리나: 좋은 질문이야. 맞아, 질량이 제로여도 에너지와 운동량을 가질 수 있어. 광자가 바로 그래. 이것은 조금 뒤의 섹션 2.7에서 자세히 다룰 테니, 조금만 기다려.

🔵 카이: 또, 아까 「저속에서 전개하면 \(E \approx m + \frac{1}{2}mv^2\)」라고 하셨잖아요. 뉴턴의 운동에너지가 나오는 것은 직감적으로 이해되는데, \(\gamma m\)에서 어떻게 그 근사가 나오는지 궁금해요. 그리고 4원운동량은 무엇에 쓸모가 있나요? 뉴턴 역학에서는 운동량 보존과 에너지 보존은 별개의 법칙이었는데……

🟡 리나: 저속 전개의 유도는 좋은 질문이야——다음 섹션(「저속 극한과 뉴턴 역학과의 접속」)에서 자세히 할 테니 잠깐 기다려. 먼저 「4원운동량이 무엇에 쓸모가 있는가」에 답해 둘게. 예를 들어 입자의 충돌이나 붕괴. 2개의 입자가 부딪쳐서 다른 입자가 생길 때, 반응 전후로 \(p^\mu_{\text{total}}\)이 보존돼——즉 에너지와 운동량이 동시에 보존돼. 뉴턴 역학에서는 운동량 보존과 에너지 보존이 별개의 법칙이었지만, 시간과 공간이 일체가 된 상대론에서는, 4원운동량 \(p^\mu = (E, \vec{p})\)이라는 하나의 4원벡터의 보존으로 통일되는 거야.

🔵 카이: 뉴턴 역학에서는 2개의 별개의 법칙이었던 것이, 상대론에서는 1개의 식으로 합쳐지는 거군요……. 그런데 잠깐, 뉴턴 역학에서는 운동량 보존이 작용·반작용 법칙에서 나왔잖아요. 상대론에서는 작용·반작용 법칙을 그대로 사용할 수 있다고는 할 수 없을 텐데, 4원운동량이 보존된다는 건 무엇으로부터 유도되나요?

🟡 리나: 좋은 질문이야. 제 1 장의 섹션 5에서 「대칭성과 보존량」의 관계를 봤었지——시간 병진 대칭성이 에너지 보존을, 공간 병진 대칭성이 운동량 보존을 보장한다고. 상대론에서는 시간과 공간이 일체가 되니까, 이 2개의 보존법칙도 시공의 병진 대칭성에 의한 4원운동량의 보존으로 통일돼. 엄밀한 유도는 뒤의 장에서 장이론의 맥락에서 다시 방문할게.

✅ 이해도 체크: \(E^2 = |\vec{p}|^2 c^2 + m^2 c^4\)로부터, 질량 제로인 입자(광자)에 대해 어떤 결론을 얻을 수 있을까요?

\(m = 0\)을 대입하면 \(E = |\vec{p}|c\)가 되어, 질량이 제로여도 에너지와 운동량을 가질 수 있다. 또한, 질량을 가진 입자의 속력은 \(v = |\vec{p}|c^2/E\)로 주어진다(\(\vec{p} = \gamma m\vec{v}\), \(E = \gamma mc^2\)로부터 유도 가능). \(m \to 0\)의 극한에서 \(E = |\vec{p}|c\)를 대입하면 \(v = |\vec{p}|c^2/(|\vec{p}|c) = c\)가 되므로, 질량 제로인 입자는 반드시 광속으로 운동한다.

저속 극한과 뉴턴 역학과의 접속

🔵 카이: 아까 리나 선생님이 「저속에서 전개하면 \(E \approx mc^2 + \frac{1}{2}mv^2\)」라고 결론만 말씀하셨잖아요. 이건 어떻게 유도하나요?

🟡 리나: 좋은 착안점이야. 실제로 계산해 보자. \(E = \gamma mc^2\)\(\gamma\)\(v \ll c\)에서 근사하면 돼. 고등학교에서 배우는 근사 공식 \((1 + x)^n \approx 1 + nx\)(\(|x| \ll 1\))를, \(x = -v^2/c^2\), \(n = -1/2\)에 적용하면,

\[ \gamma = \left(1 - \frac{v^2}{c^2}\right)^{-1/2} \approx 1 + \frac{1}{2}\frac{v^2}{c^2} \]

이것을 \(E = \gamma mc^2\)에 대입:

\[ E \approx \left(1 + \frac{1}{2}\frac{v^2}{c^2}\right)mc^2 = mc^2 + \frac{1}{2}mv^2 \]

⚪ 메이: 첫째 항이 정지에너지, 둘째 항이 뉴턴의 운동에너지. 깔끔하게 분리되네.

🟡 리나: 맞아. 그리고 중요한 것은, \(v \ll c\)일 때 둘째 항이 첫째 항에 비해 극히 작다는 거야. \(v = 100\,\text{m/s}\)(신칸센보다 약간 빠른 정도)라도 \(v^2/c^2 \sim 10^{-13}\)이니까, 정지에너지 \(mc^2\)에 비해 운동에너지는 13자릿수나 작아.

🔵 카이: 13자릿수나 차이가 나면, 뉴턴 시대에 알아차릴 수 있을 리가 없네요. 하지만 반대로 말하면, 핵반응에서 질량이 아주 조금만 줄어도 막대한 에너지가 나오는 건, 이 \(mc^2\)이 거대하기 때문인 건가요?

🟡 리나: 맞아. 일상적인 운동에서는 \(\frac{1}{2}mv^2\)만 눈에 보이고, 그 배후에 있는 거대한 \(mc^2\)은 완전히 숨겨져 있었어. 상대론이 「질량에는 에너지가 저장되어 있다」는 것을 밝혀내고 나서야, 핵반응——\(mc^2\)의 극히 일부를 방출하는 것만으로 막대한 에너지가 나오는——을 이해할 수 있게 된 거야.

질량 제로인 입자

🟡 리나: 그리고 또 하나 중요한 귀결. 질량 제로인 입자(광자)를 \(E^2 = |\vec{p}|^2 c^2 + m^2 c^4\)에 넣으면,

\[ E = |\vec{p}|\,c \]

질량이 제로여도 에너지와 운동량을 가질 수 있어. 그리고 \(E = \gamma mc^2\)에서 \(m = 0\)이면서 \(E \neq 0\)을 실현하려면 \(\gamma \to \infty\), 즉 \(v = c\)여야 해——질량 제로인 입자는 반드시 광속으로 운동한다. 광자도, 뒤의 장에서 등장하는 중력자(제 25 장에서 논의하는, 아직 미발견이지만 이론적으로 예상되는 입자)도, 이 관계를 만족한다고 생각돼.

✅ 이해도 체크: 4원속도 \(U^\mu\)의 불변 노름 \(\eta_{\mu\nu} U^\mu U^\nu\)의 값은 얼마인가요?

\(-1\)(\(c = 1\) 단위계). 속력에 관계없이 항상 일정하며, 이것은 고유시간의 정의로부터 자동적으로 따른다.

📝 연습문제:


4.3 위 첨자와 아래 첨자——공변벡터

첨자를 내리는 조작

🟡 리나: 여기까지 \(A^\mu\)(위 첨자) 이야기를 해왔는데, 아래 첨자 \(A_\mu\)도 도입할 필요가 있어. 정의는

\[ A_\mu \equiv \eta_{\mu\nu}\,A^\nu \]

🔵 카이: 계량 \(\eta_{\mu\nu}\)를 곱해서 축약하는 거군요. 구체적으로는 어떻게 되나요?

🟡 리나: \(\eta_{\mu\nu}\)는 대각행렬이고 \(\eta_{00} = -1\), \(\eta_{11} = \eta_{22} = \eta_{33} = 1\)이니까,

\[ A_0 = \eta_{0\nu}\,A^\nu = \eta_{00}\,A^0 = -A^0, \qquad A_1 = \eta_{1\nu}\,A^\nu = \eta_{11}\,A^1 = A^1 \]

마찬가지로 \(A_2 = A^2\), \(A_3 = A^3\). (여기서 \(\nu\)에 대해 합을 취하면, \(\eta_{1\nu}\)\(\nu = 1\) 이외에는 제로이니까 \(\eta_{11}\,A^1\)의 1항만 남아.)

⚪ 메이: 즉, 시간 성분만 부호가 반전되고, 공간 성분은 그대로. \(A^\mu = (A^0, A^1, A^2, A^3)\)이면 \(A_\mu = (-A^0, A^1, A^2, A^3)\).

🟡 리나: 맞아. 이 「첨자의 올리고 내리기」 관계를 그림 4.5「첨자의 올리고 내리기 조작」에 도식화해 둘게.

첨자의 올리고 내리기

그림 4.5: 첨자의 올리고 내리기 조작. 계량 \(\eta_{\mu\nu}\)를 곱해서 반변벡터 \(A^\mu\)로부터 공변벡터 \(A_\mu\)를 만든다(첨자를 내린다). 역행렬 \(\eta^{\mu\nu}\)로 되돌린다(첨자를 올린다). 민코프스키 계량에서는 시간 성분만 부호가 반전된다.

🟡 리나: \(A^\mu\)반변벡터 (contravariant vector), \(A_\mu\)공변벡터 (covariant vector)라고 불러. 「반변」「공변」이라는 이름은, 좌표변환에 대한 변환 규칙의 차이에서 유래해.

왜 두 종류의 벡터가 필요한가

위 첨자와 아래 첨자의 조합으로 축약하면, 로렌츠 불변인 스칼라량을 얻을 수 있다. \(A_0 = -A^0\), \(A_i = A^i\)(\(i = 1, 2, 3\))를 사용해서 실제로 전개하면,

\[A_\mu B^\mu = A_0 B^0 + A_1 B^1 + A_2 B^2 + A_3 B^3 = -A^0 B^0 + A^1 B^1 + A^2 B^2 + A^3 B^3\]

시간 성분만 마이너스가 남는 것은, \(A_0 = -A^0\)의 부호 반전 때문. 이것은 로렌츠 변환에서 값이 변하지 않는다. 이 「위아래 첨자를 조합해서 스칼라를 만드는」 구조가, 일반상대론 계산의 기본이 된다.

⚪ 메이: 아, 섹션 2.4에서 계산한 \(\eta_{\mu\nu}\,U^\mu\,U^\nu = -1\)은, 혹시 이 「첨자를 내리는」 조작과 관계가 있어?

🟡 리나: 좋은 눈치야. 바로 그래. \(\eta_{\mu\nu}\,U^\mu\,U^\nu\)는, \(\eta_{\mu\nu}\)\(U^\mu\)의 첨자를 내려서 \(U_\nu = \eta_{\nu\mu} U^\mu\)를 만들고, 그것과 \(U^\nu\)의 내적을 취한 것——즉 \(U_\nu\,U^\nu = U_\mu\,U^\mu\). 쓰는 방식은 다르지만, 전부 같은 계산이야(\(\eta_{\mu\nu} = \eta_{\nu\mu}\)이니까 첨자의 순서는 바꿔도 같아).

첨자를 올리는 조작

🟡 리나: 반대로, 아래 첨자를 위 첨자로 되돌리려면, \(\eta^{\mu\nu}\)(\(\eta_{\mu\nu}\)의 역행렬)를 사용해.

\[ A^\mu = \eta^{\mu\nu}\,A_\nu \]

민코프스키 계량의 경우, \(\eta^{\mu\nu}\)\(\eta_{\mu\nu}\)같은 행렬(대각 성분이 \(-1, 1, 1, 1\))이 돼.

🔵 카이: 왜 역행렬과 원래 행렬이 같은 건가요?

🟡 리나: \(\eta_{\mu\nu}\)는 대각행렬이고, 대각 성분이 \(-1, 1, 1, 1\)이야. 대각행렬의 역행렬은, 각 대각 성분의 역수를 나열한 대각행렬이야. \((-1)^{-1} = -1\), \(1^{-1} = 1\)이니까, 역행렬의 대각 성분도 \(-1, 1, 1, 1\)——원래와 같아져. 이것은 민코프스키 계량의 특별한 성질이고, 일반적인 계량 \(g_{\mu\nu}\)에서는 역행렬 \(g^{\mu\nu}\)이 원래와 다른 성분을 가져.

⚪ 메이: 자기 자신이 역행렬이라니, 어떤 의미에서 \(\eta_{\mu\nu}\)는 매우 다루기 쉬운 계량이네.

✅ 이해도 체크: 반변벡터 \(A^\mu = (A^0, A^1, A^2, A^3)\)으로부터 공변벡터 \(A_\mu\)를 만들면, 어떤 성분의 부호가 바뀌나요?

시간 성분만 부호가 반전된다. \(A_\mu = (-A^0, A^1, A^2, A^3)\). 이것은 \(\eta_{00} = -1\), \(\eta_{ii} = 1\)에 의한 것이다.


4.4 텐서의 초보

텐서란 무엇인가

🟡 리나: 드디어 텐서 (tensor)의 일반적인 이야기에 들어갈게. 실은 4원벡터도 「첨자가 1개인 텐서」(1계 텐서)야. 여기서는 「첨자가 2개」인 2계 텐서로 확장해서, 변환 규칙과 축약의 구조를 이해해 보자.

🔵 카이: \(\eta_{\mu\nu}\)도 첨자가 2개 있잖아요. 저것도 텐서인가요?

🟡 리나: 바로 그래. 섹션 2.3에서, 반변벡터는 \(V^{\mu'} = \Lambda^{\mu'}{}_{\nu}\,V^\nu\)——첨자가 1개이니 \(\Lambda\)가 1개 걸린다고 했었지. 그럼, 첨자가 2개인 양 \(T^{\mu\nu}\)는 어떻게 변환될까? 답은 단순해——첨자 하나당 \(\Lambda\)가 하나 걸린다. 첨자가 2개이니 \(\Lambda\)가 2개:

\[ T^{\mu'\nu'} = \Lambda^{\mu'}{}_{\alpha}\,\Lambda^{\nu'}{}_{\beta}\,T^{\alpha\beta} \]

이 변환 규칙의 구조를 그림 4.6「텐서의 좌표변환의 기하학적 이미지. 왼쪽: 같은 물리적 벡터 \(\mathbf{V}\)라도, 기저 \(\mathbf{e}_i\)(파랑)로 전개하느냐 \(\mathbf{e}'_i\)(빨강)로 전개하느냐에 따라 성분이 달라진다. 오른쪽: 반변·공변·2계 텐서의 변환 규칙」에 그림으로 나타내 둘게.

텐서의 좌표변환과 기저벡터

그림 4.6: 텐서의 좌표변환의 기하학적 이미지. 왼쪽: 같은 물리적 벡터 \(\mathbf{V}\)라도, 기저 \(\mathbf{e}_i\)(파랑)로 전개하느냐 \(\mathbf{e}'_i\)(빨강)로 전개하느냐에 따라 성분이 달라진다. 오른쪽: 반변·공변·2계 텐서의 변환 규칙——첨자 하나당 변환행렬(특수상대론에서는 로렌츠 변환 \(\Lambda\), 일반적으로는 좌표변환의 행렬 \(\partial x'^\mu/\partial x^\nu\))이 하나 걸린다. 물리량 자체는 좌표계에 의존하지 않으므로, 성분의 변환 규칙은 「같은 것을 다른 좌표에서 보면 어떻게 달라지는가」를 기술하고 있다.

🔵 카이: 아, 패턴이 보여요(그림 4.6「텐서의 좌표변환의 기하학적 이미지. 왼쪽: 같은 물리적 벡터 \(\mathbf{V}\)라도, 기저 \(\mathbf{e}_i\)(파랑)로 전개하느냐 \(\mathbf{e}'_i\)(빨강)로 전개하느냐에 따라 성분이 달라진다. 오른쪽: 반변·공변·2계 텐서의 변환 규칙」의 오른쪽이 바로 그거네요). 1계(벡터)는 \(\Lambda\)가 1개, 2계는 2개. 3계면 3개……. 즉 벡터 때와 마찬가지로, 텐서 자체는 좌표계에 의존하지 않는 물리량이고, 성분만 좌표의 잡는 방법에 따라 변하는 거군요. 그런데, 패턴은 보이는데, \(\Lambda\)가 2개 걸린다는 게 구체적으로 어떤 계산인지 아직 이미지가 안 잡혀요. 전개해서 보여주실 수 있나요?

✅ 이해도 체크: 2계 텐서 \(T^{\mu\nu}\)의 변환 규칙에서 \(\Lambda\)가 2개 필요한 이유는 무엇인가요?

\(T^{\mu\nu}\)에는 첨자가 2개(\(\mu\)\(\nu\)) 있고, 관성계를 바꿀 때 각각의 첨자를 독립적으로 변환할 필요가 있다. 첫 번째 첨자의 변환에 \(\Lambda\)가 1개, 두 번째 첨자의 변환에 또 하나, 합계 2개가 필요하다. \(\Lambda\)가 1개뿐이면 한쪽 첨자만 변환되어 중도반단이 된다.

🟡 리나: 좋아. \(T^{\mu'\nu'} = \Lambda^{\mu'}{}_{\alpha}\,\Lambda^{\nu'}{}_{\beta}\,T^{\alpha\beta}\)를 읽어보자. 먼저, \(\alpha\)\(\beta\)가 더미 첨자(위아래에 나타나니까 합을 취한다). 즉 이 식은

\[ T^{\mu'\nu'} = \sum_{\alpha=0}^{3}\sum_{\beta=0}^{3} \Lambda^{\mu'}{}_{\alpha}\,\Lambda^{\nu'}{}_{\beta}\,T^{\alpha\beta} \]

의 축약형이야. \(4 \times 4 = 16\)항의 합.

🔵 카이: 1계 때는 \(V^{\mu'} = \sum_{\nu} \Lambda^{\mu'}{}_{\nu} V^\nu\)로 4항의 합이었으니까, 첨자가 하나 늘 때마다 합이 한 겹 늘어나는 거군요.

🟡 리나: 맞아. 예를 들어 \(\mu' = 0\), \(\nu' = 1\)의 성분을 알고 싶으면, \(\alpha\)\(\beta\)를 각각 0에서 3까지 달리게 해서 전체 16항을 더해 올려. 다만 \(x\) 방향 부스트의 \(\Lambda\)(「변위 4원벡터」에서 쓴 행렬을 봐)에서는, \(y, z\) 방향에 관련된 성분 \(\Lambda^{0'}{}_{2} = \Lambda^{0'}{}_{3} = \Lambda^{1'}{}_{2} = \Lambda^{1'}{}_{3} = 0\)(행렬의 \(\mu' = 0\) 행과 \(\mu' = 1\) 행에서, \(\nu = 2, 3\) 열이 제로)이니까, \(\alpha, \beta = 0, 1\)인 4항만 살아남아:

\[ T^{0'1'} = \Lambda^{0'}{}_{0}\,\Lambda^{1'}{}_{0}\,T^{00} + \Lambda^{0'}{}_{0}\,\Lambda^{1'}{}_{1}\,T^{01} + \Lambda^{0'}{}_{1}\,\Lambda^{1'}{}_{0}\,T^{10} + \Lambda^{0'}{}_{1}\,\Lambda^{1'}{}_{1}\,T^{11} \]

일반적인 로렌츠 변환(회전을 포함하는 경우 등)에서는 16항 전부 남는 경우도 있지만, 구조는 같아——1계의 벡터 변환을 「2번 반복하는」 이미지야.

🔵 카이: 즉, \(S\)계의 성분 \(T^{\alpha\beta}\)\(\Lambda\)를 2개 곱해서 계산한 값이, \(S'\)계에서 실제로 측정한 \(T^{\mu'\nu'}\)와 일치한다——그것이 텐서의 조건이라는 거죠?

🟡 리나: 바로 그래. 섹션 2.3에서 「\(\Lambda\)를 곱해서 올바른 답이 나오는 양이 반변벡터」라고 한 것과 같은 구조야. \(\Lambda\)를 2개 곱해서 올바른 답이 나오는 양이 2계 반변 텐서.

🔵 카이: 왜 \(\Lambda\)2번 곱하나요? 1번이면 안 되나요?

🟡 리나: \(T^{\mu\nu}\)에는 첨자가 2개 있잖아. \(\mu\)\(\nu\). 관성계를 바꿀 때, 각각의 첨자를 독립적으로 변환할 필요가 있어. 첫 번째 첨자 \(\mu\)를 변환하는 데 \(\Lambda\)가 1개, 두 번째 첨자 \(\nu\)를 변환하는 데 또 1개. 그래서 합계 2개.

🔵 카이: 아, 그렇구나. 만약 \(\Lambda\)를 1번만 곱으면, 한쪽 첨자만 \(S'\)계로 변환되고, 다른 쪽은 \(S\)계 그대로——중도반단한 상태가 되는 거군요. 구체적인 예로 보여주실 수 있나요?

🟡 리나: 좋아. 가장 알기 쉬운 2계 텐서는, 2개의 벡터 성분을 모든 조합으로 곱한 \(T^{\mu\nu} = A^\mu B^\nu\)야. 예를 들어 \(T^{01} = A^0 B^1\), \(T^{23} = A^2 B^3\)처럼, \(4 \times 4 = 16\)개의 성분을 가지는 양. \(S'\)계에서는 \(A^{\mu'} = \Lambda^{\mu'}{}_{\alpha} A^\alpha\), \(B^{\nu'} = \Lambda^{\nu'}{}_{\beta} B^\beta\)이니까,

\[ T^{\mu'\nu'} = A^{\mu'} B^{\nu'} = \left(\Lambda^{\mu'}{}_{\alpha} A^\alpha\right)\left(\Lambda^{\nu'}{}_{\beta} B^\beta\right) = \Lambda^{\mu'}{}_{\alpha}\,\Lambda^{\nu'}{}_{\beta}\,A^\alpha B^\beta = \Lambda^{\mu'}{}_{\alpha}\,\Lambda^{\nu'}{}_{\beta}\,T^{\alpha\beta} \]

\(A\)를 변환하는 데 \(\Lambda\)가 1개, \(B\)를 변환하는 데 또 1개. 합쳐서 2개. 만약 \(\Lambda\)를 1번만 곱으면, \(A\)\(S'\)계로 변환되고 \(B\)\(S\)계 그대로——\(A^{\mu'} B^{\nu}\)라는 의미 없는 양이 되어 버려.

⚪ 메이: 2개 벡터의 곱으로 생각하면, \(\Lambda\)가 2개 필요한 이유가 정말 명쾌하네.

🟡 리나: 벡터 \(V^\mu\)는 첨자가 1개이니 \(\Lambda\)는 1번. 텐서 \(T^{\mu\nu}\)는 첨자가 2개이니 2번. 첨자의 수 = \(\Lambda\)의 수, 이것이 텐서 변환 규칙의 본질이야. 이 변환 규칙을 따르는 양을 텐서라고 부르며, 계수 (rank)는 첨자의 수로 결정돼.

표 4.2: 텐서의 계수·첨자 수·변환 규칙의 대응

계수 첨자 수 \(\Lambda\)의 수 이름
0 0 0 스칼라(불변량) \(ds^2\), \(m\)
1 1 1 4원벡터 \(V^\mu\), \(U^\mu\), \(p^\mu\)
2 2 2 2계 텐서 \(\eta_{\mu\nu}\), \(T^{\mu\nu}\)

🔵 카이: 그런데, 왜 이 조건이 중요한 건가요?

🟡 리나: 섹션 2.3에서 벡터에 대해 이야기한 것과 같은 이유야. 성분의 수치는 관성계마다 변하지만, 물리적 내용은 변하지 않아. 변환식은 「같은 물리량을 다른 관성계에서 본 성분의 환산 규칙」이야. 텐서로 방정식을 쓰면, 모든 관성계에서 같은 형태가 돼——이것이 일반상대론의 기본이야.

🔵 카이: 그런데, \(\eta_{\mu\nu}\)가 텐서라고 말하려면, 무엇을 확인하면 되나요?

🟡 리나: 엄밀히는, \(\eta_{\mu\nu}\)는 아래 첨자 2개의 공변 텐서이니까, 변환 규칙은 반변의 경우와 약간 달라——\(\Lambda\) 대신에 \(\Lambda\)역행렬 \(\Lambda^{-1}\)이 2개 걸리는 형태가 돼. 반변 텐서(위 첨자)가 \(\Lambda\)로 변환되는 데 대해, 공변 텐서(아래 첨자)는 \(\Lambda^{-1}\)로 변환돼——꼭 반변벡터와 공변벡터의 관계와 같은 구조야. 구체적인 변환식과 계산은 연습문제로 돌릴게(→ 문제 M-2. Lorentz 변환에 의한 계량의 보존 조건). 결론만 말하면, \(\eta_{\mu'\nu'}\)를 계산하면 원래의 \(\eta_{\mu\nu}\)와 같은 값이 나와——즉 민코프스키 계량은 모든 관성계에서 같은 성분을 가져. 반변과 공변에서 변환이 역방향이 되는 이유는, 섹션 4.4에서 「위아래 쌍에서 \(\Lambda\)\(\Lambda^{-1}\)이 상쇄된다」는 부분에서 자세히 볼게. 여기서는, \(\eta_{\mu\nu}\)가 가지는 매우 특별한 성질을 봐보자.

\(\eta_{\mu\nu}\)는 모든 관성계에서 같다

\(S\)계에서

\[ ds^2 = \eta_{\mu\nu}\,dx^\mu\,dx^\nu = -(dt)^2 + (dx)^2 + (dy)^2 + (dz)^2 \]

\(S'\)계에서도 광속 불변으로부터 같은 형태가 성립한다:

\[ ds'^2 = -(dt')^2 + (dx')^2 + (dy')^2 + (dz')^2 \]

🔵 카이: \(S'\)계에서도 계수가 \((-1, 1, 1, 1)\) 그대로……즉 \(\eta_{\mu'\nu'}\)도 대각 성분이 \((-1, 1, 1, 1)\)인 행렬——\(S\)계와 같네요. 그런데 잠깐만요. 텐서는 「좌표변환에서 성분이 변하는 양」이잖아요? 그런데 성분이 변하지 않는다니, 모순 아닌가요?

🟡 리나: 좋은 의문이야. 먼저 하나 정정할게——텐서의 정의는 「성분이 변하는 양」이 아니라, 「특정한 변환 규칙을 따르는 양」이야. 변환 규칙을 따라 계산한 결과, 성분이 변하는 경우도 있고, 우연히 원래와 같은 값이 되는 경우도 있어. \(\eta_{\mu\nu}\)는 후자인데, 이것은 우연이 아니라, 로렌츠 변환의 정의 그 자체에서 오는 거야. 제 3 장에서, 로렌츠 변환을 「\(ds^2\)을 보존하는 변환」으로 정의했었지. \(ds^2 = \eta_{\mu\nu}\,dx^\mu\,dx^\nu\)가 불변이라는 것은, 변환 후에도 같은 \(\eta\)의 성분으로 쓸 수 있다는 것이야. 즉 민코프스키 계량의 성분은, 모든 관성계에서 대각 성분 \((-1, 1, 1, 1)\) 그대로——이것은 로렌츠 변환의 정의로부터 필연적으로 따르는 성질이야.

⚪ 메이: 즉 「\(ds^2\)을 보존하는 변환」으로 로렌츠 변환을 정의했으니, 그 변환에서 계량이 불변이 되는 것은 당연해——동어반복에 가까운 거네.

🟡 리나: 다만, 이것은 특수상대론(평탄한 시공)에서만의 성질이야. 일반상대론에서는, 계량 \(g_{\mu\nu}\)는 좌표변환에서 성분이 변해——그것이 「시공이 휘어져 있다」는 것의 수학적 표현이야.

축약 — 위아래 첨자를 맞춰서 더하기

🟡 리나: 뒤의 장에서 자주 사용하는 조작을 소개할게. 텐서의 계수를 낮추는 조작——이것을 축약 (contraction)이라고 불러. 제 12 장에서는 4계 텐서로부터 2계 텐서를 만들고, 나아가 스칼라를 만들어——이 「계수를 낮추는」 조작이 아인슈타인 방정식의 구축에 필수가 돼.

🔵 카이: 4계 텐서라니, 아직 나중 이야기잖아요? 지금 우리에게도 관계가 있나요?

🟡 리나: 실은, 여러분은 이미 이 조작을 사용한 적이 있어——이름을 몰랐을 뿐이야.

🔵 카이: 에, 어디서요?

🟡 리나: 섹션 3.1에서 나온 내적

\[ A_\mu B^\mu = A_0 B^0 + A_1 B^1 + A_2 B^2 + A_3 B^3 \]

이것이 축약의 가장 기본적인 예야. 위 첨자 \(\mu\)(\(B^\mu\))와 아래 첨자 \(\mu\)(\(A_\mu\))가 쌍으로 나타나서, \(\mu = 0, 1, 2, 3\)을 대입해서 더하는——이 조작을 「\(\mu\)에 대해 축약한다」고 말해.

⚪ 메이: 아, 그렇구나. 섹션 1.3에서 배운 아인슈타인 축약 규칙(같은 첨자가 위아래에 나타나면 \(\sum\)을 생략한다)을, 의미 있는 조작으로 다시 파악한 것이네.

🟡 리나: 맞아. 표기법으로서의 규칙(섹션 1.3)과, 조작으로서의 축약(지금 하고 있는 것)은 같은 \(\sum\)의 계산을 가리키지만, 시점이 달라——전자는 「쓰는 방법의 약속」, 후자는 「텐서에 대한 연산」.

용어 정리: 「축약 규칙」과 「축약」

  • 아인슈타인 축약 규칙 (convention): \(\sum\)을 생략하는 표기법의 약속
  • 텐서의 축약 (contraction): 위아래 첨자를 쌍으로 맞춰 합을 취함으로써 계수를 낮추는 연산

이름이 비슷하지만, 한쪽은 쓰는 방법, 다른 쪽은 조작. 다만 계산 내용은 같은 \(\sum\).

벡터 2개의 경우(내적)

🟡 리나: 내적 \(A_\mu B^\mu\)에서, 축약이 무엇을 하고 있는지 그림으로 봐보자. 첨자 \(\mu\)가 0, 1, 2, 3으로 달리니까, \(A\)의 성분과 \(B\)의 성분의 조합은 전부 \(4 \times 4 = 16\)가지가 있어:

\[ \begin{array}{c|cccc} & B^0 & B^1 & B^2 & B^3 \\ \hline A_0 & \underline{A_0 B^0} & A_0 B^1 & A_0 B^2 & A_0 B^3 \\ A_1 & A_1 B^0 & \underline{A_1 B^1} & A_1 B^2 & A_1 B^3 \\ A_2 & A_2 B^0 & A_2 B^1 & \underline{A_2 B^2} & A_2 B^3 \\ A_3 & A_3 B^0 & A_3 B^1 & A_3 B^2 & \underline{A_3 B^3} \end{array} \]

축약 \(A_\mu B^\mu\)는, 이 16개의 조합 중 「대각 성분」의 4개(밑줄 부분)만 더하는 조작:

\[ A_\mu B^\mu = A_0 B^0 + A_1 B^1 + A_2 B^2 + A_3 B^3 \]

🔵 카이: 16개 중 4개만 골라서 더하는 거군요. 대각선을 뽑아내는 이미지야.

2계 텐서의 경우

🟡 리나: 다음으로, 대상을 2계 텐서로 넓혀 보자. \(T^\mu{}_\nu\)(첨자 2개, 16 성분)에서, \(\nu\)\(\mu\)와 같은 문자로 해서 \(T^\mu{}_\mu\)라고 쓰면——위와 아래에 같은 \(\mu\)가 나타나니까, 섹션 1.3의 축약 규칙으로 합을 취해:

\[ T^\mu{}_\mu = T^0{}_0 + T^1{}_1 + T^2{}_2 + T^3{}_3 \]

\(\mu\)를 0, 1, 2, 3으로 달리게 해서 대각 성분 4개만 더해. 이것은 행렬의 대각합 (trace) 그 자체야.

⚪ 메이: 구조는 내적 때와 완전히 같네. 대상이 「벡터 \(A\)와 벡터 \(B\)」에서 「하나의 2계 텐서 \(T\)」로 바뀌었을 뿐, 「위아래 쌍의 첨자를 달리게 해서 합을 취하는」 조작은 공통이야.

🟡 리나: 맞아. 연산 자체는 하나로 통합돼. 그럼, 이 통일적인 관점을 조금 더 깊이 파보자.

축약의 일반 정의

축약 (contraction): 텐서에 위 첨자와 아래 첨자가 하나씩 있을 때, 양쪽을 같은 문자로 하고 \(0, 1, 2, 3\)을 대입하여 합을 취하는 조작. 위아래 1쌍의 첨자가 사라지므로, 계수는 2 낮아진다.

표 4.3: 축약 조작의 구체적 예와 결과의 계수

원래 텐서 축약의 표기 결과
\(A_\mu\)\(B^\mu\)(벡터 2개) \(A_\mu B^\mu\) 스칼라(0계) = 내적
\(T^\mu{}_\nu\)(2계 텐서 1개) \(T^\mu{}_\mu\) 스칼라(0계) = 대각합 (trace)
\(R^\rho{}_{\sigma\mu\nu}\)(4계 텐서, 제 12 장에서 등장) \(R^\mu{}_{\sigma\mu\nu} = R_{\sigma\nu}\) 2계 텐서(리치 텐서)

🔵 카이: 같은 「첨자 쌍으로 더하기」일 뿐인데, 대상에 따라 「내적」 「대각합」 「리치 텐서」라고 다른 이름이 붙는군요.

🟡 리나: 이름은 역사적 사정으로 다르지만, 조작은 통일돼 있어. 이것이 첨자 표기법의 강점이야——어떤 텐서에도 같은 규칙으로 축약을 적용할 수 있어.

축약의 규칙: 왜 위아래 쌍이어야 하는가

🔵 카이: 하나 질문이요. 위와 아래 첨자로 쌍을 만든다고 하는데, 위끼리나 아래끼리는 안 되나요? 예를 들어 \(A^\mu B^\mu\)처럼 「둘 다 위」로 덧셈해도 같은 거 아닌가——

🟡 리나: 그건 안 돼. 이유는 결과가 스칼라가 되지 않기 때문이야——즉 관성계를 바꾸면 값이 변해 버리니까.

구체적으로 봐보자. 섹션 3.1에서 배운 것처럼, 위 첨자 성분과 아래 첨자 성분의 관계는 \(A_\mu = \eta_{\mu\nu} A^\nu\)로, 시간 성분만 부호가 반전됐었지: \(A_0 = -A^0\), \(A_i = A^i\). 거기서, 만약 \(A^\mu B^\mu\)처럼 둘 다 위 첨자로 무리하게 \(\mu = 0, 1, 2, 3\)에서 더했다고 하면

\[ A^0 B^0 + A^1 B^1 + A^2 B^2 + A^3 B^3 \quad \text{(전부 플러스 부호)} \]

한편, 올바른 축약 \(A_\mu B^\mu\)

\[ A_\mu B^\mu = A_0 B^0 + A_1 B^1 + A_2 B^2 + A_3 B^3 = -A^0 B^0 + A^1 B^1 + A^2 B^2 + A^3 B^3 \]

시간 성분만 마이너스. 이 마이너스 부호야말로 로렌츠 불변성의 열쇠야.

⚪ 메이: 잠깐. 왜 그 마이너스 부호가 로렌츠 불변성과 관계가 있어?

🟡 리나: 공간 회전과 부스트를 나눠서 생각해 봐.

  • 공간 회전: 시간 성분 \(A^0, B^0\)은 움직이지 않고, 공간 3성분만 뒤섞여. 피타고라스 정리와 같아서 \(A^i B^i = A^1 B^1 + A^2 B^2 + A^3 B^3\)은 회전에서 불변.
  • 부스트: 시간축과 공간축(예를 들어 \(x\)축)이 뒤섞여(제 3 장의 섹션 3.7의 쌍곡선 회전).

🔵 카이: 부스트 때 \(-A^0 B^0 + A^1 B^1\)이 불변이 되는 건, 어떻게 확인하나요?

🟡 리나: 제 3 장의 섹션 3.7에서 본 것처럼, 부스트는 래피디티 \(\varphi\)(\(\tanh\varphi = v\))를 사용해서 \(t' = t\cosh\varphi - x\sinh\varphi\), \(x' = -t\sinh\varphi + x\cosh\varphi\)라는 형태였지. 반변벡터 \(A^\mu\)에도 같은 변환이 걸리니까, \(A^{0'} = A^0\cosh\varphi - A^1\sinh\varphi\), \(A^{1'} = -A^0\sinh\varphi + A^1\cosh\varphi\)(\(B^\mu\)도 마찬가지). \(y, z\) 성분은 변하지 않으므로 생략하고, \(A_\mu B^\mu = -A^0 B^0 + A^1 B^1\)이 불변인지 확인하고 싶어. 변환 후의 \(-A^{0'}B^{0'} + A^{1'}B^{1'}\)에 대입해 보면, 예를 들어 \(A^{0'}B^{0'}\) 부분은

\[ A^{0'}B^{0'} = (A^0\cosh\varphi - A^1\sinh\varphi)(B^0\cosh\varphi - B^1\sinh\varphi) \]

마찬가지로 \(A^{1'}B^{1'} = (-A^0\sinh\varphi + A^1\cosh\varphi)(-B^0\sinh\varphi + B^1\cosh\varphi)\)를 전개해서, \(-A^{0'}B^{0'} + A^{1'}B^{1'}\)를 계산하면, \(A^0 B^0\)의 항은 \(-\cosh^2\varphi + \sinh^2\varphi = -(\cosh^2\varphi - \sinh^2\varphi) = -1\)배, \(A^1 B^1\)의 항은 \(-\sinh^2\varphi + \cosh^2\varphi = +(\cosh^2\varphi - \sinh^2\varphi) = +1\)배, 교차항(\(A^0 B^1\)이나 \(A^1 B^0\)을 포함하는 항)은 \(+\cosh\varphi\sinh\varphi - \cosh\varphi\sinh\varphi = 0\)으로 상쇄돼——모두 제 3 장의 섹션 3.6의 항등식 \(\cosh^2\varphi - \sinh^2\varphi = 1\) 덕분이야. 결과는 \(-A^0 B^0 + A^1 B^1\)——원래와 같은 값이지. 완전한 전개 계산은 연습문제 → 문제 A-2. 일반 방향의 Lorentz 부스트에서 확인해 봐.

🔵 카이: 즉, \(\cosh^2 - \sinh^2 = 1\)이 「시간의 마이너스 부호」와 결합해서 불변성을 보장하는 거군요.

🔵 카이: 반대로, 전부 플러스로 \(A^0 B^0 + A^1 B^1 + \cdots\)으로 하면 어떻게 되나요?

🟡 리나: 부스트로 \(\cosh^2\varphi + \sinh^2\varphi \neq 1\)이 되어 값이 변해 버려. 시간 성분의 마이너스 부호는, \(ds^2 = -c^2 dt^2 + dx^2 + \cdots\)의 부호 패턴과 같은 기원——민코프스키 계량의 성질 그 자체야.

🔵 카이: 제 3 장의 섹션 2의 \(ds^2\)과 같은 구조군요. 시간과 공간의 부호가 다르기 때문에, 광속 불변이 보장되는 거야. ……그러면, 만약 우주가 유클리드적(전부 플러스 부호)이었다면, 위아래 구별 같은 건 필요 없었다는 건가요?

🟡 리나: 날카롭네. 맞아——만약 계량이 단위행렬 \(\delta_{\mu\nu}\)(전부 플러스)라면, 위 첨자와 아래 첨자의 구별은 불필요하고, \(A^\mu B^\mu\)로도 불변량이 돼. 민코프스키 시공에서 위아래 구별이 필요한 것은, 바로 시간과 공간의 부호가 다르기 때문이야. 좀 더 일반적으로 말하면, 로렌츠 변환을 \(\Lambda\), 그 역행렬을 \(\Lambda^{-1}\)이라 쓰면,

  • 위 첨자 벡터 \(B^\mu\)\(\Lambda\)로 변환된다: \(B^{\mu'} = \Lambda^{\mu'}{}_{\nu} B^\nu\)
  • 아래 첨자 벡터 \(A_\mu\)\((\Lambda^{-1})^T\)로 변환된다: \(A_{\mu'} = (\Lambda^{-1})^{\nu}{}_{\mu'} A_\nu\)

구체적인 첨자 붙인 변환식은 뒤의 장에서 유도하니까, 지금은 「반변벡터가 \(\Lambda\)로 변환되는 데 반해, 공변벡터는 \(\Lambda\)의 역행렬의 전치로 변환된다——즉 역방향의 변환을 받는다」고만 기억해 둬.

🔵 카이: \(\Lambda\)\(\Lambda^{-1}\)로 역방향으로 변환된다……즉, 위와 아래를 쌍으로 곱하면 변환이 상쇄된다는 건가요?

🟡 리나: 바로 그래. 직감적인 이유는 이거야——\(A_\mu B^\mu\)는 시공간격과 같은 구조의 스칼라(불변량)이니까, \(B^\mu\)\(\Lambda\)로 변환된다면, \(A_\mu\)\(\Lambda\)의 역행렬로 변환되어야 곱이 불변이 돼. 수치의 비유로 말하면 「\(2 \times \frac{1}{2} = 1\)」처럼 상쇄될 필요가 있어. 좀 더 구체적으로 말하면——\(B^{\mu'} = \Lambda^{\mu'}{}_{\nu} B^\nu\)\(B\)의 성분이 뒤섞일 때, \(A_{\mu'}\) 쪽은 역방향으로 뒤섞여서, 곱해서 더했을 때(축약했을 때) \(\Lambda\)의 효과가 상쇄돼. 그래서 \(A_\mu B^\mu\)라는 위아래 쌍으로 조합하면, 변환행렬이 상쇄되어, 결과가 스칼라(불변량)가 돼. 위끼리면 \(\Lambda\)가 2번 걸려서 상쇄되지 않고, 아래끼리면 역행렬이 2번 걸려서 상쇄되지 않아——어쪽이든 로렌츠 변환에서 값이 변해 버려.

왜 반변(위)과 공변(아래)에서 변환이 역방향인가

직관적으로 설명하면, 좌표 \(dx^\mu\)(위 첨자)가 「2배」가 되는 변환을 생각했을 때, 같은 물리량을 나타내는 공변벡터 \(A_\mu\)의 성분은 「1/2배」가 되어야 내적 \(A_\mu\,dx^\mu\)가 같은 값을 유지할 수 있다. 그래서 \(dx^\mu\)\(A_\mu\)는 역방향으로 변환된다. 엄밀한 유도는 참고문헌(이시이 『일반상대성이론을 한 걸음 한 걸음 수식으로 이해하기』§3 등)을 참조.

⚪ 메이: 즉 「위아래 쌍」이라는 축약의 규칙은, 단순한 표기법의 약속이 아니라, 로렌츠 불변성이라는 물리를 보장하기 위한 필수 조건인 거네. 첨자의 위아래는, 제대로 의미가 있어서 나뉘어져 있어.

🟡 리나: 맞아. 첨자 표기법은 「이렇게 쓰면 자동적으로 로렌츠 불변이 된다」는 물리의 보증을 컴팩트하게 표현한 표기법——이것이 상대론 계산에서 첨자 표기법이 절대적으로 편리한 이유야.

내적과 축약의 통일적 이해

⚪ 메이: 즉, 아까 리나가 「여러분은 이미 이 조작을 사용한 적이 있다」고 한 것은, 내적 \(A_\mu B^\mu\)가 바로 축약이었으니까——둘 다 「위아래 첨자가 일치하는 4가지만 골라서 더하는」 같은 조작이네. 하지만, 내적은 「2개의 벡터」에 대한 조작이고, 아까의 대각합(trace)은 「1개의 텐서」에 대한 조작이잖아? 정말로 같다고 할 수 있어?

🟡 리나: 좋은 의문이야. 실은, 2개의 벡터 \(A_\mu\)\(B^\nu\)의 성분끼리를 모두 곱하면, \(4 \times 4 = 16\)개의 성분을 가지는 2계 텐서를 만들 수 있어——이것을 텐서곱 (tensor product)이라고 불러. \(A_\mu B^\nu\)라고 쓰고, 예를 들어 \((\mu, \nu) = (0, 1)\) 성분은 \(A_0 B^1\)처럼, 모든 조합을 나열한 양이야. 「텐서란 무엇인가」에서 카이가 본 「\(T^{\mu\nu} = A^\mu B^\nu\)」와 같은 구조——그때 변환 규칙을 만족하는 것을 확인했었지. 그 대각 성분을 더하면(\(\mu = \nu\)로 축약하면) 내적 \(A_\mu B^\mu\)가 돼. 즉 보이는 모습이 다를 뿐, 조작은 통일돼 있어.

🔵 카이: 그렇구나, 텐서곱→축약으로 내적이 된다. 전부 연결되어 있군요.

🟡 리나: 일반적으로, \(n\)계 텐서를 1번 축약하면 \((n-2)\)계 텐서가 돼:

  • 내적: 계수 \(1 + 1 = 2\) → 축약 후 0(스칼라)
  • 2계 텐서의 대각합: 계수 \(2\) → 축약 후 0(스칼라)
  • 리만 텐서 → 리치: 계수 \(4\) → 축약 후 2
  • 리치 → 스칼라 곡률: 계수 \(2\) → 축약 후 0

이 「계수를 2 낮추는」 구조가, 제 12 장에서 곡률 텐서로부터 스칼라 곡률을 만들 때 활약할 거야.

✅ 이해도 체크: 축약이 「위 첨자와 아래 첨자의 쌍」이어야 하는 이유를 한마디로 말해 주세요.

위아래 쌍으로 축약하면 변환행렬 \(\Lambda\)와 역행렬 \(\Lambda^{-1}\)이 상쇄되어 로렌츠 불변량(스칼라)이 되기 때문이다. 위끼리·아래끼리에서는 상쇄되지 않아, 관성계를 바꾸면 값이 변해 버린다.

📝 연습문제:


4.5 정리——민코프스키 시공의 전체 모습

🟡 리나: 이 장에서 구축한 틀을 정리하자.

⚪ 메이: 출발점은 두 개의 공리——상대성 원리와 광속 불변의 원리. 거기서 시공간격

\[ ds^2 = \eta_{\mu\nu}\,dx^\mu\,dx^\nu = -dt^2 + dx^2 + dy^2 + dz^2 \]

이 불변량임이 유도됐어.

🔵 카이: 불변량을 보존하는 좌표변환이 로렌츠 변환. 공간의 회전이 「거리를 보존하는 변환」이었던 것과 같은 구조.

🟡 리나: 그리고, 로렌츠 변환 하에서 올바르게 변환되는 양——4원벡터나 텐서——을 사용해서 물리의 모델을 쓰면, 어느 관성계에서도 같은 형태의 방정식이 된다. 이것이 공변성이야.

⚪ 메이: 이 장에서 손에 넣은 도구를 정리하면——

표 4.4: 특수상대론의 기본 도구 정리

도구 내용
시공간격 \(ds^2\) \(-dt^2 + dx^2 + dy^2 + dz^2\). 모든 관성계에서 불변인 스칼라
로렌츠 변환 \(ds^2\)을 보존하는 좌표변환. \(t' = \gamma(t - vx)\), \(x' = \gamma(x - vt)\)
민코프스키 계량 \(\eta_{\mu\nu}\) 대각 성분 \((-1, 1, 1, 1)\)의 행렬. 평탄한 시공의 「거리 측정 방법」
4원벡터 \(A^\mu\) 로렌츠 변환에서 \(A^{\mu'} = \Lambda^{\mu'}{}_{\nu}A^\nu\)를 따르는 양
4원속도 \(U^\mu\) \(\gamma(1, v^x, v^y, v^z)\). 불변 노름 \(U_\mu U^\mu = -1\)
4원운동량 \(p^\mu\) \((E, \vec{p})\). 불변 노름 \(p_\mu p^\mu = -m^2\). $E^2 =
첨자의 올리고 내리기 \(A_\mu = \eta_{\mu\nu}A^\nu\). 시간 성분의 부호가 반전
아인슈타인 축약 규칙 위아래에 같은 첨자 → 합을 취한다(\(\sum\) 생략)

⚪ 메이: 민코프스키 계량 \(\eta_{\mu\nu}\)평탄한 시공의 계량이지. 섹션 1에서 리나가 말한 것처럼, 일반상대론에서는 이것이 장소에 따라 변하는 \(g_{\mu\nu}\)로 바뀌는 거였어.

🟡 리나: 맞아. 그리고 그것이 「시공이 휘어진다」는 것의 수학적 표현이야. 다음 장에서는 바로, 가속도와 중력의 동치성——등가 원리 (equivalence principle)——를 논의해서, 「왜 계량이 장소에 따라 변하는가」로의 길을 열 거야.


다음 장 예고

제 5 장에서는, 아인슈타인의 등가 원리 (equivalence principle)를 다룬다. 「등가 원리 — 가속과 중력의 동치성」이라는 제목으로, 엘리베이터 사고실험을 통해 「가속도와 중력장은 국소적으로 구별할 수 없다」는 것을 이해하고, 이것이 「시공의 계량 \(g_{\mu\nu}\)가 장소에 따라 변한다」——즉 시공이 휘어진다——는 것으로의 첫걸음임을 살펴본다.


참고문헌

  • Hartle, J. B. Gravity: An Introduction to Einstein's General Relativity, Chapters 4–5. Addison-Wesley, 2003.
  • Schutz, B. F. A First Course in General Relativity, 3rd ed., Chapters 1–3. Cambridge University Press, 2022.
  • 佐藤勝彦『相対性理論』岩波基礎物理シリーズ, 第 1–5 章. 岩波書店, 1996.
  • 石井俊全『一般相対性理論を一歩一歩数式で理解する』第 8–9 章. ベレ出版, 2013.
  • Lancaster, T. and Blundell, S. J. General Relativity for the Gifted Amateur, Chapters 1–2. Oxford University Press, 2014.