콘텐츠로 이동

제3장 특수상대론 — Lorentz 변환과 물리적 귀결

지금까지의 이야기: 제 1 장에서 Newton 중력 모델의 성공과 한계——수성의 근일점 이동의 43″/세기 어긋남과, Poisson 방정식에 시간 미분이 없어 중력이 순간적으로 전달된다는 구조적 문제——를 살펴보았다. 제 2 장에서는 "좌표계에 의존하지 않는 물리 법칙을 만든다"는 설계도를 펼쳐, 텐서라는 도구와, 중력을 시공간의 휘어짐으로 기술한다는 전체 그림을 조감했다. 그리고 이 장부터, 그 설계도를 구체적으로 한 걸음씩 구현해 나간다.

이 장의 목표

  • 제 2 장에서 조감한 텐서 계층 중에서, 가장 기본적인 0계 텐서(불변량)——좌표 변환을 해도 값이 바뀌지 않는 양——인 시공간 간격 \(ds^2\)를 광속 불변의 원리로부터 유도한다
  • 거기서 Lorentz (로렌츠) 변환을 도출하고, 동시성의 상대성·시간의 지연·길이의 수축이라는 특수상대론의 물리적 귀결을 이해한다
  • 본 장에서는 "특수상대론의 물리"에 초점을 맞추고, Minkowski 시공간을 기술하기 위한 수학적 도구(계량, 4원벡터, 텐서)는 다음 장에서 정비한다

3.1 두 가지 공리

🟡 리나: 제 2 장의 마지막에서, 시공간의 불변량 \(ds^2 = -(cdt)^2 + dx^2 + dy^2 + dz^2\)의 유도를 예고했지. 이 식을 유도하려면, 출발점이 되는 공리——즉 "이것만은 실험 사실로서 인정한다"는 토대——를 먼저 확인해 둘 필요가 있어. 특수상대론의 출발점은, 단 두 가지 공리야.

공리 1 (상대성 원리): 물리 모델은 모든 관성계 (inertial frame)에서 같은 형태를 취한다.

공리 2 (광속 불변의 원리): 진공 중의 광속 \(c\)는, 광원이나 관측자의 운동에 관계없이 일정하다.

🔵 카이: "관성계"가 구체적으로 어떤 좌표계인가요?

🟡 리나: 가속도 회전도 하지 않는 관측자의 좌표계라고 하면 돼. 등속 직선 운동을 하고 있는(또는 정지해 있는) 관측자가 본 세계야. 전철이 일정 속도로 곧장 달리고 있을 때, 차내 사람에게 있어서의 좌표계가 관성계. 전철이 가속하거나, 커브를 돌거나 할 때는 관성계가 아니야.

🔵 카이: 그렇군요, 이미지가 잡혔어요. 공리 1은 Galilei (갈릴레이) 시대부터 있었던 이야기죠. 등속 직선 운동하는 전철 안에서 공을 던져도, 지면과 같은 운동 방정식이 성립한다——같은.

🟡 리나: 맞아. 좀 더 정확히 말하면, Newton 중력처럼 입자 간의 상대 위치에만 의존하는 힘이라면, Galilei 변환으로 좌표가 어긋나도 상대 위치는 변하지 않으니까, 운동 방정식의 형태는 유지돼. 예를 들어 두 입자 사이의 만유인력은, 양자의 상대 위치 \(\mathbf{r}_1 - \mathbf{r}_2\)만으로 결정되니까, 좌표 원점을 옮겨도 힘의 식은 같은 형태 그대로야. 다만, 공리 1은 "관성계"에 한정되어 있어.

⚪ 메이: "관성계에 한정"이라는 건, 가속하는 좌표계에서는 물리 법칙의 형태가 바뀌어 버린다는 거야?

🟡 리나: 맞아. Einstein 자신도 이 제한에 불만을 느꼈어. "왜 관성계만이 특별한가? 물리 법칙은 모든 좌표계에서 같은 형태를 취해야 하지 않는가?"——이 물음이, 후에 일반상대론(1915년)을 탄생시킨 동기 중 하나가 됐어. 하지만 우선은 관성계 사이의 이야기부터 시작하자.

🟡 리나: 문제는 공리 2 쪽이야. Galilei 변환에서는 속도가 단순히 더하고 빼기가 가능했으니까, 광속이 일정하다는 것은 모순이 되어 버려. 즉, Galilei 변환 쪽을 수정해야만 해. 두 공리의 관계를 표로 정리해 둘게.

표 3.1: 특수상대론의 두 공리 비교

공리 1 (상대성 원리) 공리 2 (광속 불변의 원리)
내용 물리 법칙은 모든 관성계에서 같은 형태 광속 \(c\)는 광원·관측자의 운동에 관계없이 일정
역사 Galilei 시대부터 존재 1887년 Michelson-Morley 실험으로 뒷받침
Galilei 변환과의 정합성 정합한다 모순된다 (속도의 덧셈이 성립하지 않는다)
귀결 좌표 변환으로 물리 법칙의 형태가 변하지 않는다 시간과 공간이 섞인다 → Lorentz 변환이 필요

🔵 카이: 구체적으로 어떻게 모순되나요?

🟡 리나: 일상적인 예로 말하면, 달리는 전철에서 앞쪽으로 공을 던지면, 지면에서 본 공의 속도는 "전철의 속도+공의 속도"가 돼:

\[ v_{\text{지면}} = v_{\text{전철}} + v_{\text{공(차내)}} \]

이것이 Galilei 변환에서의 속도 덧셈이야. 이 덧셈이 성립하는 배경에는, "시간은 어느 관측자에게나 같다"——즉 \(t' = t\)——라는 암묵적 전제가 있어. 그런데, 달리는 전철에서 앞쪽으로 빛을 쏘아도, 지면에서 본 빛의 속력은 "전철의 속도+\(c\)"가 아니라, 여전히 \(c\) 그대로야. Galilei 변환식의 속도 덧셈은, 빛에 대해서는 성립하지 않아.

⚪ 메이: Galilei 변환의 전제——\(t' = t\), 즉 시간은 절대적——의 어딘가가 틀렸다는 거네.

🟡 리나: 맞아. 시간도 공간의 좌표도, 관측자에 따라 변하는 양으로 다시 다루어야 해. 다만, 그렇게 결론짓기 위해서는 실험적인 뒷받침이 필요해.

🔵 카이: 광속이 일정하다는 건, 실험으로 확인된 건가요?

🟡 리나: 응. 1887년의 Michelson (마이컬슨)–Morley (몰리) 실험이, 광속의 방향 의존성을 \(\sim 10^{-8}\) 자릿수까지 검출하지 못했어. 당시에는 빛을 전달하는 매질로서 에테르 (aether)가 존재한다고 여겨졌고, 지구가 에테르에 대해 움직이고 있다면, 광속에 방향 의존성이 나타나야 한다——그것을 검출하려고 한 실험이야. 결과는 "비등방성 없음". 그 후의 개량 실험으로 정밀도는 비약적으로 향상되어, 현대의 레이저 공진기 실험에서는 광속의 등방성(방향에 따른 차이가 없는 것)이 \(10^{-18}\) 자릿수까지 확인되고 있어. 또한 Kennedy–Thorndike 실험과 그 현대판으로, 광속이 관측자의 속도에도 의존하지 않는다는 것도 고정밀도로 검증되었어. 광속 불변은 실험적으로 극도로 견고한 사실이야.

⚪ 메이: \(10^{-18}\)이라니……거의 완벽하게 일정하다는 거네.

🟡 리나: 맞아 (그림 3.1「마이컬슨-몰리 실험 (Michelson-Morley experiment)의 개념도」도 참조해). Einstein의 혁명은, 이 실험 사실을 "임시변통 수정"이 아닌 물리의 기본 원리로서 받아들인 데에 있어.

마이컬슨-몰리 실험의 개념도

그림 3.1: 마이컬슨-몰리 실험 (Michelson-Morley experiment)의 개념도. 에테르에 대한 지구의 운동을 검출하려 했으나, 광속의 비등방성은 발견되지 않았다.

자, 이 두 공리로부터 무엇이 도출되는지——순서대로 따라가 보자.

✅ 이해도 체크: Galilei 변환이 광속 불변의 원리와 모순되는 이유는 무엇일까요?

Galilei 변환에서는 속도가 단순히 더하고 빼기된다 (\(v_{\text{지면}} = v_{\text{전철}} + v_{\text{공}}\)). 이 규칙에 따르면, 움직이는 광원에서 나온 빛의 속력은 관측자의 운동 상태에 의존하여 \(c\)와 다른 값이 되어야 하지만, 광속 불변의 원리는 어느 관성계에서도 광속이 \(c\)임을 요구한다. 이 모순은 Galilei 변환의 전제인 절대 시간 (\(t' = t\))이 성립하지 않음을 의미한다.

✅ 이해도 체크: 특수상대론의 두 공리를 서술해 보세요.

공리 1 (상대성 원리): 물리 모델은 모든 관성계에서 같은 형태를 취한다. 공리 2 (광속 불변의 원리): 진공 중의 광속 \(c\)는, 광원이나 관측자의 운동에 관계없이 일정하다.

✅ 이해도 체크: 관성계란 어떤 좌표계인가요? 관성계가 아닌 예를 하나 들어보세요.

가속도 회전도 하지 않는 관측자의 좌표계. 등속 직선 운동을 하고 있는(또는 정지해 있는) 관측자가 본 세계. 관성계가 아닌 예: 가속하는 전철 차내, 커브를 도는 전철 차내, 회전하는 놀이공원 놀이기구 위 등.

🟡 리나: 광속 불변의 원리가 무엇을 의미하는지, 구체적인 이미지를 가져두자. 관성계 \(S\)의 원점에 광원을 놓고, 시각 \(t = 0\)에 빛을 발했다고 하자. 빛은 진공 중을 모든 방향으로 같은 속력 \(c\)로 나아가니까, 시각 \(t\)에 빛이 도달한 점 \((x, y, z)\)은 반지름 \(ct\)인 구면 위에 있어 (그림 3.2「빛의 구면 파면의 시간 발전」).

빛의 구면 파면의 시간 발전

그림 3.2: 빛의 구면 파면의 시간 발전. 원점의 광원에서 발해진 빛은, 모든 방향으로 등속으로 퍼져, 시각 \(t\)에 반지름 \(r = ct\)인 구면 위에 도달한다. \(t = 1, 2, 3\)의 3개 시각에서의 구면을 겹쳐 그렸다.

🔵 카이: 구면의 반지름이 \(ct\)라는 건, \(x^2 + y^2 + z^2 = (ct)^2\)이죠. 그런데 다른 관성계에서 보면, 광원이 움직이고 있으니까 구의 중심이 어긋나서……구가 아니게 되지 않나요?

🟡 리나: 거기가 광속 불변의 포인트야. 다른 관성계 \(S'\) (좌표 \((t', x', y', z')\))에서 같은 빛을 관측해도, 광속은 \(c\) 그대로야. 따라서 \(S'\)계에서도 \(x'^2 + y'^2 + z'^2 = c^2 t'^2\)이 성립해. 어느 관성계에서 봐도 빛은 구면상으로 퍼진다——그림 3.2「빛의 구면 파면의 시간 발전」에서 그린 구면이, \(S'\)계에서도 (\(S'\)의 원점을 중심으로) 같은 모습으로 보여. 이것이 광속 불변의 구체적인 의미야. 이 사실로부터, 시공간 불변량의 형태가 결정돼.

⚪ 메이: 즉, 어느 관성계에서도 "자신을 중심으로 한 구면"으로 보인다——그것이 광속 불변의 구체적인 내용이네.


3.2 시공간 간격의 불변성

🟡 리나: 이 섹션에서는, 먼저 에 대한 불변량을 구할 거야. 광속 불변의 원리를 사용하면 \(ds^2\)의 형태가 유일하게 결정돼. 그 다음, \(ds^2\)의 물리적 의미(사건·광원뿔·3분류)를 확인한 후, 빛 이외의 일반적인 경우에도 \(ds^2\)가 불변량임을 증명해서, 시공간 간격의 보편성을 확립한다——는 흐름으로 진행할게. 하지만 그 전에, 불변량을 어떤 형태로 쓸 것인가라는 준비가 필요해. 먼저 "왜 미소량의 제곱으로 정의하는지" "왜 2차 조합인지"를 확인하고, 그 다음 광속 불변으로 부호를 결정한다——는 흐름이야.

왜 "미소 거리의 제곱"으로 정의하는가

🟡 리나: 자 시공간의 불변량 \(ds^2 = -(cdt)^2 + dx^2 + dy^2 + dz^2\) 이야기에 들어가기 전에, 먼저 "왜 이 형태인지"를 확인해 두자.

🔵 카이: 3차원 공간의 불변량은 거리 \(\ell = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2 + (z_2 - z_1)^2}\)이었어요. 우선, 왜 \(dx\)\(dt\) 같은 미소량이 나오나요?

🟡 리나: 앞으로 다룰 시공간은 휘어짐을 고려해야 하기 때문이야. 휘어져 있으면, 이 공식을 사용할 수 없어. 지구 표면을 떠올려 봐. 예를 들어 도쿄와 뉴욕의 거리는, 위도·경도의 차이만으로는 계산할 수 없잖아? 구면이 휘어져 있으니까. 하지만, 발밑의 아주 좁은 범위——1미터 사방 정도——라면 지면은 평평하게 보이지.

🔵 카이: 아, 그래서 미소량으로 쓰는 거군요. 휘어져 있어도, 아주 작은 범위라면 평탄하게 보이니까.

🟡 리나: 맞아. 휘어진 공간에서도, 충분히 작은 영역에서는 국소적으로 평탄해——Google Maps에서 지구 표면을 충분히 확대하면, 곡률이 안 보이게 되어 평면 지도처럼 보이는 것과 같은 발상이야. 매끄럽게 휘어진 면이라면, 아무리 많이 휘어져 있어도 충분히 작은 범위를 잘라내면 평면으로 근사할 수 있어. 따라서, 아주 가까운 두 점 사이의 미소 거리라면 피타고라스 정리를 그대로 쓸 수 있어:

\[ d\ell = \sqrt{dx^2 + dy^2 + dz^2} \]

유한한 거리가 필요할 때는, 이 미소 거리 \(d\ell\)을 경로를 따라 더해(적분해) 가면 돼——휘어진 길의 길이를, 짧은 직선의 합으로 근사하는 것과 같은 발상이야. 그래서 불변량을 미소 거리 \(d\ell\)의 형태로 정의해 두는 것이, 휘어진 공간에도 통용되는 보편적인 쓰기 방식이야.

🔵 카이: 그러면 다음 의문이요. 왜 시간 항의 부호가 마이너스인 건가요? 공간의 경우와 같은 발상이라면 \(ds = \sqrt{(cdt)^2 + dx^2 + dy^2 + dz^2}\)처럼 전부 플러스로 더할 것 같은데——

🟡 리나: 그렇지. 왜 마이너스인지는, 이 다음에 광속 불변의 원리로부터 유도할 거야. 그 전에 하나 확인해 둘 것은, 시공간의 불변량은 왜 공간처럼 제곱근 \(ds = \sqrt{\cdots}\)가 아니라, 제곱의 형태 \(ds^2\)로 정의하고 있는가야. 결론을 먼저 말하면, 시공간의 불변량에는 시간 항에 마이너스 부호가 붙어 (이유는 바로 뒤에서 유도해). 그러면 제곱근 안의 값이 음이 되는 경우가 있어——실수 범위에서는 음수의 제곱근은 정의할 수 없잖아. 그래서 시공간에서는 제곱근을 취하기 전의 제곱 형태 \(ds^2\)로 불변량을 정의하고 있어.

⚪ 메이: 그렇구나, 제곱근을 취할 수 없는 경우가 있으니까 제곱인 채로 정의하는 거네. 합리적이다.

시공간 불변량의 형태를 좁혀나가기

🟡 리나: 자 그러면 왜 시간 항의 부호가 마이너스인지를 살펴보자. 3차원 공간의 미소 거리는 \(d\ell^2 = dx^2 + dy^2 + dz^2\)이었어. 이것을 4차원 시공간으로 확장했을 때, 어떤 형태가 되는지? 두 가지 조건으로 좁혀 나갈 거야.

조건 1: 좌표의 "제곱의 합" 형태일 것

🟡 리나: 3차원의 거리 \(d\ell^2 = dx^2 + dy^2 + dz^2\)을 보면, 모두 좌표의 제곱의 합으로 되어 있어. 이것을 시공간으로 확장할 때도, 좌표의 제곱의 합 형태를 가정하자.

🔵 카이: 왜 제곱 형태인가요?

🟡 리나: 직관적인 이유는 두 가지야. 첫 번째는 방향에 의존하지 않는 것. "미소 거리의 제곱"이라고 했는데, 만약 \(ds^2\) 안에 1차 항——예를 들어 \(dx\) 같은 항——이 섞여 있었다면 어떻게 될지 생각해 봐. \((1, 0)\) 방향(\(x\)의 양의 방향)으로 \(d\ell\)만큼 움직이면 1차 항 \(dx\)의 기여는 \(+d\ell\). 하지만 \((-1, 0)\) 방향(\(x\)의 음의 방향)으로 같은 \(d\ell\)만큼 움직이면 기여는 \(-d\ell\)——부호가 바뀌어 버려. 즉 1차 항은 방향 의존성을 가지니까, 등방적인 불변량에는 넣을 수 없어. 반면, \(dx^2 + dy^2\) (2차)라면, \((+1, 0)\) 방향이든 \((-1, 0)\) 방향이든 \(d\ell^2\)로 같은 값이 돼.

🔵 카이: 확실히, 피타고라스 정리가 \(dx^2 + dy^2\) 형태였으니까, 방향에 관계없이 거리가 결정되네요.

🟡 리나: 두 번째는, 3차 이상의 항은 2차에 비해 무시할 수 있다는 것이야. 미소 거리의 제곱 \(d\ell^2\)를 생각하고 있으니까, 전개의 최저차는 2차야. 만약 3차 이상의 항(예를 들어 \(dx^3\)이나 \(dx^2 \cdot dy\) 같은 항)이 섞여 있었다면 어떻게 될까——구체적으로 생각해 봐. \(dx = 0.001\)일 때, \(dx^2 = 0.000001\), \(dx^3 = 0.000000001\). 3차 항은 2차 항의 1000분의 1밖에 안 돼. \(dx\)가 작을수록 이 차이는 벌어지니까, 2차 식에 3차 이상의 보정을 더해도, 미소 극한에서는 사라져 버려. 정리하면, 1차는 안 돼(방향에 의존), 3차 이상은 미소 극한에서 2차에 비해 무시 가능——그래서 2차가 남아.

⚪ 메이: 즉 "방향에 의존하지 않는 최저차"가 2차——그래서 불변량은 2차 조합인 거네.

🟡 리나: 맞아. 4차원 시공간에서도, 불변량은 좌표의 제곱의 합 형태

\[ ds^2 = A\,(cdt)^2 + B\,(dx^2 + dy^2 + dz^2) + C\,(cdt)(dx) + \cdots \]

라고 가정해. \(A, B, C, \ldots\)는 정해야 할 계수야.

🔵 카이: 교차항(\(C\) 항)도 있나요?

🟡 리나: 일반적으로는 그런 항도 생각할 수 있어. 하지만 다음 조건 2에서 사라져.

조건 2: 공간의 회전으로 형태가 변하지 않을 것

🟡 리나: 물리 법칙은 공간의 어느 방향으로나 같다——이것을 등방성 (isotropy)이라고 불러. 따라서 불변량은, 공간의 좌표축을 어떻게 회전시켜도 같은 형태여야 해.

xy평면의 좌표 회전과 성분 변환

그림 3.3: xy평면의 좌표 회전과 성분 변환. 같은 점 \(P\)라도, 좌표계를 각도 \(\theta\) 회전시키면 성분이 변한다. 원래 좌표 \((x, y)\) (검정)와 회전 후의 좌표 \((x', y')\) (파랑)는, \(x = x'\cos\theta - y'\sin\theta\), \(y = x'\sin\theta + y'\cos\theta\)로 연결된다(역변환 형태).

구체적으로 살펴보자. \(xy\) 평면에서 좌표축을 각도 \(\theta\)만큼 반시계 방향으로 회전한 새로운 좌표 \((x', y')\)를 생각해. 어떤 점 \(P\)의 좌표가 새로운 축에서 \((x', y')\)라고 하면, 원래 축에서의 좌표 \((x, y)\)

\[ x = x'\cos\theta - y'\sin\theta, \qquad y = x'\sin\theta + y'\cos\theta \]

으로 연결돼. 이것은 "새로운 좌표 \((x', y')\)를 알고 있을 때, 원래 좌표 \((x, y)\)를 구하는" 식——즉 역변환 형태로 쓰고 있어. 왜 역변환을 쓰는가 하면, 이 다음에 \(dx\,dy\)를 새로운 좌표 \((dx', dy')\)로 다시 쓰고 싶으니까——\(dx = (\cdots)dx' + (\cdots)dy'\) 형태가 바로 쓸 수 있거든. 이 식은 고등학교 수학에서 배우는 회전행렬 그 자체로, \(\cos\theta\)\(\sin\theta\)가 나오는 건, 회전된 축으로의 사영이 삼각함수로 표현되기 때문이야 (그림 3.3「xy평면의 좌표 회전과 성분 변환」를 봐). 미소량 \(dx, dy\)에 대해서도 같은 형태가 성립해. 가령 \(dx\,dy\)라는 교차항이 불변량에 들어 있었다고 하고, 회전 후의 좌표로 표현해 보면,

\[ dx\,dy = (dx'\cos\theta - dy'\sin\theta)(dx'\sin\theta + dy'\cos\theta) \]

전개하면 \((\cos^2\theta - \sin^2\theta)\,dx'\,dy'\) 등의 항이 나와서, 원래의 \(dx\,dy\)와는 다른 형태가 되어 버려.

⚪ 메이: "회전해도 형태가 같다"는 조건에 반하는 거네. 그래서 \(dx\,dy\) 같은 교차항은 안 돼.

🟡 리나: 같은 이유로, \((cdt)(dx)\) 같은 시간과 공간의 교차항도, 공간을 회전시키면 \(dx\)\(dx'\)\(dy'\)에 섞여서 형태가 변해. 그래서 이것도 안 돼.

한편, \(dx^2 + dy^2 + dz^2\) (공간의 제곱의 합)은, 회전해도 반드시 \(dx'^2 + dy'^2 + dz'^2\)으로 돌아와——이것이 바로 3차원 거리의 불변성으로, 피타고라스 정리의 다른 표현이야. \((cdt)^2\)는 공간 성분을 포함하지 않으니까, 공간의 회전으로는 아무것도 변하지 않아.

결국, 공간의 회전으로 형태가 변하지 않는 2차 조합은, \(dx^2 + dy^2 + dz^2\)\((cdt)^2\) 두 가지뿐이야. 따라서 불변량은

\[ ds^2 = A\,(cdt)^2 + B\,(dx^2 + dy^2 + dz^2) \]

의 형태로 한정돼. 교차항이 전부 사라지고, 남는 건 계수 \(A\)\(B\)뿐——깔끔한 형태지?

⚪ 메이: 이제 이 \(A\)\(B\)를 결정하면 되는 거네.

🟡 리나: 맞아.

✅ 이해도 체크: 시공간의 불변량 \(ds^2\)\(dx\,dy\)\((cdt)(dx)\) 같은 교차항이 포함되지 않는 이유는 무엇일까요?

공간의 등방성(물리 법칙이 어느 방향으로나 같다)으로부터, 불변량은 공간의 좌표축을 어떻게 회전시켜도 같은 형태여야 한다. \(dx\,dy\) 같은 교차항은 좌표 회전으로 형태가 변해 버리므로, 등방성 조건에 반한다. 마찬가지로 \((cdt)(dx)\)도 공간 회전으로 \(dx\)가 혼합되므로 허용되지 않는다.

광속 불변으로 마이너스 부호가 결정된다

🔵 카이: \(A\)\(B\)는 어떻게 정하나요?

🟡 리나: 여기서 광속 불변의 원리를 사용해. 먼저, 어떤 관성계 \(S\)에서 빛의 미소 변위를 생각하자. 빛은 속력 \(c\)로 진행해. 미소 시간 \(dt\) 동안 빛이 3차원 공간에서 나아간 거리는 \(\sqrt{dx^2 + dy^2 + dz^2}\). 한편, 속력 \(c\)\(dt\)만큼 진행한 거리는 \(c\,dt\). 이 둘이 같으니까,

\[ \sqrt{dx^2 + dy^2 + dz^2} = c\,dt \]

양변을 제곱하면, 임의의 광선을 따른 미소 변위는

\[ dx^2 + dy^2 + dz^2 = c^2\,dt^2 \]

을 만족해. 이것을 「시공간 불변량의 형태를 좁혀나가기」에서 구한 \(ds^2 = A\,(cdt)^2 + B\,(dx^2 + dy^2 + dz^2)\)에 대입하면,

\[ ds^2 = A\,(cdt)^2 + B\,c^2\,dt^2 = (A + B)\,c^2\,dt^2 \]

⚪ 메이: 즉 \(S\)계에서는, 빛에 대해 \(ds^2 = (A+B)\,c^2\,dt^2\)이 되는 거네.

🟡 리나: 다음으로, 광속 불변의 원리에 의해, 다른 관성계 \(S'\)에서도 빛은 같은 속력 \(c\)로 진행하니까, \(S'\)계에서도

\[ dx'^2 + dy'^2 + dz'^2 = c^2\,dt'^2 \]

이 성립해. 그리고 상대성 원리에 의해, 불변량의 정의식의 형태는 모든 관성계에서 같아——즉 \(S'\)계에서도 같은 계수 \(A, B\)를 사용해서 \(ds'^2 = A\,(cdt')^2 + B\,(dx'^2 + dy'^2 + dz'^2)\)라고 쓸 수 있어 (\(S\)계에서 \(A, B\)였는데 \(S'\)계에서 다른 계수가 된다면, "어느 관성계에서도 같은 물리 법칙"에 반하잖아). 여기에 대입하면,

\[ ds'^2 = A\,(cdt')^2 + B\,(dx'^2 + dy'^2 + dz'^2) = (A+B)\,c^2\,dt'^2 \]

\(S\)계와 같은 형태로, \(dt\)\(dt'\)로 바뀌었을 뿐이야.

🔵 카이: 여기까지는 양쪽 계에서 같은 형태의 식이 나왔어요. 하지만 이걸로 불변량이라고 할 수 있나요? \(dt \neq dt'\)이면 값이 다르지 않나요?

🟡 리나: 바로 거기가 다음 포인트야. 우리의 목표는, \(ds^2\)를 모든 관성계에서 같은 값을 취하는 불변량으로 정의하는 것이야. 그러려면, 빛에 대해 \(S\)계에서 \(ds^2 = 0\)이면 \(S'\)계에서도 \(ds'^2 = 0\)이어야 해. 그런데 지금의 계산 결과를 보면, \(ds^2 = (A+B)\,c^2\,dt^2\)이고 \(ds'^2 = (A+B)\,c^2\,dt'^2\)야. 만약 \(A + B \neq 0\)이라면, \(ds^2 = ds'^2\)가 성립하려면 \((A+B)\,c^2\,dt^2 = (A+B)\,c^2\,dt'^2\), 즉 \(dt = dt'\)이 필요하게 돼.

🔵 카이: 어, \(dt = dt'\)이면 Galilei 변환——즉 절대 시간——이잖아요.

🟡 리나: 맞아. 여기서 논리의 흐름을 정리해 둘게. 지금 하고 싶은 건 "\(A + B \neq 0\)이면 모순된다"는 것을 보이는 거야. \(A + B \neq 0\)이면 \(ds^2 = ds'^2\)에는 \(dt = dt'\)이 필요——하지만 \(dt = dt'\) (절대 시간)은 광속 불변과 모순돼. 그래서 \(A + B \neq 0\)은 불가능하고, \(A + B = 0\)밖에 없어. 그럼 "\(dt = dt'\)이 광속 불변과 모순된다"는 것을 구체적으로 봐 보자. 만약 \(dt = dt'\) (절대 시간)이 성립한다고 하자. \(t = t' = 0\)에 양 계의 원점이 일치한 순간에 빛을 발했을 때, \(S\)계에서는 시각 \(t\)에 빛의 파면은 \(S\)의 원점을 중심으로 한 반지름 \(ct\)의 구면——즉 \(S\)의 원점에서 모든 방향으로 등거리 \(ct\)에 있는 점의 집합이야. 한편, \(S'\)계의 관측자에게도 빛은 자신의 원점에서 출발했어 (\(t' = 0\)에 원점에 있었으니까). 광속 불변에 의해 \(S'\)계에서도 빛은 모든 방향으로 속력 \(c\)로 진행하니까, \(S'\)계에서는 파면이 \(S'\)의 원점을 중심으로 한 반지름 \(ct' = ct\)의 구면——\(S'\)의 원점에서 모든 방향으로 등거리 \(ct\)에 있는 점의 집합——이 되어야 해.

🔵 카이: 하지만 \(S'\)의 원점은 \(S\)의 원점에서 \(vt\)만큼 어긋나 있잖아요? 같은 구면이 두 개의 중심을 가지는 건 불가능하지 않나요……

🟡 리나: 맞아. \(dt = dt'\)을 가정하고 있으니까, \(S\)계와 \(S'\)계는 같은 시각 \(t\)에 같은 공간을 공유하고 있어. \(S'\)의 원점은 \(S\)의 원점에서 \(vt\)만큼 어긋나 있어 (\(v \neq 0\)이면 \(vt \neq 0\)). 여기서 모순이 생겨: 같은 하나의 파면(같은 점의 집합)이, \(S\)의 원점에서도 \(S'\)의 원점에서도 모든 방향으로 등거리 \(ct\)에 있다고 말하고 있거든. 구체적으로 생각해 봐——만약 파면이 \(S\)의 원점을 중심으로 한 구면이라면, \(S'\)의 원점(\(S\)의 원점에서 \(vt\)만큼 어긋난 위치)에서 파면 위의 각 점까지의 거리는 방향에 따라 다를 거야 (가까운 쪽은 \(ct - vt\), 먼 쪽은 \(ct + vt\)). 즉 \(S'\)의 원점에서 보아 "모든 방향으로 등거리 \(ct\)"가 될 수 없어. 하지만 구면의 중심은 "그 구면 위의 모든 점에서 등거리에 있는 유일한 점"이니까 (중심이 2개인 구면은 존재하지 않아), 중심이 \(vt\)만큼 어긋난 2점이라는 건 불가능해. 따라서 \(A + B \neq 0\) (즉 \(dt = dt'\)을 요구하는 선택)은, 광속 불변과 양립하지 않아.

⚪ 메이: 한편, \(A + B = 0\)이라면 \(ds^2 = 0\)이고 \(ds'^2 = 0\)이야. 둘 다 0이니까, \(dt\)\(dt'\)의 관계가 어떠하든 불변성이 보장돼.

🟡 리나: 맞아. 광속 불변 하에서, 어떤 \(dt\)-\(dt'\) 관계와도 양립하는 유일한 선택이 \(A + B = 0\)——이것이 광속 불변의 원리가 \(ds^2\)의 형태를 결정하는 본질적인 역할이야. 절대 시간이 성립하지 않는 상황에서 불변량을 만들려면, 빛에 대해 \(ds^2 = 0\)을 선택할 수밖에 없어.

🔵 카이: 거꾸로, 광속 불변이 없고 Galilei 변환이 성립하는 세계 (\(dt = dt'\))라면?

🟡 리나: 그 경우는 \(ds^2 = (A+B)\,c^2\,dt^2\)\(A + B \neq 0\)이어도 관성계에 따르지 않는 값이 돼——\(A\)\(B\)의 부호는 독립이고, \(A + B = 0\)이라는 제약은 나오지 않아. 마이너스 부호는 필요 없어. 광속 불변이 \(ds^2\)에 마이너스 부호를 강제하고 있어.

논리의 요점: 여기까지의 논의를 정리하면, 1. 빛은 \(S\)계에서도 \(S'\)계에서도 같은 속력 \(c\)로 진행한다 (광속 불변) 2. 빛에 대해 \(ds^2 = (A+B)\,c^2\,dt^2\), \(ds'^2 = (A+B)\,c^2\,dt'^2\) 3. \(S\)계의 \(dt\)\(S'\)계의 \(dt'\)의 관계는 아직 결정되지 않았다 (\(dt = dt'\)라고는 할 수 없다) 4. 이 미결정 관계와 무관하게 불변성 (\(ds^2 = ds'^2\))이 성립하려면, 양변이 0이어야 한다 → \(A + B = 0\)

⚪ 메이: 즉 \(A + B = 0\)으로 택하면, 빛에 대해 \(ds^2 = 0\)이 어느 관성계에서도 성립해——불변량이 돼. 따라서 \(A + B = 0\), 즉 \(A = -B\).

🔵 카이: 빛에 대해 \(ds^2 = 0\)으로 하는 것이 유일한 선택지였군요. \(dt\)\(dt'\)의 관계를 몰라도 불변성이 보장돼——0은 0이니까.……그런데 반대로, 빛이 아닌 경우는 \(ds^2 \neq 0\)이잖아요. 그때도 불변이라고 할 수 있나요?

🟡 리나: 좋은 의문이야. 그건 이 섹션의 마지막에서 증명할 거야. 먼저 \(B\)의 부호와 크기를 결정하자. \(A = -B\)이니까, \(B\)를 결정하면 \(A\)도 자동으로 결정돼. \(B > 0\)\(B < 0\) 어느 쪽이든 수학적으로는 허용되지만, \(B > 0\)을 택하면 공간 부분 \(B(dx^2 + dy^2 + dz^2)\)가 양——즉 공간적 거리가 양의 양이 되고, 시간 항은 \(A = -B < 0\)으로 마이너스가 돼. \(B < 0\)을 택하면 부호 규약이 \((+,-,-,-)\)가 될 뿐으로, 물리적 결론은 같아. 크기에 대해서는, \(B \neq 1\)이어도 좌표의 자를 다시 취하면 \(B = 1\)의 형태로 되돌릴 수 있어——즉 \(B\)의 값은 좌표의 단위 취하기에 흡수시킬 수 있어. 예를 들어 \(B = 4\)일 때, 공간 좌표를 "1미터"에서 "0.5미터"로 재측정하면 (\(dx \to 2\,dx\)로 하면), \(B\,dx^2 = 4 \cdot dx^2 = (2dx)^2\)이 되어, 새로운 자에서는 계수가 1이 돼. 따라서 물리적으로 의미 있는 것은 부호뿐이고, \(B = 1\) (따라서 \(A = -1\))로 택해서,

\[ \boxed{ds^2 = -(cdt)^2 + dx^2 + dy^2 + dz^2} \]

⚪ 메이: 마이너스 부호는 "광속이 유한하고 일정하다"는 조건에서 필연적으로 나오는 거네. 아까 설명을 정리하면——Newton 역학에서는 \(dt = dt'\)이니까 \(A + B = 0\) 제약이 불필요하고, 공간만으로 불변량을 만들 수 있었어. 광속 불변을 받아들이면 절대 시간이 무너지고, 시간과 공간을 함께 다루는 불변량이 필요해지며, 부호의 차이가 나타나.

🟡 리나: 맞아. 이것이 시공간의 기하학이 Euclid (유클리드) 기하와 근본적으로 다른 이유야.

✅ 이해도 체크: 시공간 간격 \(ds^2 = -(cdt)^2 + dx^2 + dy^2 + dz^2\)에서 시간 항에 마이너스 부호가 붙는 이유는?

광속 불변의 원리로부터, 빛에 대해 \(ds^2 = 0\)이 모든 관성계에서 성립해야 한다. 이 조건을 만족시키려면 \(A + B = 0\) (즉 시간과 공간의 계수가 반대 부호)이어야 한다.

🔍 Dive Deep: 광속이 관성계마다 달랐다면 어떻게 되는가?

"광속이 일정하지 않아도 \(A + B = 0\)은 유도할 수 있지 않나?"라고 생각할 수 있다. 확실히, \(S'\)계에서 광속이 \(c'\)라 해도, \(S'\)계의 불변량을 \(ds'^2 = A\,(c'dt')^2 + B\,(dx'^2+dy'^2+dz'^2)\)로 정의하면, 빛에 대해 \(ds'^2 = (A+B)\,c'^2\,dt'^2 = 0\)이 되어, \(A + B = 0\)은 나온다.

문제는 그 다음에 있다. \(A + B = 0\)\(B = 1\)을 대입하면, \(S\)계에서는 \(ds^2 = -(cdt)^2 + dx^2+dy^2+dz^2\). 상대성 원리에 의해 \(S'\)계에서도 같은 형태의 식이 성립해야 하는데, 광속이 \(c'\)이라면 \(ds'^2 = -(c'dt')^2 + dx'^2+dy'^2+dz'^2\)이 된다. \(c \neq c'\)이라면, 불변량의 정의식에 나타나는 상수가 관성계마다 다른 값이 된다. 이래서는 "모든 관성계에서 같은 형태의 불변량"이 존재하지 않는다——상대성 원리에 반한다.

광속 불변 (\(c = c'\))일 때만, \(ds^2 = -c^2\,dt^2 + dx^2+dy^2+dz^2\)이라는 하나의 식이 모든 관성계에서 통용된다. 광속 불변은 "\(A + B = 0\)을 유도하기 위해"서라기보다, "보편적인 시공간 간격을 정의하기 위해" 필요한 것이다.

🟡 리나: 이 \(ds^2\)시공간 간격 (spacetime interval)이라고 불러.

🔵 카이: 그런데 이거, 빛의 경우로부터 유도했잖아요. 빛이 아닌 보통 물체에도 쓸 수 있나요?

🟡 리나: 좋은 질문이야. 사실, \(ds^2\)가 빛 이외의 경우에도 관성계에 따르지 않는 불변량이라는 것은, 별도로 증명할 수 있어. 이 섹션의 마지막에서 증명할게.

⚪ 메이: 빛의 경우는 \(ds^2 = 0\). 그리고 관성계를 바꿔도 \(ds'^2 = 0\). 즉 \(ds^2\)는, 적어도 빛에 대해서는 관성계에 따르지 않는 양——불변량이네.

🟡 리나: 맞아. \(ds^2\)는 "시공간 속의 두 점 사이의 거리"에 해당하는 양이라고 했지. 이 "시공간 속의 점"에 정식 이름을 붙여 두자——사건 (event)이라고 불러. 제 2 장의 섹션 3에서 소개한 시공간도——공간 좌표 \((x, y, z)\)에 시간축 \(ct\)를 더한 \((ct, x, y)\)의 3차원——를 다시 사용하자 (그림 3.4「시공간도에서의 사건과 광원뿔」).

시공간도에서의 사건과 광원뿔

그림 3.4: 시공간도에서의 사건과 광원뿔. \((ct, x, y)\)의 3차원 시공간도. 가로 2축 \((x, y)\)이 공간, 세로축 \(ct\)가 시간을 나타낸다. 사건 \(P\)는 "언제" (\(ct_P\))와 "어디서" (\(x_P, y_P\))를 완전히 지정한 시공간 속의 1점. 노란 선은 원점에서 나오는 광원뿔.

🔵 카이: "사건"이란, 일상어의 "일어난 일"과는 다른 건가요?

🟡 리나: 물리학에서의 사건은, 시공간 속의 하나의 점——즉 "언제, 어디서"를 지정한 \((t, x, y, z)\)의 조합이야. "2026년 4월 30일 12시 00분에, 서울역 개찰구 앞"처럼, 시각과 장소를 완전히 지정한 것이 하나의 사건이야. 크기도 지속 시간도 없는, 수학적인 점.

⚪ 메이: 좌표계에 따라 \((t, x, y, z)\)의 값은 변하지만, 사건 그 자체——시공간 속의 어느 점인가——는 좌표계에 의존하지 않는다는 거네.

🟡 리나: 맞아. 아까 정의한 \(ds^2\)는, 미소하게 떨어진 두 사건 사이의 "시공간의 거리"에 해당하는 양이야. 어떤 사건 A를 원점에 놓고, 거기서 빛을 발했다고 하자. 빛은 \(ds^2 = 0\)을 만족하면서 진행하니까, 시공간도 위에서 빛의 궤적은 원점에서 45° 각도로 퍼지는 원뿔면을 그려——이것을 광원뿔 (light cone)이라고 불러. 광원뿔이 시공간을 3개의 영역으로 나눠 (그림 3.5「시공간 간격의 3분류」). 사건 B가 광원뿔의 안쪽인지 바깥쪽인지에 따라, A와의 관계가 결정돼.

시공간 간격의 3분류

그림 3.5: 시공간 간격의 3분류. 사건 A를 원점으로 하는 시공간도. 광원뿔(노란 선, \(ds^2 = 0\))이 시공간을 3개의 영역으로 나눈다. 사건 B₁은 시간적 (\(ds^2 < 0\)), B₂는 공간적 (\(ds^2 > 0\)), B₃는 빛과 같은 (\(ds^2 = 0\)).

🟡 리나: 이 3분류는 물리적으로 깊은 의미를 가져. "인과 관계"라는 말이 나오는데, 이건 "한쪽 사건이 다른 쪽 사건의 원인이 될 수 있는가"라는 것——즉 신호나 물체가 한쪽에서 다른 쪽에 도달할 수 있는지, 라는 의미야.

표 3.2: 시공간 간격의 3분류와 물리적 의미

분류 조건 물리적 의미
시간적 (timelike) \(ds^2 < 0\) A와 B 사이를 광속 미만으로 이동할 수 있다. 인과 관계가 있을 수 있다
빛과 같은 (lightlike/null) \(ds^2 = 0\) A와 B를 광신호로 연결할 수 있다. 광원뿔 위
공간적 (spacelike) \(ds^2 > 0\) A와 B 사이를 광속 이하로는 이동할 수 없다. 인과 관계는 없다

🔵 카이: 인과 관계가 없다는 건 무슨 뜻인가요?

🟡 리나: 공간적으로 떨어진 두 사건은, 어떤 신호로도 한쪽에서 다른 쪽에 도달할 수 없어. 따라서, 한쪽이 다른 쪽의 원인이 되는 것은 불가능——이것이 "인과 관계가 없다"의 의미야. 광원뿔은 "인과적으로 영향을 미칠 수 있는 범위의 경계"인 거야.

🔵 카이: 그런데, 빛이 아닌 경우는요? \(ds^2 \neq 0\)일 때도 \(ds^2 = ds'^2\)라고 할 수 있나요?

\(ds^2\)가 모든 경우에 불변임의 증명

읽기 힌트: 이 섹션은 좀 수학적이고 어려워. 증명의 골자만 파악하면, 앞으로 나아가는 데 문제없어. 결론은 "\(ds^2\)는 어떤 경우(빛 이외의 물체)에도 관성계에 따르지 않는 불변량"——이것만 머리에 넣어 두면, 다음 섹션부터는 읽을 수 있어.

🟡 리나: 그러면 증명하자. 경로는 세 단계야.

증명의 경로: 1. \(ds^2\)\(ds'^2\)는, 좌표의 "제곱의 합" 형태(2차 조합)의 관계로 연결되어 있다 2. 광속 불변으로부터, \(ds^2 = 0\)일 때 반드시 \(ds'^2 = 0\). 이로써, \(ds'^2 = a(v)\,ds^2\)이라는 비례 관계를 이끌어낼 수 있다 3. 세 관성계를 연결해 생각하면, 비례 계수 \(a(v)\)가 실은 1이어야 한다는 것을 알 수 있다

단계 1: \(ds'^2\)\(ds^2\)와 같은 "2차 조합" 형태

🟡 리나: 먼저, \(S\)계의 좌표 \((t, x, y, z)\)\(S'\)계의 좌표 \((t', x', y', z')\)의 관계를 생각하자. 관성계 사이의 변환은, 좌표의 1차식——즉 \(t' = (\text{수})\cdot t + (\text{수})\cdot x + \ldots\) 같은 형태——가 돼.

🔵 카이: 왜 1차식인가요?

🟡 리나: 시공간의 균일성——어느 장소·시각에서도 물리 법칙이 같다——이 요청하는 거야. 직감적으로 말하면, 만약 변환이 2차식——예를 들어 \(x' = ax^2 + bt\)——이었다면, 원점을 \(x_0\)만큼 옮기면 \(x' = a(x+x_0)^2 + bt\)로 불필요한 1차 항 \(2ax_0 x\)가 나와서, 변환의 형태가 원점 선택에 의존해 버려. 1차식이라면 그런 문제는 일어나지 않아——이건 「두 가지 가정」에서 다시 한번 정성스럽게 확인할게. 지금은 이 결론을 사용해서 먼저 나아가자. 1차식끼리 곱하면 2차식이 되니까, \(ds'^2 = -c^2 dt'^2 + dx'^2 + dy'^2 + dz'^2\)을 원래 좌표 \((dt, dx, dy, dz)\)로 다시 쓰면, 역시 좌표의 2차 조합——\(dt^2, dx^2, dt\,dx, \ldots\) 등의 합——이 돼.

⚪ 메이: 즉 \(ds'^2\)\(ds^2\)와 같은 종류의 수학적 대상——좌표의 2차 조합——이니까, 양자를 직접 비교할 수 있는 거네.

🟡 리나: 맞아. 즉 \(S'\)계의 시공간 간격은, \(S\)계의 좌표로 쓰면

\[ ds'^2 = A'\,(cdt)^2 + B'\,(dx^2 + dy^2 + dz^2) + \ldots \]

같은, \(S\)계 좌표의 2차 조합이 돼 (계수 \(A', B', \ldots\)\(S\)계의 \(A, B, \ldots\)와 다를 가능성이 있어).

단계 2: 광속 불변으로부터 비례 관계가 나온다

🟡 리나: \(ds^2\)\(ds'^2\)도, 같은 \(S\)계의 좌표 \((dt, dx, dy, dz)\)로 쓸 수 있는 2차 조합이야. 여기서 광속 불변의 원리를 사용해.

빛이 전파할 때, \(S\)계에서는 \(ds^2 = 0\). 광속 불변에 의해 \(S'\)계에서도 광속은 \(c\)이니까, 같은 빛의 전파에 대해 \(ds'^2 = 0\)도 성립해. 즉, \(ds^2\)가 0이 되는 좌표 변화 \((dt, dx, dy, dz)\)에 대해, \(ds'^2\)도 반드시 0이 된다——두 식의 "0이 되는 점의 집합(영점 집합)"이 일치하는 거야.

🔵 카이: 영점 집합이 일치하는 것만으로, \(ds'^2 = a(v)\,ds^2\)라는 비례 관계가 나오나요?

🟡 리나: 1변수의 2차식으로 생각해 봐. \(f(x) = x^2 - 1\)\(g(x) = 3x^2 - 3\)는 둘 다 \(x = \pm 1\)에서 0이 돼. 실제로, \(g(x) = 3 f(x)\)——즉 상수배의 관계야. 일반적으로, 모든 근이 일치하는 두 2차식은 상수배밖에 차이나지 않아. 왜냐하면, 2차식은 \(a(x - r_1)(x - r_2)\)로 인수분해할 수 있거든 (\(r_1, r_2\)가 근). 근 \(r_1, r_2\)가 같다면, 차이는 선두 계수 \(a\)뿐——즉 상수배밖에 자유도가 없어.

🔵 카이: 1변수라면 알겠는데, 다변수에서도 그렇게 말할 수 있나요? 변수가 늘어나면 계수의 자유도도 늘어나니까, 더 여러 가지 가능성이 있을 것 같은데……

🟡 리나: 직감적으로는 이렇게 생각해. 구체적으로 2변수로 봐 보자. \(f = x^2 - y^2\)영점 집합——즉 \(f = 0\)을 만족하는 점 \((x, y)\)의 모임——은 \(x = \pm y\), 즉 2개의 직선으로, 원점만이 아니라 면적으로 퍼져 있어. 만약 다른 2차식 \(g = ax^2 + bxy + cy^2\)이 같은 영점 집합(\(x = \pm y\)에서 0)을 가진다면, \(x = y\)를 대입해서 \(a + b + c = 0\), \(x = -y\)를 대입해서 \(a - b + c = 0\). 이 두 식에서 \(b = 0\)이고 \(c = -a\), 즉 \(g = a(x^2 - y^2) = a \cdot f\). 영점 집합이 면적으로 퍼져 있으면, 모든 방향의 정보를 쓸 수 있어서, \(g\)\(f\)의 상수배로 한정돼.

반대로, 만약 \(f = x^2 + y^2\)처럼 전부 플러스라면, \(f = 0\)을 만족하는 건 원점 \((0, 0)\)뿐이야. 원점 한 점의 정보만으로는 "\(g\)도 원점에서 0"이라고밖에 말할 수 없어서, \(g = 2x^2 + 3y^2\)처럼 계수비가 자유로워도 조건을 만족시켜 버려.

⚪ 메이: 아, 그래서 \(ds^2\)의 마이너스 부호가 효과를 발휘하는 거구나. 부정 부호이기 때문에 영점 집합이 퍼져서, 비례 관계가 강제돼.

🟡 리나: 맞아. 이처럼, 양의 항과 음의 항이 섞인 제곱 식——예를 들어 \(x^2 - y^2\)처럼, 전부 플러스도 전부 마이너스도 아니고, 플러스 항과 마이너스 항이 공존하는 2차식——을 부정부호의 2차형식 (indefinite quadratic form)이라고 불러. 여기서 "2차형식"이란, 변수의 제곱이나 변수끼리의 곱만으로 이루어진 식(\(ax^2 + bxy + cy^2\) 같은 형태)을 말해. "부정부호"는, 변수의 값에 따라 양으로도 음으로도 0으로도 될 수 있다는 의미야. 부정부호의 2차형식에서는, 0이 되는 점의 모임(영점 집합)이 원점 한 점이 아니라 퍼짐을 가져——\(x^2 - y^2 = 0\)이라면 \(x = \pm y\)라는 2개의 직선 전체가 0이 되는 점의 모임이야. 이 "퍼짐" 덕분에, 대입에 사용할 수 있는 점이 풍부해서, 같은 영점 집합을 가지는 다른 제곱식은 상수배로 한정돼. \(ds^2 = -(ct)^2 + x^2 + y^2 + z^2\)은 바로 이 형태——시간 항이 마이너스고 공간 항이 플러스니까, 부정부호의 2차형식이야.

4변수로의 확장도 같은 원리야. 2변수에서는 영점 집합이 2개의 직선이어서, 거기에 대입하는 것만으로 모든 계수가 결정됐어. 4변수에서는 영점 집합이 광원뿔——3차원의 "면"——이 되니까, 대입에 사용할 수 있는 점이 더욱 풍부해져서, 계수는 더 강하게 제약돼. 구체적으로는, 2변수일 때 \((1, 1)\)\((1, -1)\)의 쌍을 대입해서 교차항을 없앤 것과 같은 수법을, 4변수에서도 사용해——광원뿔 위에는 \((1, 1, 0, 0)\)이나 \((1, -1, 0, 0)\)처럼 부호만 다른 쌍이 무수히 있으니까, 그것들을 대입해서 빼면 교차항의 계수가 0이라는 게 알 수 있어. 아래 접기에서 구체적으로 확인하고 있지만, 하고 있는 건 2변수일 때와 같아——"영점 집합 위의 점을 대입해서, 계수의 연립방정식을 푸는" 것뿐이야.

4변수에서의 구체적 확인 (읽기 건너뛰기 가능):

\(f = -t^2 + x^2 + y^2 + z^2\)의 영점 집합은 \(t^2 = x^2 + y^2 + z^2\) (광원뿔). \(t = 1\)로 고정하면, 영점 집합 위의 점은 \(x^2 + y^2 + z^2 = 1\)을 만족해——즉 3차원의 단위 구면 위의 모든 점이 영점 집합에 포함돼. 예를 들어 \((1, 1, 0, 0)\), \((1, -1, 0, 0)\), \((1, 0, 1, 0)\), \((1, 0, -1, 0)\), \((1, 0, 0, 1)\), \((1, 1/\sqrt{2}, 1/\sqrt{2}, 0)\) 등, 무수한 점을 쓸 수 있어.

만약 다른 2차식 \(g = At^2 + Bx^2 + Cy^2 + Dz^2 + Etx + Fty + \ldots\) (교차항도 포함)이 이 모든 점에서 0이라면, 교차항의 계수를 결정할 수 있어. 방법은 "부호만 다른 점의 쌍을 대입해서 빼기"야. 왜 빼기로 교차항이 사라지는가 하면, 교차항 \(Etx\)\(t\)\(x\)의 곱이니까, \(x\)의 부호를 반전하면 \(Etx\)의 부호만 변하고, \(t^2\)이나 \(x^2\) 항은 변하지 않아. 구체적으로 봐 보자. \((1,1,0,0)\)을 대입하면 \(A \cdot 1 + B \cdot 1 + E \cdot 1 \cdot 1 = A + B + E = 0\). 다음으로 \(x\)의 부호만 반전한 \((1,-1,0,0)\)을 대입하면 \(A \cdot 1 + B \cdot 1 + E \cdot 1 \cdot (-1) = A + B - E = 0\). 이 두 식을 빼면 \((A+B+E) - (A+B-E) = 2E = 0\), 즉 \(E = 0\) (\(tx\) 교차항의 계수가 0). \(A + B\) 부분은 양쪽 식에서 같으니까 빼기로 사라지고, \(E\)만 남아——이것이 "쌍을 사용해서 교차항을 분리하는" 구조야. 같은 수법으로 \((1,0,1,0)\)\((1,0,-1,0)\)에서 \(F = 0\) (\(ty\) 교차항)이 나와. \(xy\) 교차항도 같은 수법으로 없앨 수 있어. \(g\)\(xy\) 교차항 \(Gxy\)가 있다고 하고, \((1, 1/\sqrt{2}, 1/\sqrt{2}, 0)\)을 대입하면 \(G \cdot (1/\sqrt{2})(1/\sqrt{2}) = G/2\)의 기여가 있고, \((1, 1/\sqrt{2}, -1/\sqrt{2}, 0)\)을 대입하면 \(G \cdot (1/\sqrt{2})(-1/\sqrt{2}) = -G/2\)의 기여가 있어. 두 식을 빼면 \(G = 0\)이 나와——이렇게 해서 모든 교차항이 0이 돼.

대각 성분에 대해서는, \((1,1,0,0)\)\((1,0,1,0)\)이 둘 다 영점 집합 위에 있는 것에서 \(A + B = 0\)\(A + C = 0\)이 나와서, \(B = C\). 마찬가지로 \(C = D\)도 보여지니까 \(B = C = D\). 결국 \(g = A(-t^2 + x^2 + y^2 + z^2) = (-A) \cdot f\)——\(f\)의 상수배로 한정돼.

여기까지의 결론: 영점 집합이 면적으로 퍼지는 부정부호의 2차형식에서는, 같은 영점 집합을 가지는 다른 2차형식은 상수배밖에 차이나지 않는다. 4변수에서도 "쌍 대입 → 빼기"로 모든 계수가 결정된다.

2변수일 때와 같이 대입을 반복함으로써, \(g\)의 모든 계수가 \(f\)의 상수배로 한정된다는 것을 보일 수 있어. 엄밀한 증명은 선형대수 교과서에 맡기지만, 결론으로서

\[ ds'^2 = a(v)\,ds^2 \]

라는 비례 관계가 성립해. \(v\)는 두 관성계의 상대 속력, \(a(v)\)는 비례 계수야.

🔵 카이: 계수 \(a\)는, 속도의 방향에도 의존하나요?

🟡 리나: 좋은 질문이야. 공간의 등방성——물리 법칙은 어느 방향으로나 같다——을 떠올려 봐. 만약 \(a\)가 속도 벡터 \(\vec{v}\)방향에 의존한다면, 어떤 방향으로 움직였을 때와 다른 방향으로 움직였을 때 \(ds'^2\)의 값이 달라져 버려. 그건 등방성에 반해. 그래서 \(a\)는 속도의 크기 \(v = |\vec{v}|\)만의 함수야.

⚪ 메이: 그렇구나, \(a = a(v)\)네.

🟡 리나: 이걸로 단계 2는 완료. 남은 건 단계 3——\(a(v) = 1\)을 보이는 것이야.

단계 3: 세 관성계를 연결하면 \(a(v) = 1\)이 나온다

🟡 리나: 세 관성계 \(S_1\), \(S_2\), \(S_3\)를 생각하자. \(S_1\)에서 보아 \(S_2\)는 속도 \(\vec{v}_1\) (속력 \(v_1\))로 움직이고, \(S_2\)에서 보아 \(S_3\)는 속도 \(\vec{v}_2\) (속력 \(v_2\))로 움직이고 있다고 하자.

관성계의 속도 합성과 불변성의 증명

그림 3.6: 관성계의 속도 합성과 불변성의 증명. 왼쪽 — 3개의 관성계 \(S_1, S_2, S_3\)의 속도 관계. \(S_1\)에서 \(S_2\)로의 속도 \(\vec{v}_1\)\(S_2\)에서 \(S_3\)로의 속도 \(\vec{v}_2\) 사이의 각도 \(\theta\)가 합성 속력 \(v_{12}\)에 영향한다. 오른쪽 — \(a(v_{12}) = a(v_1) \cdot a(v_2)\)의 좌변은 \(\theta\)에 의존하지만 우변은 의존하지 않으므로, \(a\)는 상수여야 하며, \(a(0) = 1\)로부터 \(a = 1\)이 도출된다.

🟡 리나: 단계 2의 비례 관계를 각 관성계 간에 적용하면,

  • \(S_1 \to S_2\): \(ds_2^2 = a(v_1)\,ds_1^2\)
  • \(S_2 \to S_3\): \(ds_3^2 = a(v_2)\,ds_2^2\)

두 개를 조합하면,

\[ ds_3^2 = a(v_2)\,ds_2^2 = a(v_2)\,a(v_1)\,ds_1^2 \]

한편, \(S_1\)에서 \(S_3\)으로 직접 변환하면, \(S_3\)\(S_1\)에서 보았을 때의 속력을 \(v_{12}\)로 해서,

\[ ds_3^2 = a(v_{12})\,ds_1^2 \]

이 두 표현이 같은 \(ds_3^2\)를 나타내니까,

\[ a(v_{12}) = a(v_1)\cdot a(v_2) \]

🔵 카이: \(v_{12}\)는, \(S_1\)에서 본 \(S_3\)의 속력이죠? 하지만 그건 \(v_1\)\(v_2\)의 크기만이 아니라, \(\vec{v}_1\)\(\vec{v}_2\)방향 관계——각도 \(\theta\)——에도 의존할 텐데요.

🟡 리나: 맞아. 예를 들어 \(v_1 = v_2 = 0.5c\)일 때, \(\vec{v}_1\)\(\vec{v}_2\)같은 방향 (\(\theta = 0\))이면 \(v_{12}\)는 커지고, 직각 (\(\theta = \pi/2\))이면 \(\sqrt{v_1^2 + v_2^2}\) 정도, 반대 방향 (\(\theta = \pi\))이면 0에 가까워져. \(v_{12}\)\(v_1, v_2, \theta\) 세 가지에 의존해.

여기서 \(a(v_{12}) = a(v_1)\cdot a(v_2)\)라는 식을 다시 봐.

⚪ 메이: 좌변은 \(\theta\)에 의존하지만 (\(v_{12}\)\(\theta\)에 의존하니까), 우변은 \(\theta\)를 전혀 포함하지 않아 (\(v_1\)\(v_2\)만으로 결정되니까).

🟡 리나: 거기가 결정적인 포인트야. 우변 \(a(v_1) \cdot a(v_2)\)\(\theta\)를 포함하지 않아——\(v_1\)\(v_2\)만으로 결정되는 상수야. 한편, 좌변 \(a(v_{12})\)\(\theta\)를 통해 변할 수 있어. 하지만 좌변=우변이 임의의 \(\theta\)에서 성립한다면, 좌변도 \(\theta\)에 따르지 않는 상수여야 해.

🔵 카이: 즉, \(v_{12}\)가 어떤 값을 취해도 \(a(v_{12})\)는 같은 값을 반환한다……라는 건 \(a\)는 상수함수?

🟡 리나: 좋은 질문이야. 좀 더 정성스럽게 말하면, \(v_1\)\(v_2\)를 고정하고 \(\theta\) (\(\vec{v}_1\)\(\vec{v}_2\)의 사잇각)를 \(0\)에서 \(\pi\)까지 연속적으로 변화시키면, \(v_{12}\)도 어떤 최솟값에서 어떤 최댓값까지 연속적으로 변해. 예를 들어 \(\vec{v}_1\)\(\vec{v}_2\)가 같은 방향 (\(\theta = 0\))이면 합성 속력이 최대가 되고, 반대 방향 (\(\theta = \pi\))이면 최소가 돼——\(v_1\)\(v_2\)가 둘 다 0이 아니면, 최댓값과 최솟값은 다르지.

🔵 카이: 즉 \(\theta\)를 움직이면 \(v_{12}\)가 연속적으로 변한다……하지만 왜 "연속적"이라고 할 수 있나요?

🟡 리나: 관성계 간의 변환이 좌표의 1차식(단계 1에서 확인한 선형성)인 것에서, 두 1차 변환의 합성도 또한 1차 변환이고, 그 계수는 원래 변환의 계수의 다항식——따라서 연속함수——가 돼. 즉 \(\theta\)를 조금 변화시키면 \(v_{12}\)도 조금만 변한다는 것이 보장되는 거야 (속도 합성의 구체적인 식과 그 \(\theta\) 의존성은 연습문제 → 문제 M-5. 속도의 합성 법칙 유도에서 확인해 봐).

중요한 건, \(\theta\)를 움직임으로써 \(v_{12}\)하나의 값이 아니라, 어떤 범위를 취한다는 거야. 만약 \(a\)가 상수가 아니라면, \(v_{12}\)의 값이 변함에 따라 \(a(v_{12})\)도 변할 텐데——우변은 \(\theta\)에 따르지 않는 상수이니까, 그건 불가능해.

⚪ 메이: 즉 \(a\)는 그 범위에서 상수네.

🟡 리나: 맞아. 구체적으로 말하면, \(v_1\)\(v_2\)를 고정하고 \(\theta\)\(0\)에서 \(\pi\)까지 움직이면, \(v_{12}\)는 어떤 최솟값에서 어떤 최댓값까지 연속적으로 변해 (Galilei 변환이라면, \(\vec{v}_1\)\(\vec{v}_2\)가 반대 방향 (\(\theta = \pi\))일 때 \(v_{12} = |v_1 - v_2|\) (최소), 같은 방향 (\(\theta = 0\))일 때 \(v_{12} = v_1 + v_2\) (최대)——상대론에서는 약간 수정되지만, 어쨌든 \(v_1, v_2 > 0\)이면 최솟값과 최댓값은 다르다). 이 범위 내에서 \(a\)는 일정——즉 \(a\)는 하나의 값밖에 취하지 않아.

다음으로, \(v_1\)이나 \(v_2\)를 다른 값으로 바꾸어 같은 논의를 반복하면, \(v_{12}\)가 쓸어지는 범위가 변해. 예를 들어 \(v_2 = 0.3c\)로 고정하고 \(v_1\)\(0.1c, 0.5c, 0.9c, \ldots\)로 변화시켜 가면, 각각의 \(v_1\)에 대해 \(\theta\)를 움직였을 때의 \(v_{12}\) 범위가 달라져.

🔵 카이: 즉, 여러 \(v_1\) 값을 시도함으로써, \(v_{12}\)가 취할 수 있는 범위를 계속 넓혀 갈 수 있군요.

🟡 리나: 맞아. 구체적으로 말하면, \(v_1 = 0.1c\), \(v_2 = 0.3c\)일 때 \(\theta\)를 움직이면 \(v_{12}\)는 대략 \(0.2c\)에서 \(0.4c\) 범위를 취하고, \(v_1 = 0.9c\), \(v_2 = 0.3c\)일 때는 \(v_{12}\)가 대략 \(0.8c\)에서 \(0.95c\) 범위를 취해——이처럼 \(v_1\)을 변화시키면 \(v_{12}\)의 범위가 이동해 가서, 전체적으로 \([0, c)\)의 거의 전체를 커버해. \(v_{12}\)가 0에 가까운 영역도, \(v_1 \approx v_2\)로 반대 방향 (\(\theta = \pi\))으로 하면 실현할 수 있으니까, \([0, c)\)의 하단 부근도 포함해서 커버돼. 겹치는 부분에서는 \(a\)의 값이 일치해야 해——왜냐하면 \(a\)는 "속력 \(v\)를 넣으면 하나의 값을 반환하는 함수"니까, 같은 \(v_{12}\)에 대해 두 개의 다른 값을 반환할 수 없거든. 어떤 범위에서 \(a\)가 상수라는 걸 알고, 이웃 범위에서도 \(a\)가 상수라는 걸 알고, 게다가 겹치는 부분에서 값이 일치한다면, 양쪽 범위를 합쳐도 \(a\)는 같은 상수야. 이것을 반복하면, \(a\)\([0, c)\)의 전체 범위에서 같은 상수가 돼. 더불어 \(v = 0\) (같은 관성계, 즉 변환하지 않음)일 때, \(ds'^2 = ds^2\)이니까 \(a(0) = 1\). 상수이고 \(a(0) = 1\)이면, \(a = 1\).

🟡 리나: 즉,

\[ \boxed{ds^2 = ds'^2} \]

빛 이외의 경우도 포함해서, 시공간 간격 \(ds^2\)는 모든 관성계에서 같은 값을 취하는 불변량——이것이 증명하고 싶었던 것이야.

⚪ 메이: 공간의 회전에서 "거리 \(dx^2 + dy^2\)"가 불변이었던 것과 같은 구조가, 시공간에도 있는 거네. 다만 시간 항에 마이너스 부호가 붙는 것이 결정적인 차이.

🟡 리나: 맞아. 이것이 특수상대론의 기하학적 핵심이야.

✅ 이해도 체크: \(ds^2\)가 빛 이외의 경우에도 불변량임의 증명에서, 비례 계수 \(a(v) = 1\)이 도출되는 결정타는 무엇인가요?

세 관성계 \(S_1, S_2, S_3\)를 연결하면 \(a(v_{12}) = a(v_1) \cdot a(v_2)\)가 얻어진다. 좌변의 \(v_{12}\)\(\vec{v}_1\)\(\vec{v}_2\) 사이의 각도 \(\theta\)에 의존하지만, 우변은 \(\theta\)를 포함하지 않는다. 이 등식이 임의의 \(\theta\)에서 성립하려면 \(a\)가 상수여야 하며, \(a(0) = 1\) (같은 관성계에서는 변환하지 않음)으로부터 \(a = 1\)이 결론된다.

✅ 이해도 체크: 시공간 간격 \(ds^2\)의 부호에 의한 3분류 중, \(ds^2 < 0\)인 경우를 무엇이라 부르며, 물리적으로 무엇을 의미하나요?

시간적 (timelike)이라 부른다. 두 사건 사이를 광속 미만으로 이동할 수 있음을 의미하며, 인과 관계가 있을 수 있다.

부호 규약 주의: 이 장에서는 \(ds^2 = -c^2\,dt^2 + dx^2 + dy^2 + dz^2\)이라는 \((-,+,+,+)\) 부호 규약을 채택한다. 반대의 \((+,-,-,-)\)를 사용하는 교과서도 있지만, 물리적 결론은 같다. 자신이 읽고 있는 문헌이 어느 쪽인지 항상 확인하는 습관을 들이자.

참고문헌의 부호 규약: 본 「일반상대론」편의 참고문헌 중, Tong, Schutz, Lancaster & Blundell은 본 「일반상대론」편와 같은 \((-,+,+,+)\)를 사용한다. 한편, Hartle, 이시이 본, 사토 본은 반대의 \((+,-,-,-)\)를 사용한다. 이들 교과서를 참조할 때는, \(ds^2\)\(\eta_{\mu\nu}\)의 부호가 반전되어 있음에 주의할 것.


3.3 Lorentz 변환의 도출

🟡 리나: 섹션 2에서 시공간 간격 \(ds^2\)라는 불변량——0계 텐서——을 얻었어. 제 2 장의 마지막에서 "다음은 1계 텐서(4원벡터)"라고 예고했었지.

🔵 카이: 네. 다음은 1계 텐서인가요?

🟡 리나: 그 전에 하나, 해 두고 싶은 것이 있어. Newton 역학에서의 불변량——거리 \(d\ell^2 = dx^2 + dy^2 + dz^2\)——은, Galilei 변환(등속 직선 운동하는 관성계로의 갈아타기)에 대해 불변이었어. 그러면 섹션 2에서 도출한 불변량 \(ds^2\)는, 어떤 변환에 대해 불변인가? 전체 조감도를 표로 정리해 둘게.

표 3.3: 역학 체계별 불변량과 좌표 변환의 대응

Newton 역학 특수상대론 (이 장) 일반상대론
좌표 변환 Galilei 변환 Lorentz 변환 ← 섹션 3 일반 좌표 변환
불변량 0계 텐서 (스칼라) 거리 \(d\ell^2 = dx^2+dy^2+dz^2\) 시공간 간격 \(ds^2\) ← 섹션 2에서 도입 완료 \(ds^2 = g_{\mu\nu}\,dx^\mu dx^\nu\)
1계 텐서 (벡터) 위치 \(\vec{r}\), 속도 \(\vec{v}\), 힘 \(\vec{F}\) 4원속도 \(U^\mu\)제 4 장 4원벡터 \(V^\mu\)
2계 텐서 (계량) \(\delta_{ij}\) (Euclid 계량, \(i=j\)에서 1, \(i\neq j\)에서 0) Minkowski 계량 \(\eta_{\mu\nu}\)제 4 장 계량 \(g_{\mu\nu}\) (동적인 장)

⚪ 메이: Newton 역학 열은 익숙하니까, 그것과 대비하면 특수상대론에서 무엇이 변하는지가 보이네. 그리고 일반상대론 열이 최종 목표.

🟡 리나: 그래서, 시공간 간격 \(ds^2\)를 불변으로 보존하는 변환인 Lorentz (로렌츠) 변환을 정식화해 보자.

✅ 이해도 체크: Newton 역학에서의 불변량과 좌표 변환의 조합은 무엇인가요? 특수상대론에서는 그것이 어떻게 변하나요?

Newton 역학에서는 불변량이 공간 거리 \(d\ell^2 = dx^2 + dy^2 + dz^2\)이고, 그것을 보존하는 좌표 변환이 Galilei 변환이다. 특수상대론에서는 불변량이 시공간 간격 \(ds^2 = -(cdt)^2 + dx^2 + dy^2 + dz^2\)이고, 그것을 보존하는 좌표 변환이 Lorentz 변환으로 바뀐다.

문제 설정 — 관성계의 갈아타기를 식으로 표현하기

🟡 리나: 먼저, Lorentz 변환이 물리적으로 무엇을 나타내는 변환인지를 분명히 해 두자.

두 관성계 \(S\)\(S'\)를 생각해. \(S'\)\(S\)에 대해 속도 \(\vec{v}\)로 등속 직선 운동하고 있어. \(t = t' = 0\)에 양 계의 원점이 일치해 있었다고 하자.

두 관성계와 광속 불변의 원리

그림 3.7: 두 관성계와 광속 불변의 원리. 관성계 \(S\)\(S'\). \(S'\)\(S\)에 대해 \(x\) 방향으로 속도 \(v\)로 움직이고 있다. \(t=t'=0\)에 양 계의 원점이 일치하고, 그 순간에 원점에서 빛이 발해졌다. 빛의 파면은 어느 계에서 보아도 구면상으로 퍼진다 (광속 불변의 원리).

같은 하나의 사건(시공간의 점)을, \(S\)계의 관측자는 \((t, x, y, z)\)라는 좌표로, \(S'\)계의 관측자는 \((t', x', y', z')\)라는 좌표로 기록해. 이 두 좌표의 관계식을 구하는 것이, 이 섹션의 목표야. 이것이 Lorentz 변환.

🔵 카이: 즉 "움직이는 사람과 정지한 사람이, 같은 일을 어떻게 다시 기술하는가"의 식이군요.

🟡 리나: 맞아. 여기서 물리적으로 중요한 것은, 이 변환이 "관성계의 갈아타기"를 나타낸다는 것이야. 3차원의 공간 회전이 "좌표축의 방향을 바꾸는" 변환이었던 것에 대해, 이것은 "움직이는 다른 관측자로 전환하는" 변환이야. 특별한 이름이 붙어 있어서, 부스트 (boost)라고 불러.

⚪ 메이: 공간 회전과 부스트는, 둘 다 좌표를 바꾸는 변환이지만, 물리적인 의미가 다르네.

  • 공간 회전: 같은 관측자가, 좌표축의 방향을 바꾼다
  • 부스트: 다른 속도로 움직이는 관측자로 갈아탄다

🟡 리나: 맞아. 자, 부스트의 구체적인 형태를 구해 보자.

✅ 이해도 체크: 공간 회전과 부스트의 물리적 의미의 차이는 무엇인가요?

공간 회전은 같은 관측자가 좌표축의 방향을 바꾸는 변환. 부스트는 다른 속도로 움직이는 관측자(다른 관성계)로 갈아타는 변환. 둘 다 좌표를 바꾸는 변환이지만, 부스트는 시간축과 공간축을 섞는 점이 본질적으로 다르다.

두 가지 가정

🟡 리나: 도출을 위해 두 가지 가정을 놓을게. 둘 다 물리적으로 자연스러운 것이야.

가정 1 (선형성): Lorentz 변환은 좌표의 1차식으로 쓸 수 있다.

가정 2 (등방성): 상대 속도 \(\vec{v}\)\(x\) 방향만을 향하고 있다고 해도 일반성을 잃지 않는다.

🔵 카이: 왜 1차식인가요?

🟡 리나: 시공간의 균일성——어느 장소·시각에서도 물리 법칙이 같다——이 요청하는 거야. 3.2「시공간 간격의 불변성」에서 불변량의 형태를 좁혀 나갈 때도 같은 원리를 사용했지. 구체적인 예로 봐 보자. 만약 변환이 2차식, 예를 들어 \(x' = ax^2 + bt\)였다고 하자. 여기서 원점을 \(x_0\)만큼 옮겨서 \(x \to x + x_0\)로 치환하면,

\[ x' = a(x + x_0)^2 + bt = ax^2 + 2ax_0\,x + ax_0^2 + bt \]

원래 식에는 없었던 1차 항 \(2ax_0\,x\)가 나와 버려. 즉, 변환의 형태가 원점 선택 \(x_0\)에 의존해——물리 법칙이 장소에 따라 다르게 되어 버려.

한편, 1차식 \(x' = ax + bt\)라면, \(x \to x + x_0\)으로 해도 \(x' = a(x + x_0) + bt = ax + bt + ax_0\)으로, 상수항이 변할 뿐이야. 변환의 형태 (\(x\)\(t\)의 계수)는 원점에 의하지 않아. 그래서 균일한 시공간에서는 변환은 1차식이어야 해.

⚪ 메이: 가정 2는, 공간이 등방적(어느 방향도 동등)이니까, \(x\)축을 상대 속도의 방향으로 다시 취하면 반드시 실현할 수 있는 거지.

🟡 리나: 맞아. 이걸로 일반성을 잃지 않고, 이후는 상대 속도가 \(x\) 방향뿐인 경우를 생각하면 돼. 가정 1에 의해, 변환은 다음 형태로 쓸 수 있어:

\[ \begin{aligned} t' &= a_1\,t + a_2\,x + a_3\,y + a_4\,z \\ x' &= a_5\,t + a_6\,x + a_7\,y + a_8\,z \\ y' &= b_1\,t + b_2\,x + b_3\,y + b_4\,z \\ z' &= c_1\,t + c_2\,x + c_3\,y + c_4\,z \end{aligned} \]

계수는 전부 16개. 이것을 순서대로 좁혀 나갈 거야.

대칭성으로 계수를 좁혀나가기

🟡 리나: 먼저, \(y\)축과 \(z\)축은 상대 운동의 방향(\(x\) 방향)과 직교하므로, 이 좌표들은 변환으로 변하지 않는다고 가정하는 것이 자연스러워.

🔵 카이: 왜 그런가요?

🟡 리나: 상대 운동이 \(x\) 방향뿐이라면, \(y\) 방향과 \(z\) 방향은 "운동에 관여하지 않는 방향"이야. 이 방향의 길이나 시각이 변할 이유가 없어——라는 대칭성 논의야. 엄밀하게는, "\(y \to -y\)\(z \to -z\)의 반전 대칭성"과 "공간의 등방성"으로부터 \(y' = y\), \(z' = z\)가 유도돼. 자세한 증명은 참고문헌에 양보할게.

참고: \(y' = y\), \(z' = z\)의 엄밀한 도출

Landau-Lifshitz 『장의 고전론』§4나, 砂川 『이론전자기학』§12에 자세히 나와 있다. 요점은, (1) 선형 변환으로 \(y, z\)\(y', z'\)의 선형 결합으로만 연결될 수 있고, (2) 반전 \(y \to -y\)로 물리가 변하지 않는 것으로부터 \(y\)\(y'\)의 비례 계수는 \(\pm 1\)이고, (3) 항등 변환(\(v = 0\))과의 연속성으로부터 \(+1\)이라는 흐름.

⚪ 메이: 그러면 남는 변환은

\[ \begin{aligned} t' &= a_1\,t + a_2\,x + a_3\,y + a_4\,z \\ x' &= a_5\,t + a_6\,x + a_7\,y + a_8\,z \\ y' &= y \\ z' &= z \end{aligned} \]

이네.

🟡 리나: 더 나아가서, \(t'\)\(x'\)에도 \(y, z\)는 들어가지 않는다는 것을 보일 수 있어. 이유는 같아서, \(y\)-반전이나 \(z\)-반전의 대칭성 때문이야. 만약 \(t'\)\(y\)가 포함되어 있었다면, \(y \to -y\)\(t'\)가 변해 버려서, \(y\) 방향의 양음으로 시간의 진행이 다르다는 비대칭성이 생겨. 이건 등방성에 반해. \(x'\)에 대해서도 마찬가지야.

결과적으로, 변환은 다음 형태로 좁혀져:

\[ \begin{aligned} t' &= a_1\,t + a_2\,x \\ x' &= a_5\,t + a_6\,x \\ y' &= y \\ z' &= z \end{aligned} \]

여기서 각 계수의 차원을 확인해 두면, \(t' = a_1 t + a_2 x\)의 좌변은 시간의 차원이니까, \(a_1 t\) (시간)와 \(a_2 x\) (\(a_2\) × 길이)도 둘 다 시간의 차원을 가져야 해. 따라서 \(a_1\)은 무차원, \(a_2\)\([\text{시간}/\text{길이}] = [1/\text{속도}]\)의 차원이야. 마찬가지로 \(x' = a_5 t + a_6 x\)에서 \(a_5\)\([\text{길이}/\text{시간}] = [\text{속도}]\)의 차원, \(a_6\)은 무차원이야.

🔵 카이: 16개였던 계수가 4개로까지 줄었네요.

\(S'\)계 원점의 운동으로부터 1개 결정

🟡 리나: \(S\)계에서 보면, \(S'\)계의 원점(\(x' = 0\))은 시각 \(t\)\(x = vt\)의 위치에 있어. \(x' = 0\)\(x = vt\)\(x' = a_5\,t + a_6\,x\)에 대입하면,

\[ 0 = a_5\,t + a_6\,(vt) = (a_5 + a_6\,v)\,t \quad \Longrightarrow \quad a_5 = -a_6\,v \]

따라서

\[ x' = a_6\,(x - v\,t) \]

로 쓸 수 있어.

⚪ 메이: \(a_5 = -a_6 v\)\(a_5\)가 사라졌으니까, 미지수는 \(a_1, a_2, a_6\)의 3개가 됐네.

🔵 카이: 16개가 단번에 3개까지 줄었다……대칭성이 강력하네요.

\(ds^2\)의 불변성으로 나머지가 결정된다

🟡 리나: 여기서 섹션 2에서 확립한 \(ds^2\) 불변을 사용할 거야.

\[ -(c\,dt')^2 + (dx')^2 + (dy')^2 + (dz')^2 = -(c\,dt)^2 + (dx)^2 + (dy)^2 + (dz)^2 \]

\(y' = y\), \(z' = z\)이므로 \(dy'^2 + dz'^2 = dy^2 + dz^2\)은 양변에서 상쇄되고, \(t\)-\(x\) 방향의 관계만 남아:

\[ -(c\,dt')^2 + (dx')^2 = -(c\,dt)^2 + (dx)^2 \]

미소 변위도 같은 1차 변환을 따르니까,

\[ \begin{aligned} c\,dt' &= c\,a_1\,dt + c\,a_2\,dx \\ dx' &= a_6\,(dx - v\,dt) \end{aligned} \]

대입해서 정리하면,

\[ -(c\,a_1\,dt + c\,a_2\,dx)^2 + a_6^2\,(dx - v\,dt)^2 = -(c\,dt)^2 + dx^2 \]

좌변을 전개해서 \(dt^2\), \(dx^2\), \(dt\,dx\)의 계수를 우변과 비교하는 거야.

⚪ 메이: 전개해 볼게. 좌변의 제1항 \(-(c\,a_1\,dt + c\,a_2\,dx)^2\)

\[ -(c\,a_1\,dt + c\,a_2\,dx)^2 = -c^2 a_1^2\,dt^2 - 2c^2 a_1 a_2\,dt\,dx - c^2 a_2^2\,dx^2 \]

제2항 \(a_6^2(dx - v\,dt)^2\)

\[ a_6^2(dx - v\,dt)^2 = a_6^2\,dx^2 - 2a_6^2 v\,dt\,dx + a_6^2 v^2\,dt^2 \]

🔵 카이: \((a + b)^2 = a^2 + 2ab + b^2\)를 쓰는 것뿐인데, 항이 많아서 헷갈릴 것 같아요……

🟡 리나: 괜찮아. 하고 있는 건 심플해——좌변을 전부 전개해서 \(dt^2\), \(dx^2\), \(dt\,dx\)의 3종류로 정리하고, 우변 \(-(c\,dt)^2 + dx^2 = -c^2\,dt^2 + dx^2\)의 대응하는 계수와 비교하는 것뿐이야. "같은 종류의 항의 계수는 같다"——다항식의 항등식과 같은 발상이야.

\(dt^2\)의 계수:

\[ -c^2\,a_1^2 + a_6^2\,v^2 = -c^2 \]

\(dx^2\)의 계수:

\[ -c^2\,a_2^2 + a_6^2 = 1 \]

\(dt\,dx\)의 계수 (교차항):

\[ -2\,c^2\,a_1\,a_2 - 2\,a_6^2\,v = 0 \]

⚪ 메이: 이 3개의 연립방정식을 풀면 되는 거네.

🟡 리나: 맞아. 교차항의 식 \(-2c^2 a_1 a_2 - 2a_6^2 v = 0\)\(a_2\)에 대해 풀면, \(a_2 = -a_6^2 v/(c^2 a_1)\). 이것을 \(dx^2\)의 식 \(-c^2 a_2^2 + a_6^2 = 1\)에 대입하면,

\[ -c^2 \cdot \frac{a_6^4\,v^2}{c^4\,a_1^2} + a_6^2 = 1 \quad \Longrightarrow \quad a_6^2\!\left(1 - \frac{a_6^2\,v^2}{c^2\,a_1^2}\right) = 1 \]

🔵 카이: 음, 미지수가 \(a_1\)\(a_6\) 두 개인데, 식이 하나뿐이면 풀 수 없잖아요?

🟡 리나: 맞아. 그래서 또 하나의 식——\(dt^2\) 계수의 식——도 사용해. \(-c^2 a_1^2 + a_6^2 v^2 = -c^2\)을 정리하면 \(c^2(a_1^2 - 1) = a_6^2 v^2\), 즉

\[ a_1^2 = 1 + \frac{a_6^2 v^2}{c^2} \]

을 얻어. 여기서 \(a_6^2 v^2 = c^2(a_1^2 - 1)\)이므로, 위의 식에 나온 \(a_6^2 v^2/(c^2 a_1^2)\)에 이것을 대입하면,

\[ \frac{a_6^2 v^2}{c^2 a_1^2} = \frac{c^2(a_1^2 - 1)}{c^2 a_1^2} = \frac{a_1^2 - 1}{a_1^2} = 1 - \frac{1}{a_1^2} \]

⚪ 메이: 그러면 위의 식 \(a_6^2\!\left(1 - \frac{a_6^2\,v^2}{c^2\,a_1^2}\right) = 1\)에 대입하면, \(a_6^2\!\left(1 - \left(1 - \frac{1}{a_1^2}\right)\right) = a_6^2 \cdot \frac{1}{a_1^2} = 1\), 즉 \(a_6^2 = a_1^2\), 즉 \(a_6 = \pm a_1\)이네.

🟡 리나: \(\pm\) 중 어느 쪽을 택할지는 물리로 결정돼. \(v \to 0\)에서 항등 변환(\(x' = x\))으로 돌아가려면 \(a_6 = +a_1\)이 필요해. \(a_6 = a_1\)\(dt^2\)의 식 \(-c^2 a_1^2 + a_6^2 v^2 = -c^2\)에 되돌리면 \(-c^2 a_1^2 + a_1^2 v^2 = -c^2\). 좌변을 \(a_1^2\)로 묶으면 \(a_1^2(-c^2 + v^2) = -c^2\), 즉 \(a_1^2(c^2 - v^2) = c^2\). 양변을 \(c^2 - v^2\)로 나누면

\[ a_1^2 = \frac{c^2}{c^2 - v^2} = \frac{1}{1 - v^2/c^2} \]

따라서

\[ a_1 = a_6 = \frac{1}{\sqrt{1 - v^2/c^2}}, \qquad a_2 = -\frac{v/c^2}{\sqrt{1 - v^2/c^2}} \]

(\(a_2\)는 교차항의 식 \(a_2 = -a_6^2 v/(c^2 a_1)\)\(a_6 = a_1\)을 대입해서 \(a_2 = -a_1 v/c^2\)로부터 얻어진다.) 자세한 중간 계산은 연습문제에서도 확인해 봐 (→ 문제 M-1. Lorentz 변환의 계수 결정 상세 계산).

🔵 카이: \(a_6 = \pm\)의 부호는 어떻게 결정되나요?

🟡 리나: 좋은 의문이야. \(v \to 0\)에서 항등 변환(\(t' = t\), \(x' = x\))으로 돌아가야 하므로 \(a_6 = +1/\sqrt{\cdots}\)를 택해. 마이너스를 택하면 공간 반전이 들어간 변환이 되어 버려.

Lorentz 변환의 완성

🟡 리나: 여기서 Lorentz 인자 (Lorentz factor)

\[ \gamma \equiv \frac{1}{\sqrt{1 - v^2/c^2}} \]

무차원 속도 (베타) \(\beta \equiv v/c\)를 도입하면, 변환은 다음과 같이 깔끔하게 쓸 수 있어:

\[ \boxed{ \begin{aligned} ct' &= \gamma\,(ct - \beta\,x) \\[4pt] x' &= \gamma\,(x - \beta\,ct) \\[4pt] y' &= y \\[4pt] z' &= z \end{aligned} } \]

행렬로 쓰면,

\[ \begin{pmatrix} ct' \\ x' \\ y' \\ z' \end{pmatrix} = \begin{pmatrix} \gamma & -\gamma\beta & 0 & 0 \\ -\gamma\beta & \gamma & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix} \begin{pmatrix} ct \\ x \\ y \\ z \end{pmatrix} \]

이것이 \(x\) 방향의 부스트를 나타내는 Lorentz 변환이야.

🔵 카이: 제 1 장에서 Galilei 변환 \(x' = x - vt\), \(t' = t\)가 나왔었죠. \(v \ll c\)일 때 \(\gamma \approx 1\), \(\beta \approx 0\)이고, \(t'\)의 식에서 \(\beta\,x/c\) 항도 무시할 수 있으니까……Galilei 변환으로 돌아가네요! 하지만 반대로, \(v\)\(c\)에 가까워지면 얼마나 차이가 나나요?

🟡 리나: 좋은 의문이야. Lorentz 변환은 Galilei 변환의 "광속을 고려한 수정판"이야. 일상적인 속도에서는 차이가 보이지 않지만, \(v\)\(c\)에 가까워지면 극적으로 효과가 나타나. 두 변환의 대비를 표로 정리해 둘게.

표 3.4: Galilei 변환과 Lorentz 변환의 비교

Galilei 변환 Lorentz 변환
시간의 변환 \(t' = t\) (절대 시간) \(ct' = \gamma(ct - \beta\,x)\)
공간의 변환 \(x' = x - vt\) \(x' = \gamma(x - \beta\,ct)\)
보존하는 불변량 공간 거리 \(dx^2 + dy^2 + dz^2\) 시공간 간격 \(-(cdt)^2 + dx^2 + dy^2 + dz^2\)
시간과 공간의 관계 완전히 독립 섞인다
속도의 덧셈 \(v_{12} = v_1 + v_2\) \(v_{12} = \dfrac{v_1 + v_2}{1 + v_1 v_2/c^2}\) (Lorentz 변환을 2번 적용하면 유도할 수 있다. 유도는 연습문제 → 문제 M-5. 속도의 합성 법칙 유도. \(v_1, v_2 \ll c\)에서 Galilei의 식으로 돌아가고, \(v_1 = v_2 = c\)에서도 \(v_{12} = c\)——광속을 초과하지 않는다)
유효한 범위 \(v \ll c\) 임의의 \(v < c\)

로렌츠 인자와 속도의 관계

그림 3.8: 로렌츠 인자와 속도의 관계. Lorentz 인자 \(\gamma = 1/\sqrt{1 - v^2/c^2}\)는 속도가 광속에 가까워질수록 급격히 증대한다. 일상적인 속도(\(v \ll c\))에서는 \(\gamma \approx 1\)이지만, \(v \to c\)에서 \(\gamma \to \infty\).

🔵 카이: 그림 3.8「로렌츠 인자와 속도의 관계」를 보면, \(\gamma\)\(v \to c\)에서 무한대로 발산하네요. 그러면 \(v = c\) 정확히에는 도달할 수 없나요?

🟡 리나: 맞아. 질량이 있는 물체를 광속까지 가속하려면 무한한 에너지가 필요해——이건 제 4 장에서 에너지와 운동량의 관계를 유도할 때 정량적으로 살펴볼 거야.

✅ 이해도 체크: Lorentz 변환이 Galilei 변환으로 귀착되는 것은 어떤 극한에서인가요?

\(v \ll c\) (속도가 광속에 비해 충분히 작은) 극한. 이때 \(\gamma \approx 1\)이 되어, \(t' \approx t\), \(x' \approx x - vt\)로 Galilei 변환으로 돌아간다.

기하학적 해석 — 부스트는 시공간의 "쌍곡선 회전"

🟡 리나: 여기까지에서 Lorentz 변환의 구체적인 형태를 얻었어. 하지만, 이 행렬을 바라보고 있으면 하나의 구조가 보여——식의 형태가 3차원의 공간 회전과 꼭 닮았어.

🔵 카이: 공간 회전과……부스트가 닮았다고요?

🟡 리나: 비교해 보자. \(xy\) 평면에서의 좌표 회전(좌표축을 각도 \(\theta\)만큼 반시계 방향으로 돌리는 변환)은,

\[ \begin{pmatrix} x' \\ y' \end{pmatrix} = \begin{pmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} \]

(3.2「시공간 간격의 불변성」에서는 "\((x', y')\)를 사용해서 \((x, y)\)를 나타내는" 역변환 형태로 썼어. 여기서는 부스트와의 비교를 위해 "\((x, y)\)로부터 \((x', y')\)를 구하는" 순변환 형태로 쓰고 있어. 섹션 2의 식 \(x = x'\cos\theta - y'\sin\theta\), \(y = x'\sin\theta + y'\cos\theta\)\((x', y')\)에 대해 풀면 \(x' = x\cos\theta + y\sin\theta\), \(y' = -x\sin\theta + y\cos\theta\)가 얻어져. 확인: \(x'^2 + y'^2 = (x\cos\theta + y\sin\theta)^2 + (-x\sin\theta + y\cos\theta)^2\). 전개하면 \(x^2\cos^2\theta + 2xy\cos\theta\sin\theta + y^2\sin^2\theta + x^2\sin^2\theta - 2xy\sin\theta\cos\theta + y^2\cos^2\theta = x^2(\cos^2\theta + \sin^2\theta) + y^2(\sin^2\theta + \cos^2\theta) = x^2 + y^2\).)

이것은 불변량 \(x^2 + y^2\)를 보존해. 한편, \(t\)-\(x\) 방향의 Lorentz 변환(부스트)은,

\[ \begin{pmatrix} ct' \\ x' \end{pmatrix} = \begin{pmatrix} \cosh\varphi & -\sinh\varphi \\ -\sinh\varphi & \cosh\varphi \end{pmatrix} \begin{pmatrix} ct \\ x \end{pmatrix} \]

이것은 불변량 \(-(ct)^2 + x^2\)를 보존해. 행렬의 구조가 닮았어——대각 성분이 같고, 비대각 성분의 절댓값도 같아. 다만 회전행렬은 비대각 성분의 부호가 서로 반대 (\((1,2)\) 성분이 \(+\sin\theta\), \((2,1)\) 성분이 \(-\sin\theta\))인 데 반해, 부스트의 행렬은 비대각 성분이 같은 부호 (둘 다 \(-\sinh\varphi\))야. 왜 이 차이가 생기는가 하면, 회전이 보존하는 불변량은 \(x^2 + y^2\) (전부 플러스)이고, 부스트가 보존하는 불변량은 \(-(ct)^2 + x^2\) (부호가 혼재)——이 부호 구조의 차이가 행렬의 대칭성에 반영되고 있는 거야.

⚪ 메이: 차이는, 공간 회전은 \(\cos^2\theta + \sin^2\theta = 1\) (플러스)이고, 부스트는 보존하는 불변량의 부호가 마이너스와 플러스의 조합이니까……뭔가 다른 항등식을 쓸 수 있을 것 같아.

🟡 리나: 맞아. 여기서 새로운 함수를 도입할게. 삼각함수 \(\cos\theta, \sin\theta\)단위원 \(x^2 + y^2 = 1\)의 매개변수 표시였어 (\(x = \cos\theta, y = \sin\theta\)로 놓으면 \(x^2 + y^2 = 1\)이 자동으로 만족됨). 마찬가지로, 단위 쌍곡선 \(x^2 - y^2 = 1\)에 대해서도, 하나의 변수 \(\varphi\)를 움직이는 것만으로 곡선 위의 점 \((x, y)\)를 전부 나타낼 수 있는 함수가 있어——그것이 쌍곡선함수 (hyperbolic function)야:

\[ \cosh\varphi = \frac{e^\varphi + e^{-\varphi}}{2}, \qquad \sinh\varphi = \frac{e^\varphi - e^{-\varphi}}{2} \]

이 정의가 갑자기 주어진 것처럼 보일 수 있지만, 발상은 심플해. \(x^2 - y^2 = 1\)을 만족하는 \((x, y)\)를 하나의 매개변수 \(\varphi\)로 나타내고 싶다——삼각함수가 \(\cos^2\theta + \sin^2\theta = 1\)을 자동으로 만족시킨 것과 같은 발상이야.

🔵 카이: 삼각함수 쪽은 단위원이니까 \(+\)이고, 이쪽은 쌍곡선이니까 \(-\)인 거군요. 구체적으로 어떻게 이 형태에 도달하나요?

🟡 리나: 먼저 \(x^2 - y^2\)을 인수분해하면 \((x+y)(x-y) = 1\). 즉 "\(x+y\)\(x-y\)를 곱하면 1"이 되면 돼. 거기서, 곱해서 1이 되는 함수의 쌍을 찾고 싶어. 고등학교에서 배운 지수법칙 \(e^a \cdot e^b = e^{a+b}\)를 떠올려봐——\(a\)\(b\)의 합이 0이 되도록 선택하면?

🔵 카이: \(a = \varphi\), \(b = -\varphi\)로 하면 \(e^\varphi \cdot e^{-\varphi} = e^0 = 1\)! 확실히 곱해서 1이 되네요.

🟡 리나: 맞아! \(x + y = e^\varphi\), \(x - y = e^{-\varphi}\)로 놓으면, \((x+y)(x-y) = e^\varphi \cdot e^{-\varphi} = 1\)\(x^2 - y^2 = 1\)이 자동으로 만족돼. 이 연립방정식을 \(x, y\)에 대해 풀면 \(x = (e^\varphi + e^{-\varphi})/2\), \(y = (e^\varphi - e^{-\varphi})/2\)가 나와. 이것들에 \(\cosh\varphi\), \(\sinh\varphi\)라는 이름을 붙인 것이 쌍곡선함수의 정의야.

🔵 카이: 정의는 알겠는데, 구체적으로 어떤 값이 되나요? \(\cos 0 = 1\), \(\sin 0 = 0\) 같은 감각이 갖고 싶어요.

🟡 리나: 구체적인 값을 봐 보자 (\(e \approx 2.718\)은 자연로그의 밑으로, \(e^\varphi\)\(\varphi\)가 커지면 급격히 증대하고, \(e^0 = 1\), \(e^{-\varphi} = 1/e^\varphi\)라는 성질을 가진 함수야). \(\varphi = 0\)이면 \(\cosh 0 = (1+1)/2 = 1\), \(\sinh 0 = (1-1)/2 = 0\). \(\varphi = 1\)이면 \(\cosh 1 = (e + e^{-1})/2 \approx (2.72 + 0.37)/2 \approx 1.54\), \(\sinh 1 = (e - e^{-1})/2 \approx (2.72 - 0.37)/2 \approx 1.18\). \(\varphi\)가 커지면 \(\cosh\varphi\)\(e^\varphi/2\)처럼 급격히 증대하고, \(\sinh\varphi\)도 마찬가지로 증대해 (다만 \(\cosh\)는 항상 \(\sinh\)보다 크다).

⚪ 메이: \(\varphi = 0\)에서 \((\cosh, \sinh) = (1, 0)\)——삼각함수의 \((\cos 0, \sin 0) = (1, 0)\)과 같은 출발점이네.

🟡 리나: 맞아. \(x = \cosh\varphi\), \(y = \sinh\varphi\)로 놓으면, \(x^2 - y^2 = \cosh^2\varphi - \sinh^2\varphi = 1\)이 성립해——그래서 "쌍곡선" 함수라 불리는 거야. 삼각함수에서 \(x = \cos\theta\), \(y = \sin\theta\)로 놓으면 \(x^2 + y^2 = 1\) (단위)이 된 것과 같은 발상으로, 쌍곡선함수는 \(x^2 - y^2 = 1\) (단위쌍곡선)을 그려. 확인해 보자:

\[ \cosh^2\varphi - \sinh^2\varphi = \left(\frac{e^\varphi + e^{-\varphi}}{2}\right)^2 - \left(\frac{e^\varphi - e^{-\varphi}}{2}\right)^2 \]

여기서 \((a+b)^2 - (a-b)^2 = 4ab\) (고등학교에서 배우는 전개 공식)를 사용하면, \(a = e^\varphi/2\), \(b = e^{-\varphi}/2\)로 해서

\[ = 4 \cdot \frac{e^\varphi}{2} \cdot \frac{e^{-\varphi}}{2} = e^\varphi \cdot e^{-\varphi} = e^{\varphi + (-\varphi)} = e^0 = 1 \]

(지수법칙 \(e^a \cdot e^b = e^{a+b}\)를 사용했다.) \(\varphi\)를 변화시키면 점 \((x, y)\)는 쌍곡선 \(x^2 - y^2 = 1\) 위를 움직여 가.

🔵 카이: \(e\)의 지수함수로 정의하는 거군요. 삼각함수의 \(\cos\theta\)\(\sin\theta\)와 형태가 비슷한데, 뭔가 관계가 있나요? 정의식에 \(e^\varphi\)가 나오는 게 신경 쓰이는데……

🟡 리나: 좋은 감각이야. 사실 삼각함수와 쌍곡선함수에는 깊은 수학적 연결이 있어. 다만, 그것을 이해하려면 복소수의 지식이 필요하니까, 지금은 들어가지 않을게. 지금 단계에서는 "삼각함수의 친척으로, 항등식의 부호가 \(+\)에서 \(-\)로 변한 것" 정도로 생각해 두면 충분해.

🔵 카이: "부호가 바뀐 것뿐인 친척"이라. 그러면 지금은 깊이 파고들지 않고 앞으로 나갈게요.

🟡 리나: 그림 3.9「삼각함수와 쌍곡선함수의 비교」를 보면, 양자의 대응 관계가 한눈에 보여.

삼각함수와 쌍곡선함수의 비교

그림 3.9: 삼각함수와 쌍곡선함수의 비교. 왼쪽: 삼각함수 \((\cos\theta, \sin\theta)\)는 단위원 \(x^2 + y^2 = 1\) 위를 움직인다. 오른쪽: 쌍곡선함수 \((\cosh\varphi, \sinh\varphi)\)는 단위 쌍곡선 \(x^2 - y^2 = 1\) 위를 움직인다. 항등식의 부호 차이(\(+\) vs \(-\))가, Euclid 기하와 Minkowski 시공간의 차이에 대응한다.

🟡 리나: 그리고 중요한 항등식은

\[ \cosh^2\varphi - \sinh^2\varphi = 1 \]

삼각함수의 \(\cos^2\theta + \sin^2\theta = 1\)의 플러스에 대해, 쌍곡선함수는 마이너스. 바로 \(-(ct)^2 + x^2\)의 부호 패턴에 대응하고 있어.

🔵 카이: 그래서 쌍곡선함수를 쓸 수 있을 것 같다는 건 알겠어요. 하지만, \(\gamma\)\(\beta\)\(\cosh, \sinh\)로 바꾸는 동기가 아직 확 와닿지 않아요.

🟡 리나: 핵심은 "Lorentz 변환의 행렬을 하나의 매개변수로 다시 쓰고 싶다"는 거야. 공간 회전의 행렬은, 각도 \(\theta\)라는 딱 하나의 매개변수로 결정돼 (\(\cos\theta, \sin\theta\)는 연동해서 변해). 마찬가지로, 부스트의 행렬도 하나의 매개변수로 쓸 수 있을 거야.

부스트의 행렬 성분 \(\gamma\)\(\gamma\beta\)를 바라보면, \(\gamma^2 - (\gamma\beta)^2 = \gamma^2(1 - \beta^2) = \frac{1}{1-\beta^2}\cdot(1-\beta^2) = 1\)이라는 관계가 있어——이건 쌍곡선 항등식 \(\cosh^2\varphi - \sinh^2\varphi = 1\)과 같은 형태야! 그래서 \(\cosh\varphi = \gamma, \sinh\varphi = \gamma\beta\)로 놓으면 항등식이 자동으로 만족돼. 이 \(\varphi\)를 사용하면, \(\gamma\)\(\beta\)를 동시에 하나의 매개변수로 나타낼 수 있어.

🔵 카이: 오, \(\gamma^2 - (\gamma\beta)^2 = 1\)이 딱 쌍곡선 항등식 형태로 되어 있군요!

🟡 리나: 구체적으로 확인해 보자. \(\gamma = 1/\sqrt{1-\beta^2}\)\(\cosh\varphi\)와 대응시키면, 항등식에서 \(\sinh\varphi = \sqrt{\cosh^2\varphi - 1} = \sqrt{\gamma^2 - 1} = \sqrt{1/(1-\beta^2) - 1} = \beta/\sqrt{1-\beta^2} = \gamma\beta\). 그리고 삼각함수의 \(\tan\theta = \sin\theta/\cos\theta\)와 같은 발상으로, \(\tanh\varphi \equiv \sinh\varphi/\cosh\varphi\) (쌍곡선 정접)를 정의하면, \(\tanh\varphi = \gamma\beta/\gamma = \beta\). 참고로 읽는 법은, \(\cosh\)는 "코시", \(\sinh\)는 "신치", \(\tanh\)는 "탄치"로 읽는 경우가 많아 ("하이퍼볼릭 코사인" 등으로 읽는 유파도 있어). \(\tanh\)\(\varphi = 0\)에서 0이고, \(\varphi \to \infty\)에서 1에 점근하는 함수——즉 \(\beta = v/c\)가 0에서 1에 가까워지는 (광속에 점근하지만 도달하지 않는) 것과 완전히 대응하고 있어. 따라서,

\[ \cosh\varphi = \gamma, \qquad \sinh\varphi = \gamma\beta, \qquad \tanh\varphi = \beta = \frac{v}{c} \]

이 매개변수 \(\varphi\)라피디티 (rapidity)라고 불러. 그러면 Lorentz 변환은

\[ \boxed{ \begin{pmatrix} ct' \\ x' \end{pmatrix} = \begin{pmatrix} \cosh\varphi & -\sinh\varphi \\ -\sinh\varphi & \cosh\varphi \end{pmatrix} \begin{pmatrix} ct \\ x \end{pmatrix} } \]

공간 회전과 거의 같은 형태! \(\cos \to \cosh\), \(\sin \to \sinh\)로 바뀌고, 비대각 성분의 부호 패턴이 약간 다르지만 (회전은 \(+\sin\)\(-\sin\), 부스트는 둘 다 \(-\sinh\)), "대각 성분이 같고, 비대각 성분의 절댓값이 같다"는 구조는 공통이야.

🔵 카이: 그러니까 부스트는, 시공간에서의 "회전"의 일종이었나요?

🟡 리나: 맞아. 공간의 회전이 \(x\)-\(y\) 축을 섞는 변환이었던 것에 대해, 부스트는 \(t\)-\(x\) 축을 섞는 변환이야. 다만, 시간축과 공간축은 불변량 속에서 부호가 반대 (\(-(ct)^2 + x^2\))이니까, 보통의 회전 (\(\cos, \sin\))이 아니라 쌍곡선 회전 (hyperbolic rotation)이 돼.

⚪ 메이: 그래서 "Lorentz 변환은 시공간의 회전"이라고 불리는 거구나. 물리적으로는 관성계의 갈아타기이지만, 기하학적으로는 \(t\)-\(x\) 평면에서의 쌍곡선 회전과 같은 것.

🔵 카이: 그런데, 라피디티 \(\varphi\)는 얼마나 크게 할 수 있나요? 각도 \(\theta\)라면 \(0\)에서 \(2\pi\)까지 돌아서 원래로 돌아오잖아요.

🟡 리나: 라피디티는 \(-\infty < \varphi < \infty\)의 범위를 자유롭게 취할 수 있어. \(\tanh\varphi = v/c\)로 속도와 연결되어 있어서, \(\varphi \to \infty\)에서 \(v \to c\) (광속에 점근하지만 도달하지 않아). 즉 공간 회전은 매개변수 공간이 콤팩트 (\([0, 2\pi)\)로 주기적·유한 범위)이지만, 부스트는 비콤팩트 (무한히 펼쳐져 있어).

⚪ 메이: "빙글빙글 한 바퀴 돌아서 원래로 돌아오는" 회전과 "아무리 가속해도 광속에 도달하지 않는" 부스트의 차이가, 매개변수 공간의 형태에도 그대로 나타나 있구나.

🟡 리나: 이 차이는 군론적으로도 중요하고, Lorentz 군의 수학적 구조에 깊이 관련되는 이야기야. 지금은 "양자는 형태가 닮았지만, 매개변수의 취할 수 있는 범위가 결정적으로 다르다"는 것을 기억해 둬. 그리고 공간 회전 3종류 (\(x\)-\(y\), \(y\)-\(z\), \(z\)-\(x\))와 부스트 3종류 (\(t\)-\(x\), \(t\)-\(y\), \(t\)-\(z\))를 합한 총 6종류의 변환 전체를, 넓은 의미에서의 Lorentz 변환이라고 불러.

%%{init: {"theme": "default", "themeCSS": ".edgePath .path, .flowchart-link { stroke-width: 2px !important; }"}}%%
flowchart TB
    ds["불변량 ds² = -(cdt)² + dx² + dy² + dz²"]
    ds -->|"ds²를 보존하는 변환"| LT["<b>Lorentz 변환</b> (6종류)"]
    LT --> rot["<b>공간 회전</b> (3종류)<br/>x-y, y-z, z-x 축간의 회전<br/>매개변수: 각도 θ<br/>cos²θ + sin²θ = 1"]
    LT --> boost["<b>부스트</b> (3종류)<br/>t-x, t-y, t-z 축간의 쌍곡선 회전<br/>매개변수: 라피디티 φ<br/>cosh²φ - sinh²φ = 1<br/>= 관성계의 갈아타기"]

    style ds fill:#fff3cd,stroke:#856404
    style LT fill:#d1ecf1,stroke:#0c5460
    style rot fill:#d4edda,stroke:#155724
    style boost fill:#f8d7da,stroke:#721c24
그림 3.10: Lorentz 변환의 분류

✅ 이해도 체크: Lorentz 변환의 부스트 부분이, 공간 회전과 닮았지만 "쌍곡선 회전"이라 불리는 이유는 무엇인가요?

공간 회전이 불변량 \(x^2 + y^2\)를 보존하며, 삼각함수의 항등식 \(\cos^2\theta + \sin^2\theta = 1\)에 대응하는 것에 대해, 부스트는 불변량 \(-(ct)^2 + x^2\) (마이너스 부호를 포함)를 보존하며, 쌍곡선함수의 항등식 \(\cosh^2\varphi - \sinh^2\varphi = 1\)에 대응하기 때문이다. 행렬의 형태는 같고, \(\cos \to \cosh\), \(\sin \to \sinh\)로 바뀌어 있을 뿐이다.

그림 3.11「불변 쌍곡선과 Lorentz 부스트」를 봐. \(-(ct)^2 + x^2 = \text{const}\)의 궤적은 쌍곡선을 그려——부스트는 점을 이 쌍곡선을 따라 움직이는 변환이야. 부스트된 좌표축의 눈금은, 불변 쌍곡선과의 교점에서 보정돼.

불변 쌍곡선과 로렌츠 부스트

그림 3.11: 불변 쌍곡선과 Lorentz 부스트. 왼쪽: 시공간 간격 \(-(ct)^2 + x^2 = \mathrm{const}\)의 궤적은 쌍곡선을 그린다(그림의 축은 \(c = 1\) 단위로 그렸다). 시간적(\(ds^2 < 0\), 빨강)과 공간적(\(ds^2 > 0\), 파랑)의 쌍곡선이 광원뿔(주황)로 나뉜다. 오른쪽: 부스트된 좌표축 \(\bar{t}, \bar{x}\)의 눈금은, 불변 쌍곡선과의 교점에서 보정된다. 사건 \(\mathcal{A}\) (\(S\)계에서 \(t=1\))와 사건 \(\mathcal{B}\) (\(\bar{S}\)계에서 \(\bar{t}=1\))는 같은 쌍곡선 위에 있으며, 부스트로 연결된다.

📝 연습문제:


3.4 Lorentz 변환의 물리적 귀결

🟡 리나: 이제부터 세 가지 물리적 귀결을 유도할 거야. Lorentz 변환의 식으로부터, 동시성·시간·길이의 개념이 관성계마다 변한다는 것을 살펴볼 거야.

이 절의 단위계에 대해: 이 장에서는 \(c\)를 명시한 채로 쓰고 있어. 다음 제 4 장에서 \(c = 1\)의 자연단위계를 도입하지만, 물리적 귀결을 볼 때는 차원의 대응이 알기 쉬운 쪽이 좋으니까, 본 장에서는 \(c\)를 남겨 둘게.

동시성의 상대성

🟡 리나: Lorentz 변환의 \(t'\) 식을 다시 봐.

\[ t' = \gamma\!\left(t - \frac{vx}{c^2}\right) \]

\(S\)계에서 동시 (\(t_A = t_B\))이지만 다른 장소 (\(x_A \neq x_B\))에서 일어난 두 사건을 생각하면,

\[ t'_A - t'_B = -\gamma\frac{v}{c^2}(x_A - x_B) \neq 0 \]

🔵 카이: 동시가 아니게 돼! 장소가 다르면, 다른 관성계에서는 시간이 어긋나는 거군요.……그런데 \(-\gamma v(x_A - x_B)/c^2\)이라는 건, 장소의 차 \(x_A - x_B\)가 클수록 어긋남이 커진다는 거잖아요. 일상적인 스케일——예를 들어 1 km 떨어진 장소——라면, 얼마나 어긋나나요?

🟡 리나: 예를 들어 고속열차 (\(v \approx 80\,\mathrm{m/s}\))에서 \(x_A - x_B = 1\,\mathrm{km}\)이라면, \(\gamma v \Delta x / c^2 \approx 80 \times 1000 / (3 \times 10^8)^2 \approx 10^{-12}\,\mathrm{s}\)——1조분의 1초야. 일상에서는 검출 불가능하지만, GPS 위성 같은 정밀 시스템에서는 무시할 수 없는 효과야. 이것이 동시성의 상대성 (relativity of simultaneity)이야. Newton의 "절대적인 동시성"은 성립하지 않아. 그림 3.12「동시성의 상대성」를 봐——\(S\)계의 동시선과 \(S'\)계의 동시선이 기울어져 있는 것이 시각적으로 보여.

동시성의 상대성

그림 3.12: 동시성의 상대성. \(S\)계에서 동시(검은 점선)인 두 사건 A, B는, \(S'\)계(\(v = 0.5c\))에서는 동시가 아니다. \(S'\)계의 동시선(파란 일점쇄선)이 \(S\)계의 동시선에 대해 기울어져 있는 것이 원인.

시간의 지연

🟡 리나: 시간의 지연을 직관적으로 이해하기 위해, "광시계"라는 사고 실험을 사용할게 (그림 3.13「광시계에 의한 시간의 지연 도출」).

광시계에 의한 시간의 지연 도출

그림 3.13: 광시계에 의한 시간의 지연 도출. 광시계의 사고 실험. 왼쪽: \(S'\)계(광시계가 정지)에서는 빛이 거울 사이를 수직으로 왕복하며, 왕복 시간은 \(\Delta t' = 2L/c\). 오른쪽: \(S\)계(광시계가 속도 \(v\)로 운동)에서는 빛이 비스듬한 경로를 따라가며, 피타고라스 정리로부터 \(\Delta t = \gamma\,\Delta t'\)가 유도된다.

🟡 리나: 거리 \(L\)만큼 떨어진 2장의 거울 사이를 빛이 왕복하는 "광시계"를 생각해. \(S'\)계(광시계가 정지)에서는 빛이 수직으로 왕복하니까, 1왕복 시간은 \(\Delta t' = 2L/c\). \(S\)계(광시계가 속도 \(v\)로 옆으로 움직이고 있음)에서는 빛이 비스듬하게 나아가니까 경로가 길어져. 편도에 빛이 진행하는 거리를 \(d\)라 하면, 빛은 수직 방향으로 \(L\), 수평 방향으로 \(v \cdot (\Delta t/2)\) 나아가니까, 피타고라스 정리에 의해 \(d = \sqrt{L^2 + (v\Delta t/2)^2}\). 광속은 \(c\)이니까 \(d = c\Delta t/2\). 이것을 대입해서 \((c\Delta t/2)^2 = L^2 + (v\Delta t/2)^2\), 정리하면 \(\Delta t = 2L/(c\sqrt{1-v^2/c^2}) = \gamma\,\Delta t'\)로 늘어나——이것이 시간의 지연의 직관적 이해야.

🔵 카이: 피타고라스 정리만으로 유도할 수 있군요. 빛이 비스듬하게 나아가는 만큼 시간이 걸려——심플하지만 깊어요.

🟡 리나: 여기서는 같은 결과를 Lorentz 변환으로부터 직접 도출할게. \(S'\)계에서 같은 장소 (\(\Delta x' = 0\))에서 일어난 두 사건의 시간 간격을 \(\Delta t'\)로 하자. Lorentz 변환의 역변환——\(S'\)에서 \(S\)로의 변환——은, 순변환에서 \(v \to -v\)로 치환하기만 하면 얻어져. 이유는 이래: 상대성 원리에 의해, Lorentz 변환 식의 형태는 어느 관성계를 기준으로 해도 같아. \(S\)를 기준으로 하면 "\(S'\)는 속도 \(+v\)로 움직이고 있다"에서 순변환이 얻어졌어. 이번에는 \(S'\)를 기준으로 하면 "\(S\)는 속도 \(-v\)로 움직이고 있다"——\(S'\)에서 보면 \(S\)는 반대 방향으로 멀어져 가니까, 속도의 부호가 반전되는 거야. 같은 형태의 식에서 속도만 \(-v\)로 변하니까, 역변환은 \(v \to -v\)의 치환으로 얻어져. 여기서 \(\gamma = 1/\sqrt{1 - v^2/c^2}\)\(v^2\)에만 의존하니까, \(v \to -v\)로 해도 \(\gamma\)의 값은 변하지 않아——변하는 건 \(\beta = v/c\)의 부호뿐이야. 구체적으로 쓰면, 순변환 \(ct' = \gamma(ct - \beta x)\), \(x' = \gamma(x - \beta\,ct)\)에서 \(v \to -v\) (즉 \(\beta \to -\beta\))로 하면

\[ ct = \gamma(ct' + \beta\,x'), \qquad x = \gamma(x' + \beta\,ct') \]

\(t = \gamma(t' + vx'/c^2)\), \(x = \gamma(x' + vt')\).

(검산——읽기 건너뛰기 OK: 역변환 \(t = \gamma(t' + vx'/c^2)\), \(x = \gamma(x' + vt')\)를 순변환 \(ct' = \gamma(ct - \beta x)\)에 대입해서 \(ct'\)가 돌아오는 것을 확인한다. \(ct = c\gamma(t' + vx'/c^2) = \gamma(ct' + vx'/c)\), \(\beta x = (v/c)\gamma(x' + vt') = \gamma(vx'/c + v^2t'/c)\). 따라서 \(\gamma(ct - \beta x) = \gamma\bigl[\gamma(ct' + vx'/c) - \gamma(vx'/c + v^2t'/c)\bigr] = \gamma^2\bigl(ct' - v^2t'/c\bigr) = \gamma^2 \cdot ct'(1 - v^2/c^2) = ct'\). 마지막 단계에서 \(\gamma^2(1 - v^2/c^2) = 1\)을 사용했다——이건 \(\gamma = 1/\sqrt{1-v^2/c^2}\)의 정의에서 직접 나온다.) \(\Delta x' = 0\)일 때,

\[ \Delta t = \gamma(\Delta t' + v \cdot 0) = \gamma\,\Delta t' \]

\(\gamma > 1\)이니까, \(\Delta t > \Delta t'\). 이것을 시공간도로 나타내면 그림 3.14「시간의 지연의 시공간도 표현」과 같아.

시간의 지연의 시공간도 표현

그림 3.14: 시간의 지연의 시공간도 표현. \(S'\)계에서 정지한 시계가 새기는 간격 \(\Delta t'\)는, \(S\)계에서 보면 \(\Delta t = \gamma\,\Delta t'\)로 늘어난다. \(ct'\)축을 따른 간격이 \(ct\)축으로 사영되면 길어진다.

\(\gamma > 1\)이니까, \(\Delta t > \Delta t'\).

🔵 카이: 움직이는 시계는 느리게 간다! \(v = 0.9c\)이면 \(\gamma \approx 2.3\)이니까, 시간이 2배 이상 느려져……. 하지만 잠깐, \(S\)계에서 보면 \(S'\)의 시계가 느려지지만, \(S'\)계에서 보면 \(S\)의 시계가 움직이고 있는 거잖아요, \(S'\)에서 봐도 \(S\)의 시계가 느려지나요? 서로 "상대가 느리다"면 모순되지 않나요?

🟡 리나: "서로 느리다"는 의문은 매우 중요해——이건 쌍둥이 역설로 유명한 문제로, 바로 뒤의 Dive Deep에서 자세히 다룰게. 결론만 먼저 말하면, 모순되지 않아. "서로 상대가 느리다"는 건, 두 사람이 계속 등속 직선 운동을 하는 한 대칭적이어서, 어느 쪽이 "진짜로 느린지"를 결정하는 실험은 할 수 없어. 모순처럼 보이는 건, 한쪽이 가속해서 돌아왔을 때——그때 대칭성이 깨져서, 가속한 쪽이 확정적으로 젊어져.

실험적 뒷받침은, 우주선에서 생성되는 muon (뮤온)으로 확인되고 있어. 정지 수명은 약 \(2.2\,\mu\mathrm{s}\)이지만, 광속에 가까운 속도로 나는 muon은 지상 관측자가 보기에 수명이 늘어나서, 대기를 통과해 지표면까지 도달할 수 있어.

🔵 카이: \(2.2\,\mu\mathrm{s}\)이면, 광속으로도 \(c \times 2.2 \times 10^{-6} \approx 660\,\mathrm{m}\)밖에 나아갈 수 없잖아요? 대기의 두께는 몇십 km나 되는데 지표면까지 도달한다는 건, \(\gamma\)가 상당히 크지 않으면 설명이 안 되는데……실제로 얼마나 되나요?

🟡 리나: 전형적인 우주선 muon은 에너지가 높아서 \(v \approx 0.998c\) 정도로 날아와. 이때 \(\gamma \approx 15\)이고, 지상 시계로 본 수명은 \(15 \times 2.2\,\mu\mathrm{s} \approx 33\,\mu\mathrm{s}\). 그 사이에 \(0.998c \times 33\,\mu\mathrm{s} \approx 10\,\mathrm{km}\) 나아갈 수 있어——대기 상층에서 지표면까지 도달하기에 충분하지.

⚪ 메이: 정지해 있었으면 \(660\,\mathrm{m}\)밖에 나아갈 수 없는데, 시간의 지연 덕분에 \(10\,\mathrm{km}\) 이상 나아갈 수 있어——시간의 지연의 직접적 증거네.

🔍 Dive Deep: 쌍둥이 역설——왜 모순되지 않는가?

🔵 카이: 잠깐만요. "움직이는 시계는 느려진다"고 하는데, \(S\)계에서 보면 \(S'\)가 움직이고 있고, \(S'\)계에서 보면 \(S\)가 움직이고 있잖아요. 서로 "상대의 시계가 느려지고 있다"고 주장한다면, 모순되지 않나요? 쌍둥이 형제 중 한 명이 로켓으로 여행하고 돌아오면, 어느 쪽이 젊은 건가요?

🟡 리나: 이것이 유명한 쌍둥이 역설 (twin paradox)이야. 결론부터 말하면, 로켓으로 여행한 쪽이 젊어. 모순은 없어.

포인트는 대칭성이 깨져 있다는 것. 지구에 남은 형은 줄곧 관성계에 있어 (등속 직선 운동, 즉 가속도 0). 한편, 로켓으로 여행한 동생은, 출발 시에 가속하고, 되돌림 점에서 감속·반전하고, 귀환 시에 감속해——즉 가속을 경험해. 이 가속이 두 사람의 상황을 비대칭으로 만들고 있어.

특수상대론의 "움직이는 시계는 느려진다"는, 관성계 사이의 비교에만 사용할 수 있어. 동생의 로켓은 되돌림 점에서 관성계를 갈아타니까, 단순히 "동생에서 보면 형이 움직이고 있다"고는 말할 수 없어.

정량적으로는, 고유시 \(\tau\) (물체 자신의 시계가 새기는 시간)로 생각해. 시간의 지연 식 \(\Delta t' = \Delta t/\gamma = \Delta t\sqrt{1 - v^2/c^2}\)를, 속도가 변화하는 경우에 미소 구간마다 적용해서 더하면 \(\tau = \int \sqrt{1 - v^2/c^2}\,dt\)가 돼 (고유시의 정식 정의는 제 4 장에서 행함). 각자의 세계선을 따라 이 적분을 계산하면 답이 나와. 관성계에 있는 형은 \(\tau_{\text{형}} = \Delta t\) (좌표 시간 그대로). 가속·감속하는 동생은 \(v > 0\)인 구간이 있으니까 \(\sqrt{1 - v^2/c^2} < 1\)이어서, \(\tau_{\text{동생}} < \Delta t = \tau_{\text{형}}\). 동생 쪽이 고유시가 짧다=젊다.

🔵 카이: 시공간도에서 보면, 형의 세계선은 일직선이고 동생은 꺾인 선……보통 기하학이라면 우회할수록 경로가 길어지잖아요. 하지만 여기서는 동생 쪽이 고유시가 짧아——반대로 되지 않았나요?

🟡 리나: 좋은 착안점이야. 맞아서, Minkowski 시공간에서는 직선의 세계선이 고유시를 최대로 해——Euclid 기하와 반대 성질을 가지고 있어. 이건 제 8 장에서 "측지선"으로 정식화하는 이야기에 연결돼. 근본적인 이유는 시공간 간격의 마이너스 부호에 있어.

길이의 수축

🟡 리나: 다음은 길이의 수축이야. 그림 3.15「길이의 수축의 시공간도 표현」를 보면서 생각하자.

길이의 수축의 시공간도 표현

그림 3.15: 길이의 수축의 시공간도 표현. \(S'\)계에서 정지한 막대 (빨간 2개의 세계선)를 \(S\)계에서 "동시각에" 측정하면, 고유 길이 \(L_0\)보다 짧은 \(L = L_0/\gamma\)가 된다. \(S\)계의 동시선(수평)과 \(S'\)계의 동시선(기울어진 파란 일점쇄선)이 다른 것이 원인.

🟡 리나: \(S'\)계에서 정지해 있는 막대의 길이가 \(L_0\) (고유 길이)라 하자. \(S\)계에서 동시각에 (\(\Delta t = 0\)) 양 끝의 좌표를 측정하면, Lorentz 변환 \(x' = \gamma(x - vt)\)의 차분을 취해서

\[ \Delta x' = \gamma(\Delta x - v\,\Delta t) = \gamma\,\Delta x \quad (\Delta t = 0 \text{ 일 때}) \]

여기서 \(\Delta x' = L_0\)으로 놓을 수 있는 이유를 확인해 두자. 막대는 \(S'\)계에서 정지해 있으니까, 양 끝의 \(x'\) 좌표는 시간에 따르지 않고 일정——예를 들어 왼쪽 끝이 \(x' = 0\), 오른쪽 끝이 \(x' = L_0\)에 줄곧 머물러 있어. \(S\)계에서 동시각 (\(\Delta t = 0\))에 양 끝을 측정하고, 그 결과를 Lorentz 변환으로 \(S'\)의 좌표로 변환하면, \(S'\)계에서는 두 측정 사건이 동시각이라고는 할 수 없어. 하지만 막대가 정지해 있으니까, 어느 시각에 봐도 오른쪽 끝은 \(x' = L_0\), 왼쪽 끝은 \(x' = 0\)이야. 즉 \(S'\)계에서의 "오른쪽 끝의 \(x'\) 좌표"와 "왼쪽 끝의 \(x'\) 좌표"는, 각각의 측정이 언제 이루어졌는지에 관계없이 같은 값을 반환해. 그래서 \(S'\)계에서 동시각이 아니어도 \(\Delta x' = L_0\)이 성립해 (구체적 예: \(S'\)계에서 오른쪽 끝의 측정 사건이 \(t' = 3\)에, 왼쪽 끝이 \(t' = 5\)에 대응하고 있어도, 막대는 움직이지 않으니까 차이는 \(L_0 - 0 = L_0\) 그대로). 따라서 \(\Delta x' = L_0\), \(\Delta x = L\)로 놓으면

\[ L_0 = \gamma L \quad \Longrightarrow \quad L = \frac{L_0}{\gamma} \]

🔵 카이: 움직이는 물체는 운동 방향으로 줄어들어 보인다……하지만 이거, 정말로 물리적으로 줄어든 건가요? 아니면 "겉보기에 그렇게 보이는" 것뿐인가요?

🟡 리나: "동시각에 양 끝의 위치를 측정한다"는 조작의 결과가 \(L = L_0/\gamma\)가 된다——이건 측정 결과로서 실재하는 효과야. 다만, 막대 내부에 힘이 작용해서 물질적으로 압축되고 있는 건 아니야. "동시각에 측정한다"의 의미가 관성계마다 다르니까, 같은 막대라도 잘라내는 단면이 달라져서 길이가 달라 보이는 거야——시공간의 자르기 방식의 차이가 길이의 차이로 나타나는 거야.

⚪ 메이: 여기서 "동시각에 측정한다"는 조건이 본질적인 거지. 아까의 동시성의 상대성을 떠올리면, \(S\)계에서 동시각의 측정은 \(S'\)계에서는 동시각이 아니야——그래서 길이가 변하는 거네.

🔵 카이: 직관에 반하지만, 전부 Lorentz 변환에서 나오는 거군요.……그런데 하나 궁금한 건, 시간의 지연과 길이의 수축이, \(\gamma\)가 분자에 오는가 분모에 오는가의 차이뿐이잖아요. 왜 시간은 "늘어나는데" 길이는 "줄어드나요"? 반대가 되지 않는 이유는?

🟡 리나: 좋은 의문이야. 핵심은 "무엇을 고정하고 있는가"의 차이야. 시간의 지연에서는 \(\Delta x' = 0\) (같은 장소)을 고정하고 시간을 비교해——\(S'\)계에서 장소를 고정하고, \(S\)계의 시간이 \(\gamma\)배로 늘어나. 길이의 수축에서는 \(\Delta t = 0\) (동시각)을 고정하고 위치를 비교해——\(S\)계에서 시각을 고정하고, \(S'\)계의 길이가 \(1/\gamma\)배로 줄어들어. 어느 계에서 무엇을 고정하는가가 반대이니까, \(\gamma\)가 곱해지는 쪽이 반대가 되는 거야.

⚪ 메이: 즉, 고정하는 계와 비교하는 계가 뒤바뀌니까, \(\gamma\)가 분자에 오는가 분모에 오는가가 변하는 거네.

🔵 카이: 아, 그렇구나. "무엇을 고정하는가"가 다르니까 결과의 방향이 반대가 되는 거군요. 같은 Lorentz 변환인데, 절단면을 바꾸면 늘어나기도 줄어들기도 한다——하나의 변환의 다른 얼굴을 보고 있는 것뿐이구나.

🔵 카이: 그렇다면, \(\Delta t' \neq 0\)이면서 \(\Delta x' \neq 0\)처럼 아무것도 고정하지 않는 일반적인 경우는, 시간의 지연과 길이의 수축이 섞이나요?

🟡 리나: 좋은 질문이야. 맞아서, 일반적인 경우는 Lorentz 변환의 식을 그대로 쓸 수밖에 없어. 시간의 지연이나 길이의 수축은, 특정 조건을 고정했을 때의 "절단면"에 지나지 않아. 동시성의 상대성, 시간의 지연, 길이의 수축——이것들은 별개의 현상이 아니라, Lorentz 변환이라는 하나의 변환 법칙의 서로 다른 측면에 지나지 않아.

🔵 카이: 그렇군요……하나의 변환에서, 조건의 자르기 방식에 따라 여러 얼굴이 보이는 거구나. 반대로 말하면, Lorentz 변환만 확실히 잡아 두면 전부 나와. 하지만, 가속하는 경우는 어떻게 되는 걸까——관성계가 아니게 되면, 이 변환 자체를 쓸 수 없게 되잖아요.

🟡 리나: 맞아. 가속계를 다루려면, 관성계 사이의 변환만으로는 부족하고, "임의의 좌표 변환"에 대응할 수 있는 틀이 필요해——그것이 바로 일반상대론의 무대야. 제 5 장 이후에서 본격적으로 다룰 거야. 지금은 우선, 관성계 사이에서 무슨 일이 일어나는지를 정리해 두자.

🔵 카이: 특수상대론은 "관성계 한정"의 이론이고, 그 너머에 일반상대론이 있다——전체 속에서의 위치가 보이기 시작했어요.

🟡 리나: 맞아. 자 그러면 지금 단계에서, Lorentz 변환에서 나오는 세 가지 귀결을 정리해 두자.

표 3.5: Lorentz 변환의 세 가지 물리적 귀결 비교

귀결 고정하는 조건 결과 수식
동시성의 상대성 \(t_A = t_B\) (\(S\)계에서 동시) \(S'\)계에서는 동시가 아니다 \(t'_A - t'_B = -\gamma v(x_A - x_B)/c^2\)
시간의 지연 \(\Delta x' = 0\) (\(S'\)계에서 같은 장소) \(S\)계에서 시간이 늘어난다 \(\Delta t = \gamma\,\Delta t'\)
길이의 수축 \(\Delta t = 0\) (\(S\)계에서 동시각에 측정) 운동 방향으로 줄어든다 \(L = L_0/\gamma\)

✅ 이해도 체크: 시간의 지연 (time dilation)을 한마디로 설명해 보세요.

움직이는 시계는 정지해 있는 시계보다 느리게 간다. \(S'\)계에서 같은 장소에서 측정한 시간 간격 \(\Delta t'\)는, \(S\)계에서 보면 \(\Delta t = \gamma \Delta t'\) (\(\gamma > 1\))로 늘어난다.

📝 연습문제:


정리

이 장에서는, 특수상대론의 출발점에서 Lorentz 변환, 그리고 그 물리적 귀결까지를 한꺼번에 따라갔다. 요점을 정리하면:

  • 두 가지 공리 — 상대성 원리(물리 법칙은 모든 관성계에서 같은 형태)와 광속 불변의 원리(광속 \(c\)는 관측자에 따르지 않고 일정). 이 두 가지만으로 아래 모든 것이 유도된다.
  • 시공간 간격 \(ds^2\) — 광속 불변으로부터 \(ds^2 = -(cdt)^2 + dx^2 + dy^2 + dz^2\)이 모든 관성계에서 불변이 되는 0계 텐서(스칼라 불변량)로 결정되었다. 시간 항에 마이너스 부호가 붙는 것이 Euclid 기하와의 결정적 차이.
  • Lorentz 변환\(ds^2\)를 보존하는 좌표 변환. Galilei 변환의 "광속을 고려한 수정판"으로, \(v \ll c\)의 극한에서 Galilei 변환으로 돌아간다. 기하학적으로는 \(t\)-\(x\) 평면에서의 쌍곡선 회전이며, 공간 회전과 같은 구조를 가진다 (\(\cos \to \cosh\), \(\sin \to \sinh\)).
  • 물리적 귀결 — 동시성의 상대성, 시간의 지연 \(\Delta t = \gamma \Delta t'\), 길이의 수축 \(L = L_0/\gamma\). 어느 것이나 광속 불변을 받아들이면 필연적으로 나온다. Newton의 "절대 시간·절대 공간"은 성립하지 않는다.

다음 장 예고

제 4 장에서는, 본 장에서 얻은 물리적 내용을, 일반상대론으로 나아가기 위한 수학의 언어로 다시 쓴다. 자연단위계(\(c = 1\))와 첨자 표기법, Einstein의 축약 규칙, Minkowski 계량 \(\eta_{\mu\nu}\), 4원벡터, 공변벡터, 그리고 텐서의 초보까지를 정비한다. 여기서 갖춘 도구는, 제 5 장 이후에서 "휘어진 시공간"을 다룰 때 그대로 활약하게 될 것이다.


참고문헌

  • Hartle, J. B. Gravity: An Introduction to Einstein's General Relativity, Chapters 4–5. Addison-Wesley, 2003.
  • Schutz, B. F. A First Course in General Relativity, 3rd ed., Chapter 1. Cambridge University Press, 2022.
  • Tong, D. General Relativity, Chapter 1. University of Cambridge lecture notes, 2019.
  • Landau, L. D. and Lifshitz, E. M. The Classical Theory of Fields, 4th ed., §1–4. Butterworth-Heinemann, 1975. (란다우·리프시츠 『장의 고전론』)
  • 砂川重信 『이론전자기학』 제12장. 紀伊國屋書店, 1999.
  • 佐藤勝彦 『상대성이론』 岩波基礎物理シリーズ, 제1–4장. 岩波書店, 1996.
  • 石井俊全 『일반상대성이론을 한 걸음 한 걸음 수식으로 이해하기』 제8–9장. ベレ出版, 2013.
  • Lancaster, T. and Blundell, S. J. General Relativity for the Gifted Amateur, Chapter 1. Oxford University Press, 2014.