콘텐츠로 이동

제6장 곡선좌표와 계량텐서

지난 이야기: 제 5 장에서는 자유낙하하는 엘리베이터와 가속하는 로켓의 사고실험으로부터 등가원리(아인슈타인의 등가원리)를 이끌어냈다. 가속과 중력은 국소적으로 구별할 수 없다——즉 중력은 "힘"이 아니라 "시공간 자체의 성질"일 수 있다. 그렇다면 "휘어진 시공간"을 수학적으로 기술하는 도구가 필요하다.

이 장의 목표

  • 곡선좌표(극좌표·구면좌표)를 구체적 예시로 삼아, 좌표변환의 구조(Jacobi 행렬)와 계량텐서 \(g_{\mu\nu}\)의 의미를 이해한다
  • "자가 장소에 따라 달라진다"는 것이 무엇인지 수식으로 표현할 수 있게 되고, 나아가 "좌표의 휨"과 "공간의 휨"이 별개의 개념임을 구별할 수 있게 되는 것
  • 이것은 다음 장 이후에서 휘어진 시공간(Schwarzschild 계량 등)을 다루기 위한 필수 토대가 된다

이 장의 단위계: 특수상대론과의 대응을 명확히 하기 위해, \(c\)를 명시하는 SI 단위계를 사용한다. 4차원 시공간의 좌표는 \((t, x, y, z)\)\(x^0 = t\))로 하며, 이전 장까지의 \((ct, x, y, z)\)와는 다르다. 변환 규칙은 Appendix D.6을 참조.

6.1 왜 직교좌표만으로는 부족한가

🟡 리나: 이전 장에서 "중력은 시공간의 휨이다"라는 아이디어에 도달했지. 하지만 "휘어진 시공간"을 기술하려면, 먼저 "휘어지지 않은 공간"에서 좌표 다루기에 익숙해질 필요가 있어.

🔵 카이: 에, 휘어지지 않은 공간이라면 보통의 \(x, y, z\)로 충분하지 않나요?

🟡 리나: 확실히 평탄한 공간이라면 직교좌표로 전부 쓸 수 있어. 하지만 문제의 대칭성에 맞춰서 다른 좌표를 쓰고 싶은 경우가 많이 있어. 예를 들어 원운동 문제를 \(x, y\)로 기술하면 식이 복잡해지지만, 극좌표 \((r, \theta)\)라면 훨씬 보기 좋아지잖아?

🟡 리나: 그리고 더 본질적인 이유가 있어. 휘어진 시공간——예를 들어 구면——에는 전체를 덮는 직교좌표가 애초에 존재하지 않아. 지구 표면을 생각해봐. 평면의 \(x, y\) 좌표로 지구 전체를 왜곡 없이 덮는 것은 불가능하잖아. 그래서 곡선좌표를 다루는 것은 일반상대성이론으로 나아가기 위한 필수 도구야.

⚪ 메이: 그러네, 구면을 평면 좌표로 덮을 수 없다는 건 지도책만 봐도 알 수 있지. 어떤 지도 투영법을 써도 반드시 왜곡이 생기니까.

🔵 카이: 그렇군요……먼저 평탄한 공간에서 "좌표를 바꾸는" 연습을 하고, 그다음 정말로 휘어진 공간으로 나아가는 거네요.

🟡 리나: 맞아. 이 장에서는 평탄한 공간에 극좌표나 구면좌표를 도입함으로써, 좌표가 휘어져 있어도 공간 자체는 휘어져 있지 않다는 상황을 먼저 이해해. 그 위에서 "거리의 측정 방법"을 수식으로 정식화하는 거야.

✅ 이해도 체크: 휘어진 공간(예를 들어 구면)에, 전체를 덮는 직교좌표를 도입할 수 있을까요?

할 수 없다. 구면과 같은 휘어진 공간에는 전체를 왜곡 없이 덮는 직교좌표가 존재하지 않는다. 이것이 곡선좌표의 취급을 배우는 본질적인 이유 중 하나이다.

✅ 이해도 체크: "좌표의 휨"과 "공간의 휨"은 같은 개념일까요?

별개의 개념이다. 평탄한 공간에서도 곡선좌표(극좌표 등)를 사용하면 좌표선은 휘지만, 공간 자체는 휘어져 있지 않다. 양자를 혼동하지 않는 것이 중요하다.


6.2 곡선좌표의 구체적 예시

극좌표 (2차원)

🟡 리나: 가장 친숙한 곡선좌표는 2차원 평면의 극좌표(polar coordinates)야. 평면 위의 점 \(P\)를 원점으로부터의 거리 \(r\)\(x\)축 양의 방향으로부터의 각도 \(\theta\)로 지정해. 그림 6.1「직교좌표와 극좌표의 비교」를 봐봐.

직교좌표 \((x, y)\)와의 관계는:

\[ x = r\cos\theta, \quad y = r\sin\theta \]

역으로:

\[ r = \sqrt{x^2 + y^2}, \quad \theta = \arctan\!\left(\frac{y}{x}\right) \]

직교좌표와 극좌표의 비교

그림 6.1: 직교좌표와 극좌표의 비교. 같은 점 P를 직교좌표(왼쪽)와 극좌표(오른쪽)로 나타낸다.

🔵 카이: 이건 고등학교에서도 했어요.

🟡 리나: 그럼 질문. 극좌표의 좌표선——즉 "\(r\)을 고정하고 \(\theta\)만 바꾸는" 선과 "\(\theta\)를 고정하고 \(r\)만 바꾸는" 선——은 어떤 모양이 될까?

🔵 카이: \(r\) 일정인 선은 원점을 중심으로 하는 이고, \(\theta\) 일정인 선은 원점에서 뻗어나가는 직선이네요.

🟡 리나: 맞아. 좌표선이 직선이 아니니까 "곡선좌표"라고 부르는 거야. 하지만 중요한 것은, 좌표선이 휘어져 있다고 해서 공간 자체가 휘어져 있는 것은 아니라는 점이야. 종이 위에 극좌표를 그려도, 종이는 평탄한 그대로잖아?

⚪ 메이: §1에서 말한 "좌표의 휨"과 "공간의 휨"의 구별이네. 극좌표가 바로 그 구체적인 예라는 거구나.


구면좌표 (3차원)

🟡 리나: 3차원으로 확장해보자. 공간 속의 점 \(P\)를 원점으로부터의 거리 \(r\), \(z\)축으로부터의 각도 \(\theta\)(세타, 천정각), \(xy\) 평면 위에서의 각도 \(\varphi\)(파이, 편각)로 지정하는 것이 구면좌표(spherical coordinates)야. 그림 6.2「구면좌표 \((r, \theta, \varphi)\)의 정의」를 봐봐.

구면좌표의 정의

그림 6.2: 구면좌표 \((r, \theta, \varphi)\)의 정의. 원점 O에서 점 P까지의 거리가 \(r\), \(z\)축으로부터의 각도가 천정각 \(\theta\), \(xy\) 평면으로의 사영과 \(x\)축이 이루는 각이 편각 \(\varphi\).

직교좌표와의 관계는:

\[ x = r\sin\theta\cos\varphi, \quad y = r\sin\theta\sin\varphi, \quad z = r\cos\theta \]

🔵 카이: 지구의 위도·경도 같은 건가요.

🟡 리나: 맞아. 다만 천정각 \(\theta\)는 북극에서 측정하므로, 지리학의 "위도"와는 \(90°\) 차이가 난다는 점에 주의해.


6.3 좌표변환과 Jacobi 행렬

🟡 리나: 자, 여기서부터가 본론이야. 좌표를 바꿨을 때 "미소 변위"는 어떻게 변환될까? 이것을 체계적으로 다루는 도구가 Jacobi(야코비) 행렬이야.

미소 변위의 변환

🟡 리나: 직교좌표 \((x, y)\)의 미소 변위 \((dx, dy)\)와 극좌표 \((r, \theta)\)의 미소 변위 \((dr, d\theta)\)의 관계를 구해보자. \(x = r\cos\theta\)\(r\)\(\theta\)의 2변수 함수지. \(r\)\(\theta\)동시에 조금씩 변했을\(x\)는 얼마나 변할까? 1변수 함수 \(f(x)\)라면 \(df = f'(x)\,dx\)로 쓸 수 있었지. 2변수의 경우도 같은 발상으로, 변화가 충분히 작으면 "\(r\)만 바꿨을 때의 변화"와 "\(\theta\)만 바꿨을 때의 변화"를 독립적으로 계산해서 더할 수 있어. 이 "각 변수의 기여를 더해 전체 변화를 나타내는" 조작을 전미분(total differential)이라고 불러:

\[ dx = \frac{\partial x}{\partial r}\,dr + \frac{\partial x}{\partial \theta}\,d\theta \]

여기서 \(\dfrac{\partial x}{\partial r}\)는 "\(\theta\)를 고정하고 \(r\)만 바꿨을 때의 \(x\)의 변화율"(편미분), \(\dfrac{\partial x}{\partial \theta}\)는 "\(r\)을 고정하고 \(\theta\)만 바꿨을 때의 \(x\)의 변화율"이야. 1변수 미분 \(df = f'(x)\,dx\)의 자연스러운 확장이지.

🔵 카이: 아, "각 방향의 기여를 더한다"는 건, 변화가 충분히 작으니까 중첩이 성립하는 거군요.

🟡 리나: 맞아. 실제로 계산하면:

\[ dx = \cos\theta\,dr - r\sin\theta\,d\theta \]

마찬가지로 \(y = r\sin\theta\)로부터:

\[ dy = \frac{\partial y}{\partial r}\,dr + \frac{\partial y}{\partial \theta}\,d\theta = \sin\theta\,dr + r\cos\theta\,d\theta \]

행렬 형식으로 정리하면:

\[ \begin{pmatrix} dx \\ dy \end{pmatrix} = \begin{pmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{pmatrix} \begin{pmatrix} dr \\ d\theta \end{pmatrix} \]

⚪ 메이: 즉, 이 행렬 하나로 "극좌표의 미소 변위에서 직교좌표의 미소 변위로의 변환"이 전부 쓰이는 거네.

🟡 리나: 이 우변의 \(2 \times 2\) 행렬을 Jacobi 행렬이라고 불러. 일반적으로, 좌표에 번호를 붙여서 \((x^1, x^2)\), \((u^1, u^2)\)처럼 쓰기도 해. 지금의 예에서는 \((x^1, x^2) = (x, y)\)가 직교좌표, \((u^1, u^2) = (r, \theta)\)가 극좌표에 대응하고 있어. 주의할 점은, 이 위첨자 숫자는 거듭제곱이 아니라 좌표의 번호(첨자)라는 거야. \(x^2\)는 "\(x\)의 제곱"이 아니라 "2번째 좌표"(즉 \(y\))라는 뜻이야. 헷갈리지만, 텐서 계산에서는 이 표기법이 표준이야.

이 표기법을 사용하면, 좌표 \((x^1, x^2)\)를 좌표 \((u^1, u^2)\)의 함수로 썼을 때——즉 "\(u\) 좌표를 주면 \(x\) 좌표가 결정된다"는 관계를 사용해서——

\[ J^i{}_j = \frac{\partial x^i}{\partial u^j} \]

를 성분으로 하는 행렬이 Jacobi 행렬이야.

🔵 카이: \(x^2\)가 "\(x\)의 제곱"이 아니라 "2번째 좌표"라니……처음에는 혼란스러울 것 같아요. 거듭제곱이랑 구별이 안 되지 않나요?

🟡 리나: 문맥으로 판단할 수밖에 없어. 하지만 실용적으로는, 좌표에 번호를 붙일 때는 반드시 위첨자로 쓰니까, 예를 들어 극좌표라면 \(u^1 = r\), \(u^2 = \theta\)로 써. "\(u^2 = \theta\)"를 보고 "\(u\)의 제곱이 세타?"라고는 안 되잖아? 거듭제곱이 필요할 때는 \((u^1)^2\)처럼 괄호를 붙여.

⚪ 메이: 즉, 각 성분이 "새로운 좌표를 조금 움직였을 때, 오래된 좌표가 얼마나 움직이는가"를 나타내는 거네.

🔵 카이: 이 행렬의 성분이 상수가 아닌 게 포인트네요. \(r\)이나 \(\theta\)에 의존하고 있어요.

🟡 리나: 좋은 착안이야. Lorentz 변환의 행렬은 상수였지만, 일반적인 좌표변환에서는 변환행렬이 장소마다 다르다. 이것이 곡선좌표의 본질적인 새로움이야. 그림 6.3「같은 2차원 평면을 두 가지 좌표계로 덮는다」를 보면, 직교좌표의 격자가 등간격인 반면, 극좌표의 격자는 장소에 따라 간격이 달라지는 것을 알 수 있지?

좌표변환: 직교좌표와 극좌표의 격자

그림 6.3: 같은 2차원 평면을 두 가지 좌표계로 덮는다. 직교좌표(왼쪽)의 격자는 등간격이고 평행·직교, 극좌표(오른쪽)는 원점을 중심으로 방사상으로 배치된다. 같은 미소 변위를 (a) \((dx, dy)\)로 측정할지 (b) \((dr, d\theta)\)로 측정할지를 연결하는 선형변환이 Jacobi 행렬 \(J^i{}_j = \partial x^i/\partial u^j\). 이 행렬이 장소마다 다른 것이 곡선좌표의 본질적인 특징.

✅ 이해도 체크: Lorentz 변환의 변환행렬과 일반적인 곡선좌표 변환의 Jacobi 행렬의 결정적인 차이는 무엇일까요?

Lorentz 변환의 행렬은 상수(장소에 무관)이지만, 일반적인 곡선좌표 변환의 Jacobi 행렬은 좌표값(장소)에 의존한다. 이것이 곡선좌표의 본질적인 새로움이다.


역변환과 Jacobi 행렬의 역행렬

🟡 리나: 역방향의 변환도 생각해보자. \(r = \sqrt{x^2 + y^2}\), \(\theta = \arctan(y/x)\)를 편미분하면:

\[ \frac{\partial r}{\partial x} = \frac{x}{\sqrt{x^2 + y^2}} = \cos\theta, \quad \frac{\partial r}{\partial y} = \sin\theta \]
\[ \frac{\partial \theta}{\partial x} = -\frac{y}{x^2 + y^2} = -\frac{\sin\theta}{r}, \quad \frac{\partial \theta}{\partial y} = \frac{x}{x^2 + y^2} = \frac{\cos\theta}{r} \]

(힌트: \(r = \sqrt{x^2 + y^2} = (x^2 + y^2)^{1/2}\)이므로, 합성함수의 미분으로 \(\partial r/\partial x = \frac{1}{2}(x^2+y^2)^{-1/2}\cdot 2x = x/\sqrt{x^2+y^2}\). \(\partial r/\partial y\)도 마찬가지로 \(y/\sqrt{x^2+y^2}\). \(\theta\)에 대해서는, \(x > 0\) 영역에서 \(\theta = \arctan(y/x)\)로 두고, 역삼각함수의 미분 공식 \((\arctan u)' = 1/(1 + u^2)\)(도출은 바로 아래 접힌 보충을 열어서 확인해봐)과 합성함수의 미분을 적용한다. \(\partial\theta/\partial x\): \(u = y/x\)로 놓으면 \(\partial u/\partial x = -y/x^2\)이므로 \(\partial\theta/\partial x = \frac{1}{1+(y/x)^2}\cdot(-y/x^2) = -y/(x^2+y^2)\). \(\partial\theta/\partial y\): 마찬가지로 \(u = y/x\)에서 \(\partial u/\partial y = 1/x\)이므로 \(\partial\theta/\partial y = \frac{1}{1+(y/x)^2}\cdot(1/x) = x/(x^2+y^2)\).)

::: {.callout-note collapse="true" title="보충: \((\arctan u)' = 1/(1+u^2)\)의 도출"} \(\theta = \arctan u\)로 놓으면 \(\tan\theta = u\). 양변을 \(u\)로 미분하면, 좌변은 합성함수의 미분으로 \(\frac{1}{\cos^2\theta}\cdot\frac{d\theta}{du}\), 우변은 1. 따라서 \(\frac{d\theta}{du} = \cos^2\theta\). 여기서 \(1 + \tan^2\theta = 1/\cos^2\theta\)(\(\sin^2\theta + \cos^2\theta = 1\)의 양변을 \(\cos^2\theta\)로 나누면 얻어진다)이므로 \(\cos^2\theta = 1/(1 + u^2)\). 이상으로 \((\arctan u)' = 1/(1 + u^2)\). :::

행렬 형식으로:

\[ \begin{pmatrix} dr \\ d\theta \end{pmatrix} = \begin{pmatrix} \cos\theta & \sin\theta \\[4pt] -\dfrac{\sin\theta}{r} & \dfrac{\cos\theta}{r} \end{pmatrix} \begin{pmatrix} dx \\ dy \end{pmatrix} \]

🟡 리나: 이 2개의 Jacobi 행렬을 곱해보자. 역행렬 관계가 되어 있을 거야. 메이, 계산해볼래?

\[ \begin{pmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{pmatrix} \begin{pmatrix} \cos\theta & \sin\theta \\[4pt] -\dfrac{\sin\theta}{r} & \dfrac{\cos\theta}{r} \end{pmatrix} \]

⚪ 메이: 해볼게.

\((1,1)\) 성분: \(\cos\theta \cdot \cos\theta + (-r\sin\theta) \cdot \left(-\dfrac{\sin\theta}{r}\right) = \cos^2\theta + \sin^2\theta = 1\)

\((1,2)\) 성분: \(\cos\theta\sin\theta - r\sin\theta \cdot \dfrac{\cos\theta}{r} = 0\)

\((2,1)\) 성분: \(\sin\theta \cdot \cos\theta + r\cos\theta \cdot \left(-\dfrac{\sin\theta}{r}\right) = \sin\theta\cos\theta - \sin\theta\cos\theta = 0\)

\((2,2)\) 성분: \(\sin^2\theta + r\cos\theta \cdot \dfrac{\cos\theta}{r} = 1\)

결과는 단위행렬. 즉 두 Jacobi 행렬은 서로 역행렬이네.

🟡 리나: 맞아. 이것은 일반적으로 성립하는 정리야. 연쇄법칙(chain rule)을 사용하면 한 줄로 증명할 수 있어. 여기서 Einstein의 축약 규약을 다시 확인해두자——제 2 장에서 소개한 "같은 식 안에서 위와 아래에 같은 첨자가 나타나면 그 첨자에 대해 합을 취한다"는 약속이야. 예를 들어 \(A^j B_j\)라고 쓰면 \(\sum_j A^j B_j = A^1 B_1 + A^2 B_2 + \cdots\)의 의미. 2차원이라면 \(A^j B_j = A^1 B_1 + A^2 B_2\). 일일이 \(\sum\)을 쓰지 않아도 되니까, 텐서 계산에서는 표준적으로 사용돼. 이 장에서는 편미분의 첨자에도 적용하니까, 규칙을 확실히 떠올려둬.

🔵 카이: "위와 아래에 같은 첨자"라는데, 어떻게 위아래를 판단하나요? 아까 Jacobi 행렬 \(J^i{}_j\)처럼 명시적으로 위아래에 써 있으면 알겠는데, 편미분일 때는요?

🟡 리나: 좋은 질문이야. 편미분의 경우는 다음 규칙이야: 분자에 있는 첨자는 "위", 분모에 있는 첨자는 "아래"로 센다. 예를 들어 \(\dfrac{\partial x^i}{\partial u^j}\)라면, \(i\)는 분자에 있으니 "위", \(j\)는 분모에 있으니 "아래". 직관적으로는, \(dx^i\)는 좌표의 변화량으로 위첨자를 가진 것이고, \(\partial u^j\)는 분모에 있으니 "나누는 쪽"으로 아래첨자가 된다고 생각하면 돼. 왜 이 구별이 본질적인지는 다음 장에서 "반변·공변"을 체계적으로 배울 때 알게 될 테니, 지금은 "분자는 위, 분모는 아래"라는 규칙만 기억해두면 충분해.

🔵 카이: 아하, \(\dfrac{\partial x^i}{\partial u^j}\)라면 \(i\)가 위고 \(j\)가 아래……그리고 \(\dfrac{\partial u^j}{\partial x^k}\)에서는 \(j\)가 분자에 있으니 위. 즉 \(j\)가 아래와 위 양쪽에 나타나니까, \(j\)에 대해 합을 취한다——는 거군요.

🟡 리나: 맞아. 이 규약을 사용하면, 연쇄법칙은 다음과 같이 쓸 수 있어:

\[ \frac{\partial x^i}{\partial u^j}\frac{\partial u^j}{\partial x^k} = \frac{\partial x^i}{\partial x^k} = \delta^i_k \]

좌변을 봐. 첫 번째 인수 \(\dfrac{\partial x^i}{\partial u^j}\)에서 \(j\)는 아래(분모), 다음 인수 \(\dfrac{\partial u^j}{\partial x^k}\)에서 \(j\)는 위(분자)——즉 \(j\)가 위와 아래 양쪽에 나타나니까, \(j\)에 대해 합을 취해. 전개하면 \(\sum_{j} \dfrac{\partial x^i}{\partial u^j}\dfrac{\partial u^j}{\partial x^k}\)라는 의미야.

⚪ 메이: 첨자의 위아래만 추적하면 "어디에 합이 들어가는지"가 자동으로 결정되는 거네. 익숙해지면 \(\sum\)을 쓰는 것보다 편할 것 같아.

🟡 리나: 2차원에서 구체적으로 쓰면, 예를 들어 \(i = 1\), \(k = 1\)일 때:

\[ \frac{\partial x^1}{\partial u^1}\frac{\partial u^1}{\partial x^1} + \frac{\partial x^1}{\partial u^2}\frac{\partial u^2}{\partial x^1} = \delta^1_1 = 1 \]

이것은 "\(x\)\((r, \theta)\)를 거쳐 \(x\) 자신으로 되돌리는" 조작이 항등변환이 된다는 뜻이야. 우변에 나온 \(\delta^i_k\)Kronecker(크로네커) 델타라고 불리는 기호로, \(i = k\)이면 1, \(i \neq k\)이면 0이라는 정의야. 즉 "\(x^i\)\(x^k\)로 미분하면, 같은 좌표끼리(\(i = k\))이면 1, 다른 좌표(\(i \neq k\))이면 0"이라는 당연한 것을 기호로 만든 거야. 구체적으로 말하면, \(x^1 = x\), \(x^2 = y\)일 때 \(\partial x / \partial x = 1\), \(\partial x / \partial y = 0\)——\(x\)\(y\)는 독립적인 좌표이므로, 한쪽을 바꿔도 다른 쪽은 변하지 않아. 2차원이라면 \(\delta^1_1 = 1\), \(\delta^1_2 = 0\), \(\delta^2_1 = 0\), \(\delta^2_2 = 1\)이니까, 행렬로 쓰면 단위행렬 \(\begin{pmatrix}1 & 0\\0 & 1\end{pmatrix}\)의 성분 그 자체야. 첨자가 위아래로 나뉘어 있는 것은 좌변의 첨자 위치에 맞춘 것일 뿐이야.

🔵 카이: 즉 "가는 변환행렬"과 "돌아오는 변환행렬"은 항상 역행렬 관계에 있는 거군요.

✅ 이해도 체크: 좌표변환 \(x^i(u^j)\)의 Jacobi 행렬과, 역변환 \(u^j(x^i)\)의 Jacobi 행렬 사이에는 어떤 관계가 있을까요?

서로 역행렬 관계에 있다. 연쇄법칙으로부터 \(\frac{\partial x^i}{\partial u^j}\frac{\partial u^j}{\partial x^k} = \delta^i_k\)가 성립하기 때문이다.

✅ 이해도 체크: Jacobi 행렬이란 무엇일까요?

좌표변환 \(x^i = x^i(u^1, u^2, \ldots)\)의 편미분 \(J^i{}_j = \partial x^i / \partial u^j\)를 성분으로 하는 행렬. 미소 변위가 어떻게 변환되는지를 기술한다. 일반적인 좌표변환에서는 Lorentz 변환과 달리 성분이 장소마다 다르다.

📝 연습문제:


6.4 "거리"를 좌표로 나타내기——계량텐서의 도입

동기: 좌표가 바뀌어도 거리는 변하지 않는다

🟡 리나: 자, 여기서부터가 이 장의 핵심이야. 물리에서 가장 기본적인 양 중 하나가 "두 점 사이의 거리"야. 거리는 좌표의 선택에 의존하지 않아——서울에서 뉴욕까지의 거리는 지도 그리는 방법을 바꿔도 변하지 않잖아?

🔵 카이: 네, 당연하죠.

🟡 리나: 하지만 거리를 계산하는 식은 좌표에 따라 달라져. 직교좌표라면 피타고라스(Pythagoras) 정리 그 자체:

\[ ds^2 = dx^2 + dy^2 \]

그럼 극좌표에서는? \(dx = \cos\theta\,dr - r\sin\theta\,d\theta\), \(dy = \sin\theta\,dr + r\cos\theta\,d\theta\)를 대입해봐.

⚪ 메이: 계산해볼게.

\[ dx^2 + dy^2 = (\cos\theta\,dr - r\sin\theta\,d\theta)^2 + (\sin\theta\,dr + r\cos\theta\,d\theta)^2 \]

첫째 항을 전개:

\[ \cos^2\theta\,dr^2 - 2r\sin\theta\cos\theta\,dr\,d\theta + r^2\sin^2\theta\,d\theta^2 \]

둘째 항을 전개:

\[ \sin^2\theta\,dr^2 + 2r\sin\theta\cos\theta\,dr\,d\theta + r^2\cos^2\theta\,d\theta^2 \]

🔵 카이: 아, \(dr\,d\theta\) 항이 부호가 반대라서 상쇄될 것 같아요!

⚪ 메이: 맞아. 더하면 교차항이 사라져서:

\[ ds^2 = (\cos^2\theta + \sin^2\theta)\,dr^2 + r^2(\sin^2\theta + \cos^2\theta)\,d\theta^2 \]
\[ \boxed{ds^2 = dr^2 + r^2\,d\theta^2} \]

🔵 카이: 오, 깔끔하게 정리됐네요! 그런데……\(d\theta^2\) 앞에 \(r^2\)이 붙어 있네요. 직교좌표일 때는 \(dx^2 + dy^2\)으로 계수가 전부 1이었는데.

🟡 리나: 맞아. 여기가 핵심 포인트야. 극좌표에서 \(\theta\)를 1라디안 바꿨을 때 실제로 이동하는 거리는 원점으로부터의 거리 \(r\)에 의존해. \(r = 1\)이면 1라디안으로 거리 1이지만, \(r = 10\)이면 1라디안으로 거리 10이야. 그래서 \(d\theta^2\) 앞에 \(r^2\)이라는 "가중치"가 붙는 거야.

🔵 카이: 즉, 같은 \(d\theta\)라도 장소에 따라 "실제 거리"가 다르다는 건가요.

🟡 리나: 맞아. 이것이 "자가 장소에 따라 달라진다"는 것의 정체야. 그림 6.4「극좌표 계량의 의미」를 보면, 같은 \(d\theta\)라도 \(r\)이 클수록 호의 길이가 길어지는 게 한눈에 보이지.

극좌표 계량의 의미

그림 6.4: 극좌표 계량의 의미. 같은 각도 변화 \(d\theta\)라도 원점으로부터의 거리 \(r\)이 클수록 실제 호의 길이 \(r\,d\theta\)는 길어진다. 이것이 \(g_{22} = r^2\)의 기하학적 의미.

✅ 이해도 체크: 극좌표의 선소 \(ds^2 = dr^2 + r^2\,d\theta^2\)에서 \(d\theta^2\) 앞에 \(r^2\)이 붙는 물리적 의미는 무엇일까요?

각도 \(\theta\)를 같은 만큼 바꿔도, 원점으로부터의 거리 \(r\)이 클수록 실제로 이동하는 거리가 커진다는 것을 의미한다. 즉 \(\theta\) 방향의 "자"의 눈금 폭이 \(r\)에 비례하여 변한다.


계량텐서 \(g_{ij}\)의 정의

🟡 리나: 이 "거리의 공식"을 일반적으로 쓰기 위한 도구가 계량텐서(metric tensor) \(g_{ij}\)야.

좌표 \((u^1, u^2)\)——극좌표라면 \((u^1, u^2) = (r, \theta)\)——를 사용해서, 미소 거리의 제곱을

\[ ds^2 = g_{ij}(u)\,du^i\,du^j \]

로 써. 여기서 §3에서 도입한 Einstein의 축약 규약을 사용하고 있어——\(g_{ij}\,du^i\,du^j\)를 봐봐. \(i\)라는 첨자는 \(g_{ij}\)에서는 아래첨자, \(du^i\)에서는 위첨자로 나타나——즉 같은 첨자 \(i\)가 위와 아래 양쪽에 있으니까, \(i\)에 대해 합을 취해. 마찬가지로 \(j\)\(g_{ij}\)에서 아래, \(du^j\)에서 위에 나타나니까 \(j\)에 대해서도 합을 취해. 즉 \(g_{ij}\,du^i\,du^j = \sum_{i=1}^{2}\sum_{j=1}^{2} g_{ij}\,du^i\,du^j\)의 약기야. 2차원(\(i, j\)가 각각 1, 2를 달린다)이라면, 4개의 항을 전부 써보면:

\[ ds^2 = g_{11}\,(du^1)^2 + g_{12}\,du^1\,du^2 + g_{21}\,du^2\,du^1 + g_{22}\,(du^2)^2 \]

🔵 카이: \(g_{12}\)\(g_{21}\)은 별개의 성분인가요?

🟡 리나: 좋은 질문이야. 사실 \(du^1\,du^2 = du^2\,du^1\)(단순한 수의 곱셈)이니까, \(g_{12}\,du^1\,du^2 + g_{21}\,du^2\,du^1 = (g_{12} + g_{21})\,du^1\,du^2\)로 쓸 수 있어. "\(g_{12}\)\(g_{21}\)의 합"만이 의미를 가져. 그래서 항상 \(g_{12} = g_{21}\)로 대칭으로 잡는 약속을 해. 일반적으로 \(n\)차원에서는, 계량텐서가 대칭 조건 \(g_{ij} = g_{ji}\)를 만족한다고 다뤄. 대칭행렬이니까 \(n \times n\)이면 독립 성분은 \(n(n+1)/2\)개——대각 성분이 \(n\)개, 상삼각 부분이 \(n(n-1)/2\)개야. 2차원이면 \(g_{11}, g_{12} = g_{21}, g_{22}\)의 3개. 4차원 시공간이면 \(n = 4\)\(4 \times 5 / 2 = 10\)개. 이전 장에서 "중력은 시공간의 휨이다"라고 배웠지. 시공간의 휘는 방식——즉 "장소마다 자가 어떻게 변하는가"——를 기술하는 것이 바로 이 계량텐서 \(g_{\mu\nu}\)야.

🔵 카이: 2차원에서 3개, 4차원에서 10개……갑자기 늘어나네요. Newton 중력에서는 퍼텐셜 \(\Phi\)가 함수 1개뿐이었잖아요. 그게 10개로 늘어나는 건 뭐가 그렇게 복잡해지는 건가요?

🟡 리나: Newton 중력은 "질량이 서로 끌어당기는 힘의 세기"만을 기술했지만, 일반상대론에서는 시간의 지연이나 공간의 왜곡도 포함한 시공간 전체의 기하를 기술해. 그래서 1개로는 부족하고 10개가 필요해——그만큼 중력의 기술이 풍부해진다는 뜻이야.

⚪ 메이: 그렇구나, 시간과 공간 양쪽의 왜곡을 기술하니까 성분이 많이 필요한 거네.

🟡 리나: 자, 이야기를 돌려보자. 구체적으로 극좌표의 계량텐서 성분을 읽어봐.

⚪ 메이: 극좌표의 경우, \(ds^2 = dr^2 + r^2\,d\theta^2\)이니까, 비교하면:

\[ g_{11} = 1, \quad g_{12} = g_{21} = 0, \quad g_{22} = r^2 \]

행렬로 쓰면:

\[ g_{ij} = \begin{pmatrix} 1 & 0 \\ 0 & r^2 \end{pmatrix} \]

🔵 카이: 직교좌표에서는 \(g_{ij}\)가 어떻게 되나요?

🟡 리나: \(ds^2 = dx^2 + dy^2\)이니까:

\[ g_{ij} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = \delta_{ij} \]

단위행렬——즉 Kronecker 델타야. 계량텐서가 단위행렬이 되는 좌표계가 직교좌표인 거야.

🔵 카이: 그렇군요. 직교좌표가 "특별히 단순"한 건, 계량텐서가 상수인 단위행렬이기 때문이군요. 그럼 반대로, 계량텐서가 단위행렬이 아닌 좌표계에서는 거리 계산이 번거로워질 뿐이지, 물리적인 내용은 아무것도 변하지 않는 건가요?

🟡 리나: 평탄한 공간 안에서 좌표를 바꾸는 것뿐이라면, 그 말이 맞아——계산의 겉모습이 바뀔 뿐 물리는 같아. 하지만 진짜 휘어진 공간에서는 이야기가 달라져. 그걸 다음에 살펴보자.

🔵 카이: "진짜 휘어진 공간"이면 뭐가 달라지는지……궁금해요.

✅ 이해도 체크: 계량텐서 \(g_{ij}\)가 대칭(\(g_{ij} = g_{ji}\))인 이유는 무엇일까요?

\(ds^2 = g_{ij}\,du^i\,du^j\) 안에서 \(du^i\,du^j = du^j\,du^i\)(단순한 수의 곱)이므로, \(g_{ij}\)\(g_{ji}\)의 합만이 물리적 의미를 갖는다. 그래서 항상 대칭으로 잡는 약속을 한다.

✅ 이해도 체크: 극좌표의 계량텐서 \(g_{ij}\)를 행렬로 써보세요.

\(g_{ij} = \begin{pmatrix} 1 & 0 \\ 0 & r^2 \end{pmatrix}\). \(g_{22} = r^2\)는 "\(\theta\) 방향 좌표 1눈금당 실제 거리가 \(r\)에 비례한다"는 것을 나타낸다.


구면좌표의 계량텐서

🟡 리나: 3차원 구면좌표 \((r, \theta, \varphi)\)에서도 같은 것을 해보자. \(dx^2 + dy^2 + dz^2\)을 구면좌표로 다시 쓰는 거야. 방침은 2차원 때와 같아——\(x, y, z\) 각각의 전미분을 구해서 제곱하고 더해. \(dx = \sin\theta\cos\varphi\,dr + r\cos\theta\cos\varphi\,d\theta - r\sin\theta\sin\varphi\,d\varphi\)처럼 3변수가 되니까 항은 늘어나지만, 2차원 때와 완전히 같은 구조야. \(dx^2 + dy^2 + dz^2\)을 전개하면 교차항(\(dr\,d\theta\), \(dr\,d\varphi\), \(d\theta\,d\varphi\) 항)이 나오지만, \(x, y, z\) 세 개로부터의 기여를 합하면 \(\sin^2\alpha + \cos^2\alpha = 1\) 덕분에 모두 상쇄돼.

🔵 카이: 2차원 때도 교차항이 깔끔하게 사라졌는데, 3차원에서도 같은 일이 일어나는군요.

🟡 리나: 힌트: 예를 들어 \(dr\,d\theta\)의 계수를 보면, \(dx^2\)에서 \(2r\sin\theta\cos\theta\cos^2\varphi\), \(dy^2\)에서 \(2r\sin\theta\cos\theta\sin^2\varphi\), \(dz^2\)에서 \(-2r\sin\theta\cos\theta\)가 나와서, 더하면 \(2r\sin\theta\cos\theta(\cos^2\varphi + \sin^2\varphi - 1) = 0\)이 되어 사라져. \(dr\,d\varphi\)의 교차항도 마찬가지로 \(\cos^2\varphi + \sin^2\varphi - 1 = 0\) 형태의 상쇄로 사라지고, \(d\theta\,d\varphi\)의 교차항은 \(dx^2\)로부터의 기여 \(-2r^2\sin\theta\cos\theta\sin\varphi\cos\varphi\)\(dy^2\)로부터의 기여 \(+2r^2\sin\theta\cos\theta\sin\varphi\cos\varphi\)가 상쇄되어 사라져(\(dz^2\)에서는 \(d\varphi\)를 포함하는 항이 나오지 않으므로 기여 0). 모든 계산은 연습문제 문제 M-2. 구좌표 선소의 도출에서 확인해봐. 결과는:

\[ ds^2 = dr^2 + r^2\,d\theta^2 + r^2\sin^2\theta\,d\varphi^2 \]

⚪ 메이: 따라서 계량텐서는:

\[ g_{ij} = \begin{pmatrix} 1 & 0 & 0 \\ 0 & r^2 & 0 \\ 0 & 0 & r^2\sin^2\theta \end{pmatrix} \]

🔵 카이: \(d\varphi^2\) 앞에 \(r^2\sin^2\theta\)가 붙는 건……아, 적도 부근(\(\theta = \pi/2\))에서는 경도를 1라디안 바꾸면 \(r\)만큼 이동하지만, 북극 부근(\(\theta \approx 0\))에서는 거의 이동하지 않으니까요! 그런데 \(\theta = 0\)(북극)이면 \(g_{33} = 0\)이 되잖아요. 계량텐서 성분이 0이면 뭔가 문제가 되지 않나요?

🟡 리나: 좋은 질문이야. \(g_{33} = 0\)은 "\(\varphi\)를 바꿔도 이동 거리가 0"——즉 북극에서는 모든 경선이 한 점에 모이기 때문에, 경도의 차이에 물리적 의미가 없다는 뜻이야. 좌표로서의 \(\varphi\)는 정의되어 있지만, 거기서는 \(\varphi\) 방향의 "자" 눈금 폭이 0이 되는 거야. 이것을 좌표 특이점(coordinate singularity)이라 부르는데, 공간 자체가 망가진 것이 아니야——다른 좌표를 쓰면 문제없이 기술할 수 있어. 지구로 생각하면 알기 쉽지. 적도 위에서는 경도 1°로 약 111 km 이동하지만, 북위 60°에서는 약 56 km밖에 이동하지 않아. \(\sin^2\theta\)가 그 "장소에 따른 거리의 차이"를 표현하고 있는 거야.

✅ 이해도 체크: 3차원 구면좌표의 계량텐서 \(g_{33} = r^2\sin^2\theta\)\(\theta\)에 의존하는 기하학적 이유는 무엇일까요?

\(\varphi\) 방향 원둘레의 반지름이 \(r\sin\theta\)이며 천정각 \(\theta\)에 따라 변하기 때문이다. 적도(\(\theta = \pi/2\))에서 최대이고, 극(\(\theta = 0\) 또는 \(\pi\))에서 0이 된다.

🟡 리나: 여기까지 3가지 좌표계에서 계량텐서를 구했어. 메이, 정리해볼래?

⚪ 메이: 해볼게. 좌표계에 따라 이렇게 형태가 다르구나.

표 6.1: 각 좌표계에서의 계량텐서 비교

좌표계 선소 \(ds^2\) \(g_{ij}\) (행렬 표시) 공간의 휨
2D 직교 \((x, y)\) \(dx^2 + dy^2\) \(\mathrm{diag}(1, 1)\) 평탄
2D 극좌표 \((r, \theta)\) \(dr^2 + r^2\,d\theta^2\) \(\mathrm{diag}(1, r^2)\) 평탄
3D 구면좌표 \((r, \theta, \varphi)\) \(dr^2 + r^2\,d\theta^2 + r^2\sin^2\theta\,d\varphi^2\) \(\mathrm{diag}(1, r^2, r^2\sin^2\theta)\) 평탄

📝 연습문제:


구면의 계량——휘어진 공간의 예

🟡 리나: 여기까지는 평탄한 공간을 곡선좌표로 쓴 것에 불과했어. 다음으로 진짜 휘어진 공간의 예를 살펴보자. 반지름 \(a\)인 구면(2차원의 휘어진 공간)을 좌표 \((u^1, u^2) = (\theta, \varphi)\)로 기술하면:

\[ ds^2 = a^2\,d\theta^2 + a^2\sin^2\theta\,d\varphi^2 \]

계량텐서는——2차원이니까 \(2 \times 2\) 행렬로, \((u^1, u^2) = (\theta, \varphi)\) 순서에 대응시켜:

\[ g_{ij} = \begin{pmatrix} a^2 & 0 \\ 0 & a^2\sin^2\theta \end{pmatrix} \]

🔵 카이: 어, 이건 3차원 구면좌표의 \(g_{22}\)\(g_{33}\) 부분을 꺼내서 \(r = a\)(상수)로 놓은 거잖아요?

🟡 리나: 좋은 관찰이야. 구면은 3차원 공간에 묻힌(embedded) 2차원 곡면이니까, 3차원 계량에서 \(r\)을 고정한 "단면"이 구면의 계량이 되는 거야.

🔵 카이: 그런데, 평탄한 평면의 극좌표에서도 계량텐서가 장소에 의존했잖아요(\(g_{22} = r^2\)). 구면에서도 장소에 의존해요. 계량텐서가 장소에 의존하는 것만으로 "휘어져 있다"고 할 수 있나요?

🟡 리나: 좋은 질문이야. 사실 계량텐서가 장소에 의존하는 것만으로는 공간이 휘어져 있는지 판정할 수 없어. 평탄한 공간에서도 곡선좌표를 쓰면 \(g_{ij}\)는 장소에 의존해. 진짜 휘어진 공간에서는 어떤 좌표를 써도 \(g_{ij}\)를 상수로 만들 수 없어(전체적으로는). 이 판정에는 나중 장에서 배울 리만 곡률텐서(Riemann curvature tensor)가 필요해. 지금은 "계량텐서가 장소에 의존 ≠ 공간이 휘어져 있다"는 것만 기억해둬.

⚪ 메이: 즉 "좌표의 휨"과 "공간의 휨"은 별개의 개념이고, 그것을 구별하는 도구가 아직 필요하다는 거네.

✅ 이해도 체크: 계량텐서가 장소에 의존할 때, 공간이 정말로 휘어져 있는지 판정하려면 무엇이 필요할까요?

리만 곡률텐서가 필요하다. 계량텐서가 장소에 의존하는 것만으로는 공간의 휨을 판정할 수 없다(평탄한 공간에서도 곡선좌표를 사용하면 계량은 장소에 의존한다).

구면 삼각형: 내각의 합이 180°를 초과 그림 6.5: 구면 삼각형 NAB. 세 내각이 모두 90°이므로, 합은 270° > 180°. 휘어진 공간에서 유클리드 기하학이 성립하지 않음을 보여주는 직관적 예시.

평행 이동과 곡률 그림 6.6: 평탄한 공간에서는 벡터를 한 바퀴 이동시켜도 방향이 변하지 않지만, 구면에서는 90° 회전한다. 이것이 "공간의 휨"을 검출하는 본질적인 방법이며, 리만 곡률텐서의 직관적 의미이다.


6.5 계량텐서의 변환법칙

거리의 불변성으로부터 변환법칙을 이끌어내기

🟡 리나: 계량텐서의 가장 중요한 성질은, 좌표를 바꿨을 때 거리 \(ds^2\)이 변하지 않도록 성분이 변환된다는 거야. 이것을 수식으로 이끌어보자.

어떤 좌표계 \((x^1, x^2)\)에서의 계량을 \(g_{ij}\), 다른 좌표계 \((u^1, u^2)\)에서의 계량을 \(g'_{ij}\)라 하자. 여기서 \((x^1, x^2)\)는 직교좌표에 한정되지 않아——어떤 좌표계든 출발점으로 삼을 수 있어. 거리는 좌표 선택에 무관하니까:

\[ ds^2 = g_{ij}\,dx^i\,dx^j = g'_{kl}\,du^k\,du^l \]

여기서 \(dx^i = \dfrac{\partial x^i}{\partial u^k}\,du^k\)를 좌변에 대입해. 마찬가지로 \(dx^j = \dfrac{\partial x^j}{\partial u^l}\,du^l\)로 쓰는 거야. 여기서 \(k\)와는 다른 문자 \(l\)을 사용하는 것은, \(dx^i\)의 전개에서 이미 \(k\)가 더미 첨자(합을 취하는 첨자)로 사용되었기 때문이야——만약 \(dx^j\)의 전개에도 같은 \(k\)를 쓰면, 하나의 식에 \(k\)가 3번 이상 나타나서 "\(k\)에 대해 몇 번 합을 취하는지"가 모호해져. 다른 문자 \(l\)을 쓰면, \(k\)\(l\)이 각각 독립적으로 1에서 2까지 달리는 이중합(\(\sum_k \sum_l\))이라고 명확해져. 그러면:

\[ ds^2 = g_{ij}\frac{\partial x^i}{\partial u^k}\frac{\partial x^j}{\partial u^l}\,du^k\,du^l \]

한편, 우변은 \(ds^2 = g'_{kl}\,du^k\,du^l\)이었어. 즉:

\[ g'_{kl}\,du^k\,du^l = g_{ij}\frac{\partial x^i}{\partial u^k}\frac{\partial x^j}{\partial u^l}\,du^k\,du^l \]

🔵 카이: 양변에 같은 \(du^k\,du^l\)이 곱해져 있으니까, 안쪽의 계수가 같아야……하는 거 맞죠?

🟡 리나: 직관적으로는 맞아. 다만 \(du^k\,du^l\)은 단순한 수(스칼라)의 곱이니까, "임의의 방향에서 성립한다"는 것을 이용해 정밀하게 보여야 해. 이 등식은 어떤 방향의 미소 변위 \((du^1, du^2)\)를 선택해도 성립해야 해. 여기서 "계수가 같다"는 것을 보일게. 먼저 1변수의 유추로 감각을 잡아보자. \(ax^2 + bx + c = a'x^2 + b'x + c'\)모든 \(x\)에서 성립한다면, \(x = 0\)을 대입하면 \(c = c'\), \(x = 1\)을 대입하면 \(a + b = a' + b'\), \(x = -1\)을 대입하면 \(a - b = a' - b'\)——이렇게 3개의 값만 시도하면 \(a = a'\), \(b = b'\), \(c = c'\)가 전부 결정되지. 포인트는 "미지수의 수(3개)만큼 독립적인 조건을 만들면 전부 결정된다"는 거야. 2변수에서도 같은 발상이야. §4에서 본 것처럼 \(g'_{kl}\)은 대칭(\(g'_{12} = g'_{21}\))이니까, 결정해야 할 독립 성분은 \(g'_{11}\), \(g'_{12}\), \(g'_{22}\)의 3개뿐이야. 3개의 미지수를 결정하려면 3가지 방향을 시도하면 충분해——연립방정식을 푸는 것과 같은 거지. 구체적으로 해보자:

  • 방향 1: \(du^2 = 0\)으로 하고 \(du^1\)만 움직여. 그러면 양변은 \(g'_{11}(du^1)^2 = \bigl(g_{ij}\frac{\partial x^i}{\partial u^1}\frac{\partial x^j}{\partial u^1}\bigr)(du^1)^2\)이 돼. \((du^1)^2 \neq 0\)으로 나눌 수 있으니까 \(g'_{11}\)의 값이 결정돼
  • 방향 2: \(du^1 = 0\)으로 하면, 마찬가지로 \(g'_{22}\)가 결정돼
  • 방향 3: \(g'_{12}\)를 결정하려면, \(du^1\)\(du^2\)둘 다 0이 아닌 방향이 필요해. 가장 간단한 선택으로 \(du^1 = du^2 = \epsilon\)(같은 미소량)으로 하면, 좌변은 \((g'_{11} + 2g'_{12} + g'_{22})\epsilon^2\), 우변은
\[ \biggl(g_{ij}\frac{\partial x^i}{\partial u^1}\frac{\partial x^j}{\partial u^1} + 2g_{ij}\frac{\partial x^i}{\partial u^1}\frac{\partial x^j}{\partial u^2} + g_{ij}\frac{\partial x^i}{\partial u^2}\frac{\partial x^j}{\partial u^2}\biggr)\epsilon^2 \]

이 돼. \(\epsilon^2 \neq 0\)으로 나누고, 방향 1·2에서 결정된 \(g'_{11}\), \(g'_{22}\)에 대응하는 항을 빼면 \(2g'_{12} = 2g_{ij}\frac{\partial x^i}{\partial u^1}\frac{\partial x^j}{\partial u^2}\)가 남으니까 \(g'_{12}\)도 유일하게 결정돼.

⚪ 메이: 3가지 방향을 시도하는 것만으로 독립 성분이 전부 결정돼——다항식의 계수 비교와 정말 같은 발상이네.

🔵 카이: 잠깐만요. 방향 1과 2에서 \(g'_{11}\)\(g'_{22}\)를 결정하고, 방향 3에서 \(g'_{12}\)를 결정한다——즉 3가지 방향을 선택하면 3개의 미지수가 전부 결정된다는 거잖아요. 그런데 방향 3에서 \(du^1 = du^2 = \epsilon\)으로 선택한 건 편리해서 그런 거지, 다른 조합으로도 같은 \(g'_{12}\)가 나오나요?

🟡 리나: 맞아. 이렇게 3개의 독립 성분 \(g'_{11}\), \(g'_{12}\), \(g'_{22}\)가 모두 유일하게 결정됐어. 대칭행렬의 독립 성분은 3개뿐이니까, 그 3개가 결정되면 행렬 전체가 결정돼.

::: {.callout-note collapse="true" title="보충: 왜 3방향이면 충분한가"} 확인 차원에서 말하자면——만약 다른 방향, 예를 들어 \(du^1 = 1\), \(du^2 = 3\)을 대입해도, 좌변은 \(g'_{11} + 6g'_{12} + 9g'_{22}\)이고 우변도 같은 값이 된다. 왜냐하면, 3개의 성분은 이미 방향 1~3에서 결정되었고, 어떤 방향의 이차형식 값도 이 3개의 성분만으로 결정되기 때문이다. 즉, 두 이차형식이 3개의 독립적인 방향에서 일치하면 모든 방향에서 일치한다——마치 두 이차함수가 3점에서 일치하면 동일한 함수인 것과 같은 논리. :::

정리하면:

\[ \boxed{g'_{kl}(u) = \frac{\partial x^i}{\partial u^k}\frac{\partial x^j}{\partial u^l}\,g_{ij}(x(u))} \]

🔵 카이: 그렇군요, 2차원이면 독립 성분이 3개(대칭이니까)이고, 3가지 방향을 선택하면 전부 결정된다는 거……그러면 \(n\)차원에서도 같은 발상으로, 독립 성분의 수만큼 방향을 선택하면 되나요? 그런데 \(du^1 = du^2 = \epsilon\)이라는 "비스듬한 방향"을 선택하는 게 좀 트릭처럼 느껴져요. 다른 방향이라도 괜찮나요?

🟡 리나: 좋은 질문이야. 다른 방향——예를 들어 \(du^1 = \epsilon\), \(du^2 = 2\epsilon\)이라도 상관없어. 요점은 \(g'_{11}\)\(g'_{22}\)를 먼저 결정한 후, \(du^1\)\(du^2\)가 둘 다 0이 아닌 방향을 하나 고르면 \(g'_{12}\)가 결정된다는 거야. 어떤 방향을 골라도 같은 \(g'_{12}\)가 나와——그것이 "임의의 방향에서 성립한다"는 것의 귀결이야. \(n\)차원이면 \(n(n+1)/2\)가지 방향을 선택하면 전체 성분이 결정돼.

🔵 카이: 즉, 방정식의 수(선택할 수 있는 방향의 수)가 미지수의 수(독립 성분의 수) 이상이니까, 전부 결정되는 거군요. 연립방정식과 같은 발상이네요.

🟡 리나: 맞아. 직관적으로 말하면, "어떤 방향으로 미소 변위를 잡아도 거리가 일치한다"는 것은 거리의 공식의 모든 계수가 일치할 것을 요구해——마치 두 다항식이 모든 \(x\)에서 같으면 각 차수의 계수가 같은 것과 같은 발상이야. 이것이 계량텐서의 변환법칙이야. Jacobi 행렬의 성분 \(\dfrac{\partial x^i}{\partial u^k}\)가 2개 곱해져 있어. 텐서의 언어로 말하면, 계량텐서는 2계 공변텐서(rank-2 covariant tensor)——아래첨자가 2개인 텐서——라는 것을 보여줘. 제 2 장에서 "텐서의 계수는 첨자의 수"라고 배웠지. \(g_{kl}\)은 아래첨자가 2개니까 "2계", 그리고 변환법칙에 Jacobi 행렬이 2개 곱해지는 것이 그 표현이야.

🔵 카이: "공변"이란 뭔가요?

🟡 리나: 좋은 질문이야. 텐서에는 변환법칙의 차이에 따라 2종류가 있어. 변환법칙에서 \(\dfrac{\partial x^i}{\partial u^k}\)——즉 "옛 좌표를 새 좌표로 미분한 것"——이 사용되는 텐서를 공변텐서라 부르고, 첨자를 아래에 써. 예를 들어 계량텐서의 변환법칙 \(g'_{kl} = \dfrac{\partial x^i}{\partial u^k}\dfrac{\partial x^j}{\partial u^l}\,g_{ij}\)가 바로 이 형태야. 반대로 \(\dfrac{\partial u^k}{\partial x^i}\)(역행렬의 성분)이 사용되는 것을 반변텐서라 부르고, 첨자를 위에 써——예를 들어 미소 변위 \(du^k = \dfrac{\partial u^k}{\partial x^i}\,dx^i\)는 반변적으로 변환돼.

🔵 카이: 왜 2종류로 나눌 필요가 있나요?

🟡 리나: 물리량에 따라 "좌표를 바꿨을 때의 변환 방식"이 다르기 때문이야. 가장 알기 쉬운 예로 생각해보자. 길이의 단위를 미터에서 센티미터로 바꿨다고 하자——이것은 "좌표의 눈금을 균일하게 100배 세밀하게 하는" 가장 단순한 좌표변환이야. 같은 변위라도 수치는 100배가 돼(\(du^k\)가 커진다)——좌표의 눈금이 세밀해지면, 같은 거리를 나타내는 데 큰 수치가 필요하잖아. 예를 들어 3 m의 변위는 300 cm——수치가 커져. 이것이 반변적인 변환이야.

🔵 카이: 반대로 작아지는 것도 있나요?

🟡 리나: 그래. "1미터당 온도 변화"를 생각해봐. 만약 1 m 진행할 때마다 온도가 2℃ 올라간다면, 1 cm당으로는 0.02℃밖에 안 올라가——수치가 1/100이 돼(기울기 \(\partial f/\partial u^k\)가 작아져). 눈금이 세밀해지면, 1눈금당 변화량은 작아져. 이것이 공변적인 변환이야. 즉, 같은 좌표변환에 대해 수치가 커지는 것(반변, 위첨자)과 작아지는 것(공변, 아래첨자)이 있어——변환의 "방향"이 반대인 거야.

⚪ 메이: 변위는 눈금이 세밀해지면 수치가 커지고, 기울기는 반대로 작아져——변환 방향이 반대니까 "반변"과 "공변"인 거네.

🟡 리나: 맞아. 지금의 단위 변환은 눈금이 균일하게 변하는 가장 단순한 예지만, 극좌표처럼 장소마다 눈금 변화가 다른 경우에도 같은 일이 일어나. 예를 들어 \(r\)이 큰 곳에서는, \(\theta\)를 1라디안 바꿨을 때의 실제 이동 거리가 \(r\)에 비례해서 커져——즉 1눈금당 "실제 거리"가 크다는 거야. 그래서 같은 물리적 변위(예를 들어 1 m)를 나타내는 데 필요한 \(d\theta\)의 수치는 작아도 돼——이것이 반변적 거동이야.

🔵 카이: 반대로 공변적인 쪽은요? 아까 온도 기울기 이야기가 극좌표에서도 성립하나요?

🟡 리나: 맞아. 구체적으로 생각해보자. 예를 들어 방 안에서 \(x\) 방향으로 1 m당 2℃씩 온도가 올라가고 있다고 하자——이것이 "공간적으로 균일한 온도 변화"야. 이 온도장을 극좌표로 기술하면, \(\theta\) 방향의 온도 기울기 \(\partial T/\partial\theta\)\(r\)이 클수록 수치가 커져. 왜냐하면 \(r\)이 큰 곳에서는 1라디안당 실제로 통과하는 거리가 \(r\)에 비례해서 길어지니까, 그만큼 온도 변화도 커지거든. 예를 들어 \(r = 1\) m이면 1라디안으로 1 m 진행하니까 온도 변화는 약 2℃지만, \(r = 5\) m이면 1라디안으로 5 m 진행하니까 온도 변화는 약 10℃——\(\partial T/\partial\theta\)의 수치가 5배가 돼. 이것이 공변적 거동이야. 이 구별을 제대로 하지 않으면, 좌표에 의존하지 않는 물리법칙을 쓸 수 없어. 자세한 것은 다음 장에서 체계적으로 다루지만, 지금은 "계량텐서는 아래첨자 2개 = 공변"이라는 것만 기억해둬.

🔵 카이: 솔직히 아직 "공변", "반변"의 구별이 와닿지는 않지만……지금은 "계량텐서는 아래첨자 2개"라는 것만 기억해둘게요.

🟡 리나: 그걸로 충분해. 지금 단계에서는 "변환법칙의 형태가 다르니까 이름을 구분한다" 정도의 이해면 돼. 다음 장에서 구체적인 예를 많이 보면 자연스럽게 익숙해질 거야.

📝 연습문제:


구체적 예시로 확인

🟡 리나: 변환법칙이 맞는지, 직교좌표에서 극좌표로의 변환으로 확인해보자. 여기서는 일반론의 \((x^1, x^2)\)가 직교좌표 \((x, y)\), \((u^1, u^2)\)가 극좌표 \((r, \theta)\)에 대응해.

직교좌표에서의 계량은 \(g_{ij} = \delta_{ij}\)(단위행렬). Jacobi 행렬의 성분은:

\[ \frac{\partial x}{\partial r} = \cos\theta, \quad \frac{\partial x}{\partial \theta} = -r\sin\theta, \quad \frac{\partial y}{\partial r} = \sin\theta, \quad \frac{\partial y}{\partial \theta} = r\cos\theta \]

\(g'_{11}\)(\(r\)-\(r\) 성분)을 계산. 변환법칙에서 \(k = l = 1\)(즉 \(r\))로 하고, \(g_{ij} = \delta_{ij}\)이므로 \(i = j\)인 항만 살아남아:

\[ g'_{11} = \frac{\partial x}{\partial r}\frac{\partial x}{\partial r}\cdot 1 + \frac{\partial y}{\partial r}\frac{\partial y}{\partial r}\cdot 1 = \cos^2\theta + \sin^2\theta = 1 \quad \checkmark \]

\(g'_{22}\)(\(\theta\)-\(\theta\) 성분)을 계산:

\[ g'_{22} = \frac{\partial x}{\partial \theta}\frac{\partial x}{\partial \theta}\cdot 1 + \frac{\partial y}{\partial \theta}\frac{\partial y}{\partial \theta}\cdot 1 = r^2\sin^2\theta + r^2\cos^2\theta = r^2 \quad \checkmark \]

\(g'_{12}\)(\(r\)-\(\theta\) 성분)을 계산:

\[ g'_{12} = \frac{\partial x}{\partial r}\frac{\partial x}{\partial \theta}\cdot 1 + \frac{\partial y}{\partial r}\frac{\partial y}{\partial \theta}\cdot 1 = \cos\theta(-r\sin\theta) + \sin\theta(r\cos\theta) = 0 \quad \checkmark \]

🔵 카이: 오, 아까 구한 극좌표의 계량 \(g_{ij} = \mathrm{diag}(1, r^2)\)이 제대로 재현됐네요! 그런데 만약 출발점의 좌표계가 직교좌표가 아니라, 예를 들어 다른 곡선좌표였다고 해도 같은 변환법칙으로 계량을 구할 수 있나요?

🟡 리나: 물론이야. 이 변환법칙은 출발점이 어떤 좌표계든 성립해. 직교좌표에서 출발할 필요는 없어. 이번에는 \(g_{ij} = \delta_{ij}\)였으니까 계산이 간단했을 뿐이야. 예를 들어 극좌표에서 포물선좌표로 변환할 때도, 극좌표의 \(g_{ij} = \mathrm{diag}(1, r^2)\)를 출발점으로 같은 변환법칙을 적용하면 돼——연습문제에서 해봐.

🔵 카이: 출발점이 뭐든 같은 공식을 쓸 수 있다니 안심이에요. 그런데 좌표변환을 3번 반복해도——예를 들어 직교→극좌표→포물선좌표→또 다른 좌표——최종적인 계량은 "처음과 마지막 좌표의 관계"만으로 결정되나요? 중간 경로는 관계없나요?

🟡 리나: 맞아. 변환법칙을 2번 연속 적용하면, 합성변환의 Jacobi 행렬(연쇄법칙으로 구해지는)을 1번 적용한 것과 같은 결과가 돼. 중간에 어떤 좌표를 거쳐도 최종 결과는 같아——이것이 "계량텐서는 좌표에 의존하지만, 거리라는 물리량은 좌표에 의존하지 않는다"는 것의 표현이야. 연습문제에서 확인해봐.

✅ 이해도 체크: 계량텐서의 변환법칙에서 Jacobi 행렬의 성분이 몇 개 곱해질까요?

2개. \(g'_{kl} = \frac{\partial x^i}{\partial u^k}\frac{\partial x^j}{\partial u^l} g_{ij}\)처럼, 첨자 하나당 Jacobi 행렬이 하나씩 곱해진다. 계량텐서는 2계 공변텐서이므로 2개.


6.6 "자가 장소에 따라 달라진다"는 것은

좌표기저 벡터의 길이

🟡 리나: 계량텐서의 의미를 좀 더 깊이 파봐보자. 극좌표의 기저벡터 \(\boldsymbol{e}_r\)\(\boldsymbol{e}_\theta\)를 생각해볼게.

일반상대성이론에서는 길이를 1로 맞춘 단위벡터가 아니라, 좌표의 구조를 그대로 반영한 기저를 사용하는 것이 표준이야——이유는 바로 뒤에서 설명할게. 그 기저를 좌표기저(coordinate basis)라고 불러. 직관적으로 말하면 "다른 좌표를 고정하고 어떤 좌표만 1만큼 바꿨을 때 실제로 얼마나 이동하는가"를 나타내는 벡터야. \(\boldsymbol{e}_r\)은 "\(\theta\)를 고정하고 \(r\) 방향으로 진행했을 때의 변위 비율", \(\boldsymbol{e}_\theta\)는 "\(r\)을 고정하고 \(\theta\) 방향으로 진행했을 때의 변위 비율"을 나타내.

🔵 카이: "1만큼 바꾼다"는 건, \(r\)이면 1미터, \(\theta\)면 1라디안이라는 건가요?

🟡 리나: 날카로운 질문이야. 수학적으로 정확히 말하면, 위치벡터 \(\boldsymbol{r}\)의 좌표 \(u^i\)에 의한 편미분 \(\partial\boldsymbol{r}/\partial u^i\) 그 자체야——"좌표를 미소량 \(\Delta u^i\)만큼 바꿨을 때의 변위 \(\Delta\boldsymbol{r}\)\(\Delta u^i\)로 나눈 극한"이지. 직관적으로는 "좌표 \(u^i\)를 1만큼 바꿨을 때의 변위"라고 생각해도 되지만, 이것은 미분의 정의를 이용한 극한 조작의 결과이지 실제로 유한한 1라디안만큼 움직이는 건 아니야——미분계수가 "접선의 기울기"인 것과 같은 감각이야. "벡터를 편미분한다"고 하면 어려워 보이지만, 하는 일은 단순해. 먼저, 평면 위의 점의 위치벡터는 직교좌표의 단위기저벡터 \(\boldsymbol{e}_x\), \(\boldsymbol{e}_y\)(\(x\) 방향과 \(y\) 방향을 향한 길이 1의 화살표로, 장소에 관계없이 방향도 길이도 변하지 않는 상수벡터)를 사용해 \(\boldsymbol{r} = x\,\boldsymbol{e}_x + y\,\boldsymbol{e}_y\)로 쓸 수 있어. "벡터를 편미분한다"는 것은, 이 각 성분 \(x\), \(y\)를 각각 편미분하는 것일 뿐이야. \(\boldsymbol{e}_x\), \(\boldsymbol{e}_y\)는 상수니까 미분 밖으로 꺼낼 수 있고, \(x, y\) 부분에만 편미분이 걸려. \(x = r\cos\theta\), \(y = r\sin\theta\)를 대입해서 편미분하면:

\[ \boldsymbol{e}_r = \frac{\partial \boldsymbol{r}}{\partial r} = \frac{\partial x}{\partial r}\boldsymbol{e}_x + \frac{\partial y}{\partial r}\boldsymbol{e}_y = \cos\theta\,\boldsymbol{e}_x + \sin\theta\,\boldsymbol{e}_y \]
\[ \boldsymbol{e}_\theta = \frac{\partial x}{\partial \theta}\boldsymbol{e}_x + \frac{\partial y}{\partial \theta}\boldsymbol{e}_y = -r\sin\theta\,\boldsymbol{e}_x + r\cos\theta\,\boldsymbol{e}_y \]

🔵 카이: \(\boldsymbol{e}_r\)의 길이는……\(\sqrt{\cos^2\theta + \sin^2\theta} = 1\). \(\boldsymbol{e}_\theta\)의 길이는……\(\sqrt{r^2\sin^2\theta + r^2\cos^2\theta} = r\).

🟡 리나: 맞아. \(\boldsymbol{e}_\theta\)의 길이는 \(r\)과 같아——원점에서 멀어질수록 커져.

🔵 카이: 직접 계산해놓고 뭐지만……기저벡터의 길이가 장소에 따라 다르다니 이상하지 않나요? 고등학교에서 배운 단위벡터 \(\hat{\boldsymbol{e}}_r\), \(\hat{\boldsymbol{e}}_\theta\)는 둘 다 길이 1이었는데, 왜 일부러 정규화하지 않는 건가요?

🟡 리나: 좋은 질문이야. 고등학교에서 배우는 \(\hat{\boldsymbol{e}}_r\), \(\hat{\boldsymbol{e}}_\theta\)정규화된 기저(normalized basis)——길이를 1로 맞춘 것. 반면 여기서 쓰는 \(\boldsymbol{e}_r\), \(\boldsymbol{e}_\theta\)좌표기저——좌표를 1만큼 바꿨을 때의 자연스러운 변위. 일반상대론에서는 좌표기저를 쓰는 것이 표준이야. 이유는, 좌표기저를 쓰면 \(ds^2 = g_{ij}\,du^i\,du^j\)라는 거리의 공식이 그대로 "기저의 내적"으로 읽히기 때문이야——정규화해버리면, 이 대응이 깨져서 계량텐서의 변환법칙이 복잡해져. 그림 6.3「같은 2차원 평면을 두 가지 좌표계로 덮는다」를 다시 봐봐——극좌표의 격자가 원점에서 멀어질수록 간격이 넓어지고 있지? 그것이 바로 \(\boldsymbol{e}_\theta\)의 길이가 \(r\)에 비례한다는 것의 표현이야. 원점 가까이에서는 \(\theta\) 방향 격자 간격이 좁고(\(\boldsymbol{e}_\theta\)가 짧다), 멀리에서는 넓다(\(\boldsymbol{e}_\theta\)가 길다)——이것이 좌표기저의 길이가 장소에 따라 변한다는 거야.

🔵 카이: 그렇군요. 원점 가까이에서는 \(\boldsymbol{e}_\theta\)가 짧은 화살표, 멀리에서는 긴 화살표가 되는 이미지군요.

🟡 리나: 맞아. 그리고 사실 좌표기저끼리의 내적이 바로 계량텐서의 성분이 돼. 이유를 살펴보자. 미소 변위 벡터는 \(d\boldsymbol{r} = \boldsymbol{e}_i\,du^i\)(좌표기저의 정의로부터)로 쓸 수 있어. 거리의 제곱은 \(ds^2 = d\boldsymbol{r} \cdot d\boldsymbol{r}\)이니까:

\[ ds^2 = (\boldsymbol{e}_i\,du^i) \cdot (\boldsymbol{e}_j\,du^j) = (\boldsymbol{e}_i \cdot \boldsymbol{e}_j)\,du^i\,du^j \]

한편, 계량텐서의 정의로부터 \(ds^2 = g_{ij}\,du^i\,du^j\). 비교하면:

\[ g_{ij} = \boldsymbol{e}_i \cdot \boldsymbol{e}_j \]

⚪ 메이: \(g_{ij}\)가 "기저벡터의 내적"이었다니……계량텐서의 의미가 아주 구체적으로 다가왔어.

🟡 리나: 참고로, 지금은 평탄한 공간에 묻힌 좌표계를 고려하고 있으니까 "위치벡터"를 이용해 기저를 정의할 수 있었지만, 일반적인 휘어진 공간에서는 위치벡터를 쓸 수 없어. 그때는 다른 정의 방법이 필요해——이것도 나중 장에서 다룰게.

⚪ 메이: 구체적으로 확인해볼게. \(g_{11} = \boldsymbol{e}_r \cdot \boldsymbol{e}_r = \cos^2\theta + \sin^2\theta = 1\), \(g_{22} = \boldsymbol{e}_\theta \cdot \boldsymbol{e}_\theta = r^2\sin^2\theta + r^2\cos^2\theta = r^2\), \(g_{12} = \boldsymbol{e}_r \cdot \boldsymbol{e}_\theta = -r\sin\theta\cos\theta + r\sin\theta\cos\theta = 0\). 확실히 일치하네.

🟡 리나: 이것이 계량텐서의 기하학적 의미야. \(g_{ij}\)는 "좌표기저가 얼마나 긴지, 서로 어떤 각도를 이루고 있는지"라는 정보를 전부 담고 있어.

✅ 이해도 체크: 계량텐서의 성분 \(g_{ij}\)와 좌표기저벡터 \(\boldsymbol{e}_i\) 사이에는 어떤 관계가 있을까요?

\(g_{ij} = \boldsymbol{e}_i \cdot \boldsymbol{e}_j\)(좌표기저벡터끼리의 내적). 대각 성분 \(g_{ii}\)는 기저벡터 길이의 제곱, 비대각 성분 \(g_{ij}\)(\(i \neq j\))는 기저벡터 사이의 각도 정보를 담고 있다.

📝 연습문제:


"자가 장소에 따라 달라진다"의 정체

🟡 리나: 정리하자. "자가 장소에 따라 달라진다"는 것은, 구체적으로 다음을 의미해:

계량텐서 \(g_{ij}\)의 성분이 좌표의 함수이다——즉, "좌표값을 1만큼 바꿨을 때 실제로 얼마나 이동하는가"가 장소에 따라 다르다.

🔵 카이: 극좌표라면, \(\theta\)를 1라디안 바꿨을 때의 이동 거리가 \(r\)에 비례해요. 원점에 가까우면 짧고, 멀면 길다.

🟡 리나: 맞아. 그리고 §4에서 본 구면의 계량을 떠올려봐. 구면은 2차원이니까 좌표는 2개——\((u^1, u^2) = (\theta, \varphi)\) 순서로 잡으면 \(g_{ij} = \mathrm{diag}(a^2,\; a^2\sin^2\theta)\). 여기서 주의할 점은, §4의 3차원 구면좌표에서는 \(\varphi\)가 3번째 좌표였으니 \(g_{33}\)이었지만, 지금은 2차원 구면에서 \(\varphi\)가 2번째 좌표이므로 \(g_{22}\)가 된다는 거야——첨자 번호는 좌표의 순번으로 결정돼.

🔵 카이: 아, 같은 \(a^2\sin^2\theta\)라도 몇 번째 좌표인지에 따라 \(g_{33}\)이 되기도 하고 \(g_{22}\)가 되기도 하는 거군요.

🟡 리나: 이 \(g_{22} = a^2\sin^2\theta\)는, \(\varphi\)를 1라디안 바꿨을 때의 이동 거리가 \(\sqrt{g_{22}}\cdot 1 = a\sin\theta\)임을 의미해——적도(\(\theta = \pi/2\))에서 최댓값 \(a\), 극(\(\theta = 0\))에서 0. 그림 6.7「구면의 계량과 좌표선 간격」을 보면, 적도 부근에서는 경선 간격이 넓고, 극 부근에서는 좁아지는 것을 알 수 있지. 이것이 \(g_{22} = a^2\sin^2\theta\)의 기하학적 의미를 눈으로 본 것이야.

구면의 계량과 좌표선 간격

그림 6.7: 구면의 계량과 좌표선 간격. 적도 부근에서는 경선(\(\varphi\) 일정인 선)의 간격이 넓고, 극 부근에서는 좁아진다. 이것은 \(g_{22} = a^2\sin^2\theta\)\(\theta\)에 의존하는 것의 기하학적 표현.

🟡 리나: §4의 구면 계량 부분에서 말한 중요한 포인트를, 좌표기저의 언어로 다시 말해둘게.

  • 평탄한 공간에서도 곡선좌표를 사용하면 \(g_{ij}\)는 장소에 의존해(예: 극좌표의 \(g_{22} = r^2\))——하지만 이것은 좌표변환으로 \(\delta_{ij}\)로 되돌릴 수 있어. 좌표기저의 언어로는 "기저벡터의 길이나 방향이 장소에 따라 변해도, 그것은 좌표 선택 탓이지 공간 자체가 왜곡된 것은 아니다"라는 뜻
  • 진짜 휘어진 공간(구면 등)에서는, 어떤 좌표를 써도 \(g_{ij}\)를 상수로 만들 수 없어(전체적으로는). 다만, 아주 좁은 범위——한 점 주위의 미소 영역——에 한정하면, \(g_{ij} \approx \delta_{ij}\)로 만들 수 있는 좌표는 항상 찾을 수 있어. 이것은 "휘어진 공간이라도 충분히 작게 보면 평탄하게 보인다"는 것으로, 지구 표면이 국소적으로는 평평하게 보이는 것과 같은 감각이야

⚪ 메이: 즉 구면의 계량을 \(\delta_{ij}\)로 만드는 것은, 한 점의 근방에서는 할 수 있지만 전체적으로는 할 수 없다——그것이 "진짜 휘어져 있다"는 것의 의미구나.

✅ 이해도 체크: 계량텐서의 성분이 장소에 의존할 때, "공간이 휘어져 있다"고 말할 수 있을까요?

말할 수 없다. 평탄한 공간에서도 곡선좌표를 사용하면 계량텐서는 장소에 의존한다(예: 극좌표의 \(g_{22} = r^2\)). 진짜 휘어져 있는지의 판정에는 리만 곡률텐서가 필요하다.


6.7 4차원 시공간으로의 확장

🟡 리나: 마지막으로, 여기까지의 논의를 4차원 시공간으로 확장해두자. 좌표를 \((x^0, x^1, x^2, x^3)\)으로 하면, 선소(line element)는:

\[ ds^2 = g_{\mu\nu}(x)\,dx^\mu\,dx^\nu \]

여기서 \(\mu, \nu\)는 0에서 3까지 달려. 관습적으로, 시공간 전체(0~3)의 첨자에는 그리스 문자 \(\mu, \nu, \ldots\)를, 공간만(1~3)의 첨자에는 라틴 문자 \(i, j, \ldots\)를 써. 이 장의 전반부에서 \(g_{ij}\)로 쓴 것은 공간 성분만 다뤘기 때문이고, 4차원 시공간 전체를 다룰 때는 \(g_{\mu\nu}\)로 쓰는 거야. \(4 \times 4\) 대칭행렬 \(g_{\mu\nu}\)의 독립 성분은 \(\dfrac{4 \times 5}{2} = 10\)개.

🔵 카이: 특수상대론의 Minkowski 시공간이면요?

🟡 리나: 직교좌표 \((t, x, y, z)\)에서:

\[ ds^2 = -c^2\,dt^2 + dx^2 + dy^2 + dz^2 \]

\(g_{\mu\nu} = \mathrm{diag}(-c^2, 1, 1, 1)\). 이전 장에서는 자연단위계(\(c = 1\))를 써서 좌표를 \((ct, x, y, z)\)로 잡고, \(\eta_{\mu\nu} = \mathrm{diag}(-1, 1, 1, 1)\)로 썼었지. 이 장에서는 SI 단위계로 돌아와 \(x^0 = t\)(단위는 초)로 하고 있으니까, \(c^2\)이 명시적으로 나타나는 거야. Minkowski 시공간의 계량은 좌표 선택에 따라 겉모습이 달라지지만, 어느 쪽이든 같은 평탄한 시공간을 기술하고 있으므로 본질은 같아.

기호의 약속: 이 장 이후, 일반적인 계량텐서를 \(g_{\mu\nu}\)로 쓴다. Minkowski 시공간도 그 특수한 경우로서 \(g_{\mu\nu}\)로 표기한다(이전 장까지의 \(\eta_{\mu\nu}\)\(g_{\mu\nu}\)가 Minkowski 계량임을 강조하고 싶을 때 사용한다).

🔵 카이: 마이너스가 붙어 있는 건 Minkowski 불변량과 같은 부호 규약이죠. 그런데 이전 장에서는 \(\eta_{00} = -1\)이었는데, 지금은 \(g_{00} = -c^2\)으로 수치가 다르잖아요——부호는 같지만 크기가 변한 건 왜예요?

🟡 리나: 좋은 질문이야. 장 머리에서 주의한 것처럼, 이 장에서는 좌표를 \((t, x, y, z)\)(\(x^0 = t\), 단위는 초)로 잡고 있어——이전 장까지의 \((ct, x, y, z)\)와는 다른 선택이야. \(ds^2\) 전체의 차원을 길이의 제곱(m²)으로 맞추고 싶으니까, \(dt\)의 단위가 초(s)인 이상 \(g_{00}\,(dt)^2\)이 m²가 되려면 \(g_{00}\)의 단위가 m²/s²여야 해——그래서 \(g_{00} = -c^2\)(\(c\)의 단위는 m/s)가 되는 거야. 만약 좌표를 \((ct, x, y, z)\)로 잡으면 \(ct\)의 단위는 이미 m이니까, \(g_{\mu\nu} = \mathrm{diag}(-1, 1, 1, 1)\)로 무차원으로 쓸 수 있어——이전 장에서 쓰던 \(\eta_{\mu\nu}\) 그 자체지. 어쨌든 전 성분이 상수이므로, Minkowski 시공간은 평탄해.

⚪ 메이: 좌표 단위의 선택에 따라 \(-1\)도 되고 \(-c^2\)도 되지만, 물리적으로는 같은 평탄한 시공간——극좌표와 직교좌표의 관계와 같은 구조네.

🔵 카이: 그렇군요, 좌표 선택에 따라 \(-1\)도 되고 \(-c^2\)도 되지만 본질은 같군요. 그리고 마이너스 부호 자체가 붙는 것은, 전에 배운 인과구조——광원뿔의 안쪽과 바깥쪽의 구별——과 관련이 있나요?

🟡 리나: 맞아. 인과구조를 지키는 마이너스 부호가 그대로 \(g_{00}\)에 나타나고 있어. 즉 계량텐서의 형태가 시공간의 인과구조를 자동으로 포함하고 있다는 뜻이야.

🟡 리나: 구면좌표 \((t, r, \theta, \varphi)\)로 바꾸면:

\[ ds^2 = -c^2\,dt^2 + dr^2 + r^2\,d\theta^2 + r^2\sin^2\theta\,d\varphi^2 \]
\[ g_{\mu\nu} = \mathrm{diag}(-c^2,\; 1,\; r^2,\; r^2\sin^2\theta) \]

⚪ 메이: 계량이 장소에 의존하지만, 시공간 자체는 평탄해. 좌표 선택을 바꾼 것일 뿐이야.

표 6.2: Minkowski 시공간의 계량: 좌표에 따른 표기의 차이

좌표 \(g_{\mu\nu}\) 장소 의존성 시공간의 휨
\((ct, x, y, z)\) (이전 장의 표기) \(\eta_{\mu\nu} = \mathrm{diag}(-1, 1, 1, 1)\) 없음 (상수) 평탄
\((t, x, y, z)\) (\(c\) 명시) \(\mathrm{diag}(-c^2, 1, 1, 1)\) 없음 (상수) 평탄
\((t, r, \theta, \varphi)\) \(\mathrm{diag}(-c^2, 1, r^2, r^2\sin^2\theta)\) 있음 평탄

🟡 리나: 맞아. 하지만 다음 장 이후에 등장하는 Schwarzschild(슈바르츠실트) 계량——질량 \(M\)인 구대칭 천체(예를 들어 블랙홀)의 바깥쪽 시공간을 기술하는 계량——을 예고로 보여줄게. \(G\)는 만유인력 상수야:

\[ ds^2 = -\left(1 - \frac{2GM}{rc^2}\right)c^2\,dt^2 + \frac{dr^2}{1 - \frac{2GM}{rc^2}} + r^2\,d\theta^2 + r^2\sin^2\theta\,d\varphi^2 \]

프롤로그에서 등장한 상대론적 매개변수 \(GM/(Rc^2)\)(\(R\)은 천체의 반지름)를 기억해? 여기 나오는 \(2GM/(rc^2)\)\(r\)은 좌표——천체 바깥의 임의의 위치를 나타내는 것으로, 천체 표면에서는 \(r = R\)이 돼. 계수 2의 의미는 Schwarzschild 계량을 정식으로 도입하는 장에서 밝혀질 거야.

🔵 카이: 우와, Minkowski 계량에 비하면 \(g_{00}\)\(g_{11}\)\(r\)에 의존하는 항으로 수정됐네요……질량 \(M\)이 0이면 Minkowski로 돌아가네요.

🟡 리나: 맞아. 그리고 이 계량은 어떤 좌표변환을 해도 Minkowski 계량으로 전체적으로는 변환할 수 없어. 이것이 "시공간이 진짜 휘어져 있다"는 뜻이야.

🔵 카이: 계량텐서가 "장소에 따라 변하는 자"이고, 그 자의 변하는 방식 속에 중력 정보가 들어 있는 거군요……. 그런데 Schwarzschild 계량의 식을 보면 \(r = 2GM/c^2\)에서 분모가 0이 되잖아요. 거기서는 "자"가 무한히 늘어난다는 건가요? 아니면 공간이 정말로 망가진 건가요?

🟡 리나: 날카로운 질문이야. 결론만 먼저 말하면, \(r = 2GM/c^2\)에서의 발산은 좌표 특이점——즉 좌표 선택이 나쁜 것일 뿐이지, 시공간 자체가 망가진 것이 아니야. 다른 좌표를 쓰면 매끄럽게 통과할 수 있어. 바로 이 장에서 배운 "좌표의 휨"과 "공간의 휨"의 구별이 효력을 발휘하는 장면이야. 그것이 정말 물리적 특이점인지 좌표의 문제인지를 판정하는 도구가 리만 곡률텐서야. 이것은 Schwarzschild 계량을 자세히 배우는 장에서 다룰 테니 기대해.

⚪ 메이: 이 장에서 배운 "좌표의 휨과 공간의 휨은 별개"라는 관점이 그대로 적용되는 거네. 계량텐서가 일반상대론의 주역이라는 게 잘 이해됐어.

🟡 리나: 맞아. 중력장의 정보는 전부 \(g_{\mu\nu}\)에 담겨 있어. 다음 장에서는 이 계량텐서를 사용해 실제로 "중력이 있는 시공간"을 기술해 나갈 거야.


다음 장 예고

제 7 장에서는 계량텐서 \(g_{\mu\nu}\)를 사용해 실제로 "중력이 있는 시공간"을 기술한다. 이 장에서 예고한 Schwarzschild(슈바르츠실트) 계량을 정식으로 도입하고, 각 성분이 무엇을 의미하는지 읽어낸다. Minkowski 계량과의 차이로부터, 중력에 의한 시간의 지연과 공간의 왜곡이 어떻게 나타나는지 살펴보자.


연습문제

📝 연습문제:

참고문헌

  • 石井俊全『一般相対性理論を一歩一歩数式で理解する』(ベレ出版)第 3 章「テンソルと直線座標のテンソル場」・第 5 章「曲線座標のテンソル場」
  • Lancaster, T. & Blundell, S. J., General Relativity for the Gifted Amateur, Ch. 3
  • Schutz, B. F., A First Course in General Relativity, 3rd ed., Ch. 6
  • Hartle, J. B., Gravity: An Introduction to Einstein's General Relativity, Ch. 2, Ch. 7
  • 佐藤勝彦『相対性理論』(岩波基礎物理シリーズ)第 4 章「リーマン幾何学」