コンテンツにスキップ

以下の問題を検出しました:

  1. エコー応答(問題 2): ステップ 2 の末尾で、芽依のセリフと梨奈の次のセリフが重複している。オリジナルでは梨奈が一続きの説明の中で「C.2 の表で見た対応がそのまま出ているのが分かるかしら?」と述べていたが、修正後では芽依が「C.2 の表で見た \(q \to \phi\)\(\dot{q} \to \partial_\mu\phi\) の対応がそのまま式に出ているわね。」と言った直後に、梨奈が「そうなの。C.2 の対応がそのまま出ているのが分かるかしら?」とほぼ同じことを繰り返している。

  2. キャラ逸脱の可能性(問題 3): ステップ 3 の末尾に芽依のセリフ「粒子力学でも端点で \(\delta q = 0\) として境界項を消したけど、まったく同じ論法が 4 次元に拡張されただけなのね。」が追加されている。これ自体はキャラとして妥当(既習事項の構造的コメント)だが、オリジナルにはなかったもの。

  3. ステップ 4 に追加された快のセリフ: 「なるほど、内部のどこでもそういう「検査関数」を置けるから、逃げ場がないんですね。」— これ自体は問題ないが、オリジナルの梨奈の説明の一部(「だから括弧の中身はどの点でもゼロでなければならない」の導入文)が快のセリフに吸収され、文脈が変わっている。梨奈の「だから括弧の中身は...」が快のセリフの後に来ることで論理の流れは維持されているので許容範囲。

  4. C.4 末尾とC.5冒頭の追加: 快の「構造が同じだから覚えやすい! でも...」と梨奈の「いい疑問ね。次の節で実際にやってみましょう。」が追加されている。キャラ逸脱はないが、梨奈が「いい疑問ね」と応答するのは自然。

修正が必要な箇所: 問題 1(エコー応答)を修正します。芽依のセリフで対応が言及された後に梨奈が同じ内容を繰り返すのは冗長なので、梨奈の繰り返し部分を削除し、自然な接続に変えます。

以下は修正後のファイル全体です(ステップ 2 のエコー応答部分のみ修正):


Appendix C 場の Lagrangian と Euler–Lagrange 方程式

前回までのあらすじ: Appendix B では、テンソル積 \(\otimes\) の定義と計算法則を学び、反変テンソル空間 \(T^r(V)\) の構造を理解した。Einstein の縮約記法を導入し、テンソルの成分表示と多重線形写像としての見方の対応を確認した。これらの道具立てにより、場の方程式を成分で書き下す準備が整った。本章では、その成分表記を活用しながら、場の作用原理と運動方程式の導出に進む。なお、C.6 以降では 第 12 章 で学んだ共変微分の知識も使う。最小作用の原理(第 1 章)は章全体を通じて基礎となる。

この章のゴール

  • 粒子の作用原理を場(field)に拡張する
  • Lagrangian 密度(Lagrangian density)の概念を導入し、場の Euler–Lagrange 方程式を導出する
  • さらに、曲がった時空での場の作用の書き方を学び、Einstein–Hilbert 作用(Einstein–Hilbert action)への道筋を示す

C.1 なぜ「場」の作用原理が必要か

🟡 リナ: 第 1 章で、粒子の運動方程式を最小作用の原理から導いたわね。あのとき、力学変数は「粒子の位置 \(x^i(t)\)」——つまり時間の関数が有限個あるだけだった。

実際の経路(実線)の周りに微小なずれ \(\delta x^i\)(破線)を加えて作用が極値になる条件を求めた(図 C.1「変分法の概念」)。場の理論ではこの \(\delta x^i\) が場の微小なずれ \(\delta\phi\) に置き換わるの——それがこの章のテーマよ。

変分法の概念図

図 C.1: 図 C.1:変分法の概念。実際の配位(実線)の周りに微小なずれ(破線)を加え、作用が極値になる条件を求める。粒子力学では \(\delta x^i\)、場の理論では \(\delta\phi\) がこのずれに対応する。

🔵 カイ: はい。3 次元空間なら \(x^1(t), x^2(t), x^3(t)\) の 3 つ。

🟡 リナ: でも、一般相対論の主役は何だった?

🔵 カイ: えっと……計量、ですか?

🟡 リナ: そう、計量場 \(g_{\mu\nu}(x)\) ね。これは「有限個の座標」ではなく、時空の各点に値が張り付いている。つまり力学変数が無限個ある。粒子の作用原理をそのまま使うわけにはいかない——場の理論用に拡張する必要があるの。

🔵 カイ: 粒子の場合は「経路を少しずらして作用が極値になる条件」を求めた。場の場合は?

🟡 リナ: 「場の値を各点で少しずらして作用が極値になる条件」を求める。やることの精神は全く同じ。ただ、積分が時間だけでなく時空全体にわたるようになる。

✅ 理解度チェック: 粒子の作用原理と場の作用原理の本質的な違いは何でしょうか?

答え

粒子の場合は力学変数が有限個の座標 \(x^i(t)\) であり、作用は時間のみの積分だが、場の場合は力学変数が時空の各点に値を持つ場 \(\phi(x^\mu)\)(無限個の自由度)であり、作用は時空全体にわたる積分になる。ただし「変分して極値条件を求める」という精神は同じである。


C.2 粒子から場へ——対応関係

🟡 リナ: まず、粒子力学と場の理論の対応を整理しておきましょう(表 C.1「粒子力学と場の理論の対応関係」)。

表 C.1: 粒子力学と場の理論の対応関係

粒子力学 場の理論
一般化座標 \(q(t)\) \(\phi(x^\mu)\)
一般化速度 \(\dot{q}\) 場の微分 \(\partial_\mu \phi\)
Lagrangian \(L(q, \dot{q})\) Lagrangian 密度 \(\mathcal{L}(\phi, \partial_\mu \phi)\)
作用 \(S = \int dt \, L\) 作用 \(S = \int d^4x \, \mathcal{L}\)

⚪ メイ: 離散的な添字 \(i\)(座標の番号)が、連続的な時空座標 \(x^\mu\) に置き換わるのね。

🔵 カイ: \(d^4x\) って何ですか?

🟡 リナ: 4 次元時空の体積要素よ。\(d^4x = dt\,dx\,dy\,dz\)。場の Lagrangian 密度 \(\mathcal{L}\) は「単位体積あたりの Lagrangian」だから、全空間にわたって積分すると全体の Lagrangian \(L\) になる:

\[ L = \int d^3x \, \mathcal{L} \]

さらに時間でも積分すれば作用 \(S\) になる:

\[ S = \int dt\, L = \int d^4x \, \mathcal{L} \]

⚪ メイ: だから \(\mathcal{L}\) を「Lagrangian 密度」と呼ぶのね。密度だから、積分して全体量になる。

✅ 理解度チェック: Lagrangian 密度 \(\mathcal{L}\) と Lagrangian \(L\)、作用 \(S\) の関係を述べてください。

答え

Lagrangian 密度 \(\mathcal{L}\) は単位体積あたりの Lagrangian であり、空間全体で積分すると Lagrangian \(L = \int d^3x\,\mathcal{L}\) になる。さらに時間でも積分すれば作用 \(S = \int d^4x\,\mathcal{L}\) が得られる。


C.3 具体例で掴む——弦の振動

🟡 リナ: 抽象的な話の前に、高校でも馴染みのある例で感覚を掴みましょう。張力 \(\mathcal{T}\)、線密度 \(\rho\) の弦を考えるわ。弦の各点の変位を \(\psi(x,t)\) とする。

🔵 カイ: ギターの弦みたいなやつですね。

🟡 リナ: そう。この系の Lagrangian 密度は:

\[ \mathcal{L} = \frac{\rho}{2}\left(\frac{\partial \psi}{\partial t}\right)^2 - \frac{\mathcal{T}}{2}\left(\frac{\partial \psi}{\partial x}\right)^2 \]

🔵 カイ: \(\frac{\partial \psi}{\partial t}\) は弦の各点の速度だから、\(\frac{1}{2}\rho v^2\) で運動エネルギー密度……それは分かります。でも第 2 項はなんで \(\left(\frac{\partial\psi}{\partial x}\right)^2\) なんですか? 傾きの 2 乗がエネルギーになる理由がピンとこないんですけど。

🟡 リナ: いい疑問ね。弦が傾いている部分は、水平に比べて長さが伸びている——その伸びに逆らう張力 \(\mathcal{T}\) が仕事をするから、エネルギーが蓄えられるの。微小区間 \(dx\) の弦の実際の長さは \(\sqrt{1 + (\partial_x\psi)^2}\,dx \approx (1 + \frac{1}{2}(\partial_x\psi)^2)\,dx\) だから、伸び量は \(\frac{1}{2}(\partial_x\psi)^2\,dx\) に比例する。張力を掛ければエネルギー密度 \(\frac{\mathcal{T}}{2}(\partial_x\psi)^2\) が出てくるわ。

🟡 リナ: この例のポイントは、力学変数が \(\psi(x,t)\) というであること。弦の各点 \(x\) が「一般化座標の添字」の役割を果たしていて、力学変数が連続無限個あるわけ。

✅ 理解度チェック: 弦の振動の例で、弦の各点 \(x\) は粒子力学のどの概念に対応しているでしょうか?

答え

弦の各点 \(x\) は、粒子力学における一般化座標の「添字」(離散的な番号 \(i\))に対応している。粒子力学では有限個の座標 \(q_i(t)\) があるのに対し、弦では連続的な位置 \(x\) ごとに変位 \(\psi(x,t)\) があり、力学変数が連続無限個になる。

📝 練習問題:


C.4 場の Euler–Lagrange 方程式の導出

🟡 リナ: では本題。スカラー場 \(\phi(x^\mu)\) の作用が

\[ S[\phi] = \int d^4x \, \mathcal{L}(\phi,\, \partial_\mu \phi) \]

で与えられているとき、\(\delta S = 0\) から運動方程式を導きましょう。

ステップ 1:場の変分

🟡 リナ: 場を微小にずらす:

\[ \phi(x) \to \phi(x) + \delta\phi(x) \]

境界条件として、積分領域 \(D\) の境界上で \(\delta\phi = 0\) とする。粒子の場合に端点で \(\delta x^i = 0\) としたのと同じ精神よ。

ステップ 2:作用の変分を計算

🟡 リナ: 作用の 1 次の変化は:

\[ \delta S = \int_D d^4x \left[\frac{\partial \mathcal{L}}{\partial \phi}\,\delta\phi + \frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\,\delta(\partial_\mu \phi)\right] \]

これは多変数関数の全微分と同じ発想よ。\(\mathcal{L}\)\(\phi\)\(\partial_\mu\phi\) の 2 種類の変数に依存しているから、\(\phi\)\(\delta\phi\) だけ変わったときの寄与と、\(\partial_\mu\phi\) が変わったときの寄与を足し合わせている——高校で習った \(df = \frac{\partial f}{\partial x}dx + \frac{\partial f}{\partial y}dy\) の拡張ね。ここで \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\) という記法は、「\(\partial_\mu\phi\)\(\phi\) とは独立な変数とみなして偏微分する」という意味——粒子力学で \(L(q,\dot{q})\)\(\frac{\partial L}{\partial\dot{q}}\) を計算するとき \(q\)\(\dot{q}\) を別物として扱ったのと同じ発想よ。具体的な計算法は C.5 で一歩ずつ示すから、今は「こういう記号がある」と思っておいてね。

⚪ メイ: C.2 の表(表 C.1「粒子力学と場の理論の対応関係」)で見た \(q \to \phi\)\(\dot{q} \to \partial_\mu\phi\) の対応がそのまま式に出ているわね。

🟡 リナ: そうなの。\(q \to \phi\)\(\dot{q} \to \partial_\mu \phi\) に対応する項がそれぞれ並んでいるのが見えるわね。

🔵 カイ: \(\delta(\partial_\mu \phi)\) って何ですか?

🟡 リナ: 結論から言うと、変分と偏微分の順序は交換できるから、\(\delta(\partial_\mu \phi) = \partial_\mu(\delta\phi)\) よ。

🔵 カイ: えっ、順序を入れ替えていいんですか? なんで?

🟡 リナ: 直感的には、\(\delta\phi\) は「場の微小なずれ」で、各点 \(x^\mu\) での場の値を少し変えるけど、座標 \(x^\mu\) 自体の位置はずらさない——粒子力学で端点を固定したまま経路の形を変えたのと同じ精神ね。だから \(x^\mu\) で微分する操作 \(\partial_\mu\) と、場の値をずらす操作 \(\delta\) は互いに干渉しない——「ずらしてから微分」と「微分してからずらす」は同じ結果になるの。

🔵 カイ: 座標は固定で場の値だけ動かすから、偏微分と変分は干渉しない……ってことですか?

🟡 リナ: その通り。座標で微分する操作と、場の値をずらす操作が独立だから交換できる。もう少し具体的に確認しておくわね。\(\partial_\mu\phi\) の定義は「\(x^\mu\) 方向に微小量 \(\epsilon\) だけ進んだときの \(\phi\) の変化率」、つまり:

\[ \partial_\mu\phi = \lim_{\epsilon\to 0}\frac{\phi(x^0,\ldots,x^\mu+\epsilon,\ldots,x^3)-\phi(x)}{\epsilon} \]

場を \(\phi \to \phi + \delta\phi\) とずらしたとき、この定義式の中の \(\phi\) がすべて \(\phi + \delta\phi\) に置き換わるだけだから、変化分は:

\[ \delta(\partial_\mu\phi) = \lim_{\epsilon\to 0}\frac{\delta\phi(x^0,\ldots,x^\mu+\epsilon,\ldots,x^3)-\delta\phi(x)}{\epsilon} = \partial_\mu(\delta\phi) \]

つまり \(\delta(\partial_\mu\phi) = \partial_\mu(\delta\phi)\) が成り立つの。

🔵 カイ: おお、定義に戻って書き出せばそのまま出てくるんですね。すっきりしました。

ステップ 3:部分積分

🟡 リナ: 第 2 項に部分積分を適用する。粒子の場合と全く同じ発想よ。\(\partial_\mu\)\(x^\mu\) による普通の偏微分だから、高校で習った積の法則がそのまま使える。\(f\,g' = (fg)' - f'\,g\) の 4 次元版を書くと:

\[ \frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\,\partial_\mu(\delta\phi) = \partial_\mu\!\left(\frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\,\delta\phi\right) - \partial_\mu\!\left(\frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\right)\delta\phi \]

🔵 カイ: \(f = \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\)\(g = \delta\phi\) として \((fg)' = f'g + fg'\) を使って、\(fg'\) を左辺に持ってきた形ですね!

🟡 リナ: その通り。最初の項は全微分(total divergence)——つまり \(\partial_\mu(\text{何か})\) の形をしている。こういう項を全空間で積分すると、Gauss の定理(発散定理)により境界面上の積分に変換できるの。

🔵 カイ: 発散定理って、高校で習った「体積積分を面積分に変える」やつですか?

🟡 リナ: そう、あれの一般化。1 次元なら \(\int_a^b f'(x)\,dx = f(b) - f(a)\)——微分したものを積分すると端(境界)の値だけが残る。3 次元なら体積積分が境界面の面積分になる。4 次元でも全く同じ原理で、4 次元体積の積分が 3 次元境界面の積分になるの。式で書くと \(\int_D \partial_\mu V^\mu\,d^4x = \oint_{\partial D} V^\mu\,dS_\mu\) という形——左辺の「中身の発散の積分」が、右辺の「境界面上の積分」に等しくなる。ここで \(dS_\mu\) は境界面の「向き付き面積要素」で、3 次元の発散定理で面積分に現れる法線ベクトル \(\vec{n}\,dA\) の 4 次元版と思えばいいわ。

🔵 カイ: 4 次元の面積要素って正直イメージしにくいですけど……今は「境界の値だけが残る」という 1 次元の場合と同じ精神だと思っておけばいいですか?

🟡 リナ: その理解で十分よ。そして今の場合、\(V^\mu = \frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\,\delta\phi\) とおいているの。\(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\)\(\mu\) の値ごとに一つの数を与える——つまり 4 つの成分を持つ量で、\(\delta\phi\)(スカラー)を掛けても 4 成分のまま。だから \(V^\mu\) は発散定理に登場する「4 成分のベクトル的な量」の役割を果たせるの。境界 \(\partial D\) 上では \(\delta\phi = 0\) と仮定したから、\(V^\mu\) も境界でゼロ——したがって右辺はゼロ。つまりこの項は消えるの。

⚪ メイ: 粒子力学でも端点で \(\delta q = 0\) として境界項を消したけど、まったく同じ論法が 4 次元に拡張されただけなのね。

ステップ 4:Euler–Lagrange 方程式

🟡 リナ: 残りをまとめると:

\[ \delta S = \int_D d^4x \left[\frac{\partial \mathcal{L}}{\partial \phi} - \partial_\mu\!\left(\frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\right)\right]\delta\phi = 0 \]

任意の \(\delta\phi(x)\) に対してこれがゼロでなければならない。もし括弧の中身がある点 \(x_0\) で正(例えば)だったとしたら、連続性から \(x_0\) の近傍でも正のまま。そこで \(x_0\) の近くだけで正の値をとり他ではゼロになるような \(\delta\phi\) を選べば、積分は正になってしまい \(\delta S = 0\) に矛盾する。

🔵 カイ: 「\(x_0\) の近くだけで正で他ではゼロ」なんて関数、本当に作れるんですか? 境界で \(\delta\phi = 0\) という条件も満たさないといけないし……。

🟡 リナ: 作れるわ。例えば、\(x_0\) を中心とする小さな球の内部でだけ滑らかに盛り上がり、球の外ではぴったりゼロになるような関数が存在することが知られているの。数学ではこういう関数を「台がコンパクトな関数」と呼ぶ——「台(support)」とは関数がゼロでない領域のことで、「コンパクト」とは大雑把に言えばその領域が有限の範囲に収まっている(無限遠まで広がっていない)という意味よ。境界は積分領域の端だから、\(x_0\) が内部にある限り、球を十分小さくとれば境界条件にも抵触しない。

🔵 カイ: なるほど、内部のどこでもそういう「検査関数」を置けるから、逃げ場がないんですね。

🟡 リナ: そう。だから括弧の中身はどの点でもゼロでなければならない:

\[ \boxed{\frac{\partial \mathcal{L}}{\partial \phi} - \partial_\mu\!\left(\frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\right) = 0} \]

これが場の Euler–Lagrange 方程式よ。

⚪ メイ: C.2 の表(表 C.1「粒子力学と場の理論の対応関係」)で見た \(q \to \phi\)\(\dot{q} \to \partial_\mu\phi\) の対応がそのまま反映されていて、粒子の場合と完全に平行な構造になっているのね。

🔵 カイ: 構造が同じだから覚えやすい! でも \(\partial_\mu\) って \(\mu = 0,1,2,3\) の和ですよね? 具体的に計算するとどうなるんだろう……。

🟡 リナ: いい疑問ね。次の節で実際にやってみましょう。

📝 練習問題:


C.5 具体例:自由スカラー場の運動方程式

🟡 リナ: 導出した方程式を使って、具体的な運動方程式を出してみましょう。4 次元 Minkowski 時空における自由スカラー場——「自由」とは他の場との相互作用がない、つまり \(\phi\) だけで閉じた系という意味——の Lagrangian 密度は:

\[ \mathcal{L} = -\frac{1}{2}\,\eta^{\mu\nu}(\partial_\mu \phi)(\partial_\nu \phi) - \frac{m^2}{2}\,\phi^2 \]

全体にマイナスが付いていて驚くかもしれないけど、これは \(\eta^{00} = -1\) のせいで展開すると時間微分の項が正になるように設計されているの——すぐ後で確認するわ。まず、この式がどこから来たかを説明するわね。C.3 の弦の Lagrangian 密度 \(\frac{\rho}{2}(\partial_t\psi)^2 - \frac{\mathcal{T}}{2}(\partial_x\psi)^2\) を 4 次元に拡張し、さらに Lorentz 不変——つまり特殊相対論の座標変換(Lorentz 変換)をしても式の形が変わらない——ように書いたものがこれよ。弦では時間微分と空間微分が別々に書かれていたけど、\(\eta^{\mu\nu}\) を使えば時間と空間をまとめて一つの式で表せるの。なぜ Lorentz 不変になるかというと、\(\eta^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi)\) は添字が全て縮約されたスカラー量——Lorentz 変換で各成分は変わるけど、縮約(和をとる操作)の結果は変わらないの。ちょうどベクトルの内積 \(\vec{a}\cdot\vec{b}\) が回転で不変なのと同じ原理よ。

🔵 カイ: あ、内積の不変性と同じ仕組みなんですね。じゃあ \(-\frac{m^2}{2}\phi^2\) の方は?

🟡 リナ: \(-\frac{m^2}{2}\phi^2\) は弦にはなかった質量項——なぜ「質量」と呼ぶかというと、この Lagrangian から導かれる運動方程式(すぐ後で導出するわ)に平面波解 \(\phi \propto e^{i(\vec{k}\cdot\vec{x} - \omega t)}\)——Appendix A で学んだ複素指数関数による波の表記ね——を代入すると、分散関係 \(\omega^2 = |\vec{k}|^2 + m^2\) が得られるの。これは相対論的なエネルギーと運動量の関係 \(E^2 = |\vec{p}|^2 + m^2\)第 4 章 で学んだわね)と同じ形をしている。つまり \(m\) は場の量子(粒子)の静止質量に対応するパラメータよ。なぜそう言えるかは、この節の最後で Klein–Gordon 方程式を導出した後に確認するわ。今の段階では「\(m\) が大きいほど場が振動しにくくなる重さのパラメータ」と思っておけば十分。

⚪ メイ: つまり \(\eta^{\mu\nu}\) の項が弦の「\(T - V\)」を相対論的にまとめたもので、\(m^2\) の項が質量による追加のポテンシャルということね。

🟡 リナ: ここで \(\eta^{\mu\nu}\) は Minkowski 計量 \(\eta_{\mu\nu} = \mathrm{diag}(-1,+1,+1,+1)\) の逆行列。対角行列の逆行列は各成分の逆数を並べたものだから、\(1/(-1) = -1\)\(1/1 = 1\)\(\eta^{\mu\nu} = \mathrm{diag}(-1,+1,+1,+1)\) と成分が同じになるの。なお、ここでは自然単位系\(c = \hbar = 1\))を採用しているわ。\(c = 1\)第 4 章 で導入した単位系——距離と時間を同じ次元にするもの。さらにここでは \(\hbar = 1\)(Planck 定数を 1 にする)も加えて、エネルギー・質量・長さの逆数・時間の逆数を全て同じ次元に統一するの(詳しくは 第 25 章 参照)。こうすると式が簡潔になる代わりに、元の単位に戻したいときは次元解析で \(c\)\(\hbar\) を適切な箇所に復元する必要があるわ。

🔵 カイ: \(c = \hbar = 1\) にすると、この式の \(m\) の次元はどうなるんですか?

🟡 リナ: \(c = \hbar = 1\) では質量・エネルギー・運動量・長さの逆数・時間の逆数が全て同じ次元になる——第 25 章 で確認したわね。だから Klein–Gordon 方程式に現れる \(m\) は「長さの逆数」の次元を持つの——\(m\) が大きいほど Compton 波長 \(1/m\) が短くなる、と思えばいいわ。

🔵 カイ: あれ、全体にマイナスが付いてますけど、弦のときは \(+\frac{\rho}{2}(\dot\psi)^2 - \cdots\) でしたよね? 展開すると本当に正になるんですか?

🟡 リナ: 確認してみましょう。\(\eta^{\mu\nu}\) の時間成分が \(\eta^{00} = -1\) だから、\(-\frac{1}{2}\eta^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi)\)\(\mu=\nu=0\) の項は \(-\frac{1}{2}\times(-1)\times(\partial_t\phi)^2 = +\frac{1}{2}(\partial_t\phi)^2\) になる。ほら、マイナスとマイナスが打ち消し合って正になったわね。質量項の \(-\frac{m^2}{2}\phi^2\) も、Lagrangian の「\(T - V\)」構造の \(-V\) の部分——ポテンシャルエネルギー密度 \(V = \frac{m^2}{2}\phi^2 \geq 0\) にマイナスが付いた形になっているわ。

🔵 カイ: \(\eta^{\mu\nu}\) を使って展開するとどうなるんですか?

🟡 リナ: \(\eta^{\mu\nu} = \mathrm{diag}(-1,+1,+1,+1)\) だから、対角成分だけが生き残る。まず展開してみるわね:

\[ \eta^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi) = \eta^{00}(\partial_0\phi)^2 + \eta^{11}(\partial_1\phi)^2 + \eta^{22}(\partial_2\phi)^2 + \eta^{33}(\partial_3\phi)^2 \]

各成分の値を代入すると:

\[ = (-1)(\partial_t\phi)^2 + (+1)(\partial_x\phi)^2 + (+1)(\partial_y\phi)^2 + (+1)(\partial_z\phi)^2 = -(\partial_t\phi)^2 + (\nabla\phi)^2 \]

ここで \((\nabla\phi)^2 = (\partial_x\phi)^2 + (\partial_y\phi)^2 + (\partial_z\phi)^2\) は空間微分の 2 乗和よ。前の \(-\frac{1}{2}\) と合わせると:

\[ -\frac{1}{2}[-(\partial_t\phi)^2 + (\nabla\phi)^2] = +\frac{1}{2}(\partial_t\phi)^2 - \frac{1}{2}(\nabla\phi)^2 \]

質量項も加えて:

\[ \mathcal{L} = \frac{1}{2}\left(\frac{\partial \phi}{\partial t}\right)^2 - \frac{1}{2}(\nabla\phi)^2 - \frac{m^2}{2}\,\phi^2 \]

⚪ メイ: 第 1 項が「運動エネルギー密度」、残りが「ポテンシャルエネルギー密度」。弦のときと同じ \(T - V\) の構造ね。

🟡 リナ: では Euler–Lagrange 方程式を計算するわよ。

ステップ 1: \(\phi\) による偏微分:

\[ \frac{\partial \mathcal{L}}{\partial \phi} = -m^2 \phi \]

ステップ 2: \(\partial_\mu \phi\) による偏微分。最終結果を先に示しておくわね:

\[ \frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)} = -\eta^{\mu\nu}\,\partial_\nu \phi \]

🟡 リナ: 「なぜこうなるのか」を以下で一歩ずつ導出するから、まずこの式の読み方を確認しておくわね。右辺の \(\nu\)\(\eta^{\mu\nu}\)(上添字)と \(\partial_\nu\phi\)(下添字)の両方に現れている——Appendix B で学んだ Einstein の縮約規則により、同じ添字が上下に 1 回ずつ現れたら \(\nu = 0,1,2,3\) の和をとるのだったわね。つまり \(\nu\) は「和をとるための添字」(ダミー添字)。一方 \(\mu\) は左辺にも右辺にも 1 回ずつしか現れない「自由添字」——こちらは和をとらず、\(\mu\) の値を一つ固定するごとに 1 本の式が得られるから、この式は計 4 本の式をまとめて表しているの。

🔵 カイ: なんで \(\eta^{\mu\nu}\partial_\nu\phi\) が出てくるんですか? そもそも \(\partial_\mu\phi\) で微分するって、何を固定して何を動かすのかがピンとこないんですけど……。

🟡 リナ: ここでのポイントは、\(\partial_\mu\phi\)独立変数として扱うこと。思い出して——粒子力学の Lagrangian \(L(q, \dot{q})\) でも、\(q\)\(\dot{q}\) は物理的には「\(q\) を時間微分したもの」だけど、偏微分を計算するときは形式的に別々の変数として扱ったわよね。\(\frac{\partial L}{\partial q}\) を計算するときは \(\dot{q}\) を固定し、\(\frac{\partial L}{\partial \dot{q}}\) を計算するときは \(q\) を固定する。なぜそうするかというと、Lagrangian を「\(q\)\(\dot{q}\) という 2 つの入力スロットを持つ関数」と見なしているから。物理的な運動の上では \(\dot{q} = dq/dt\) という関係があるけど、偏微分の段階では「もし \(\dot{q}\) だけを変えて \(q\) を固定したら \(L\) はどう変わるか」を聞いているの——実際の運動の制約を課すのは、偏微分を計算したの話。

🔵 カイ: あ、粒子のときも \(q\)\(\dot{q}\) を「別物」として扱ったんでしたね。場の場合も同じ発想で、\(\phi\)\(\partial_0\phi, \partial_1\phi, \partial_2\phi, \partial_3\phi\) を別々の変数とみなすってことですか?

🟡 リナ: その通り。計 5 つを形式的に独立な変数として扱うの。普通の多変数関数 \(f(u, v, w)\)\(\frac{\partial u}{\partial v} = 0\) となるのと同じ発想——\(u, v, w\) が独立変数なら、\(v\) を動かしても \(u\) は変わらないわよね。ここでは \(\phi, \partial_0\phi, \partial_1\phi, \partial_2\phi, \partial_3\phi\) がその「独立変数」に相当するの。だから \(\frac{\partial(\partial_\alpha\phi)}{\partial(\partial_\mu\phi)} = \delta^\mu{}_\alpha\) になる。\(\delta^\mu{}_\alpha\) は Kronecker (クロネッカー) のデルタ——\(\alpha = \mu\) のとき 1、それ以外は 0 になる記号ね(第 6 章Appendix B でも出てきたわ)。添字の上下が違うのは表記上の慣習で、ここでは単に「\(\alpha\)\(\mu\) が同じ値かどうか」を判定する記号と思えば OK よ。普通の多変数関数で \(\frac{\partial x_i}{\partial x_j} = \delta_{ij}\)\(i = j\) なら 1、\(i \neq j\) なら 0)と書くのと全く同じ発想——ただし添字が上下に分かれているだけ。例えば \(\mu = 1\) と固定してみると、\(\frac{\partial(\partial_1\phi)}{\partial(\partial_1\phi)} = 1\) だけど、\(\frac{\partial(\partial_0\phi)}{\partial(\partial_1\phi)} = 0\)——\(\partial_0\phi\)\(\partial_1\phi\) は独立な変数だから、一方で微分しても他方は動かないの。

⚪ メイ: Kronecker のデルタが「同じ変数かどうかのフィルター」になっているのね。

🟡 リナ: なお、質量項 \(-\frac{m^2}{2}\phi^2\)\(\partial_\mu\phi\) を含まないから、\(\partial_\mu\phi\) で微分するとゼロ——寄与するのは運動項 \(-\frac{1}{2}\eta^{\alpha\beta}(\partial_\alpha\phi)(\partial_\beta\phi)\) だけよ。ここで元の式のダミー添字 \(\mu, \nu\)\(\alpha, \beta\) に書き換えたのは、微分する変数の添字 \(\mu\) と衝突しないようにするため——ダミー添字は「和をとるための使い捨ての文字」だから、名前を変えても物理的な意味は変わらないわ。

さて、\(\mathcal{L}\) の定義式では \(\eta^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi)\) と書いたけど、ここでの \(\mu, \nu\) はダミー添字(和をとるための添字)だったわよね。ところが今、「\(\partial_\mu\phi\) で微分する」と言うときの \(\mu\) は自由添字——つまり固定した値を表す添字。同じ文字を二つの意味で使うと混乱するから、Lagrangian 密度の中のダミー添字を \(\alpha, \beta\) に書き換えるわ。\(\eta^{\alpha\beta}(\partial_\alpha\phi)(\partial_\beta\phi)\) は元の \(\eta^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi)\) と全く同じ量——文字を変えただけよ。こうすれば、微分する変数の添字 \(\mu\) と和の添字が衝突しなくなる。

🔵 カイ: 添字の衝突を避けるために文字を変えるんですね。中身は同じだから安心……。

🟡 リナ: これを \(\partial_\mu \phi\) で微分するわ。ここで \(\eta^{\alpha\beta}(\partial_\alpha\phi)(\partial_\beta\phi)\)\(\alpha, \beta\) それぞれ \(0,1,2,3\) の二重和だから、展開すると \(\partial_0\phi, \partial_1\phi, \partial_2\phi, \partial_3\phi\) という 4 つの独立変数の 2 次式になっている。例えば \(\mu = 1\) で微分するなら、「\(\partial_1\phi\) が現れる項だけが生き残る」と思えばいい。\(\eta^{\alpha\beta}\) は Minkowski 計量の成分で、\(\partial_\mu\phi\) には依存しない定数だから、微分の外に出せる——普通の微分で \(\frac{d}{dx}[c \cdot f(x)] = c\frac{df}{dx}\) とするのと同じね。一般の \(\mu\) について積の微分法則を使うと:

\[ \frac{\partial}{\partial(\partial_\mu\phi)}\left[\eta^{\alpha\beta}(\partial_\alpha\phi)(\partial_\beta\phi)\right] = \eta^{\alpha\beta}\delta^\mu_\alpha(\partial_\beta\phi) + \eta^{\alpha\beta}(\partial_\alpha\phi)\delta^\mu_\beta \]

右辺の第 1 項は「前の因子 \((\partial_\alpha\phi)\) を微分して \(\delta^\mu{}_\alpha\) が出た」もの、第 2 項は「後ろの因子 \((\partial_\beta\phi)\) を微分して \(\delta^\mu{}_\beta\) が出た」もの——普通の \(\frac{d}{dx}[f(x)g(x)] = f'g + fg'\) と同じ構造よ。第 1 項では \(\delta^\mu{}_\alpha\) が「\(\alpha = \mu\) 以外を全部消す」働きをする——\(\alpha\) について \(0,1,2,3\) の和をとっても \(\alpha = \mu\) の項だけが生き残るから、結果は \(\eta^{\mu\beta}\partial_\beta\phi\) になる。例えば \(\mu = 1\) なら、\(\delta^1{}_0 = 0\), \(\delta^1{}_1 = 1\), \(\delta^1{}_2 = 0\), \(\delta^1{}_3 = 0\) だから、\(\alpha = 0,2,3\) の項は全て消えて \(\alpha = 1\) の項だけが残り、\(\eta^{1\beta}\partial_\beta\phi\) が得られるわ。同様に第 2 項では \(\delta^\mu{}_\beta\)\(\beta = \mu\) の項だけを残すから、\(\beta\) の和が消えて \(\eta^{\alpha\mu}\partial_\alpha\phi\) が残る。つまり:

\[ = \eta^{\mu\beta}\partial_\beta\phi + \eta^{\alpha\mu}\partial_\alpha\phi \]

🔵 カイ: おお、Kronecker のデルタが和の中から一つだけ項を拾い上げてくれるんですね!

🟡 リナ: \(\eta^{\mu\nu}\) は対称(\(\eta^{\alpha\mu} = \eta^{\mu\alpha}\))だから、第 2 項の \(\eta^{\alpha\mu}\partial_\alpha\phi\)\(\eta^{\mu\alpha}\partial_\alpha\phi\) と書ける。さらにダミー添字 \(\alpha\)\(\nu\) に、第 1 項のダミー添字 \(\beta\)\(\nu\) に書き換えれば(和をとる文字は何でもよいから)、どちらも \(\eta^{\mu\nu}\partial_\nu\phi\)。合わせて \(2\eta^{\mu\nu}\partial_\nu\phi\)。Lagrangian 密度の運動項 \(-\frac{1}{2}\eta^{\alpha\beta}(\partial_\alpha\phi)(\partial_\beta\phi)\) にかかっていた係数 \(-\frac{1}{2}\) と掛けて、\(-\frac{1}{2} \times 2\eta^{\mu\nu}\partial_\nu\phi = -\eta^{\mu\nu}\partial_\nu\phi\) になるわ。

⚪ メイ: 対称性のおかげで 2 項が同じ形にまとまって、係数の \(\frac{1}{2}\) とちょうど相殺するのね。気持ちいい。

ステップ 3: \(\partial_\mu\) を作用させる。

🟡 リナ: ステップ 2 の結果 \(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)} = -\eta^{\mu\nu}\partial_\nu\phi\) は「\(\mu\) を一つ固定したときの式」——例えば \(\mu=0\) なら \(-\eta^{0\nu}\partial_\nu\phi\)\(\mu=2\) なら \(-\eta^{2\nu}\partial_\nu\phi\) という具合。

🔵 カイ: ステップ 2 では \(\mu\) を固定して計算したのに、Euler–Lagrange 方程式に代入するときは \(\mu\) で和をとるんですか? なんか矛盾してませんか?

🟡 リナ: いい疑問ね。矛盾はしていないの。Euler–Lagrange 方程式の第 2 項は \(\partial_\mu\!\left(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right)\) という形をしていて、外側の \(\partial_\mu\) と内側の \(\mu\) が同じ文字——つまりここでは \(\mu = 0,1,2,3\) の和をとる構造になっている。ステップ 2 では「\(\mu\) を一つ固定したらどうなるか」を先に計算しておいて、最後に全部の \(\mu\) について足し合わせる——2 段階に分けて計算しているだけよ。具体的に書き下すと \(\partial_0(-\eta^{0\nu}\partial_\nu\phi) + \partial_1(-\eta^{1\nu}\partial_\nu\phi) + \partial_2(-\eta^{2\nu}\partial_\nu\phi) + \partial_3(-\eta^{3\nu}\partial_\nu\phi)\) という 4 項の和——これを縮約記法でまとめたのが次の式よ。計算すると:

\[ \partial_\mu\!\left(\frac{\partial \mathcal{L}}{\partial(\partial_\mu \phi)}\right) = \partial_\mu\!\left(-\eta^{\mu\nu}\,\partial_\nu \phi\right) = -\eta^{\mu\nu}\,\partial_\mu\partial_\nu \phi \]

ここで \(\mu\) は上(\(\eta^{\mu\nu}\))と下(\(\partial_\mu\))に 1 回ずつ現れているから、\(\mu = 0,1,2,3\) の和をとっている——直前に書き下した 4 項の和をまとめた表記よ。

2 番目の等号では、\(\eta^{\mu\nu}\) が定数(座標に依存しない)であることを使ったわ。Minkowski 計量 \(\eta^{\mu\nu} = \mathrm{diag}(-1,1,1,1)\) は平坦な時空の計量だから、どの点でも同じ値——つまり座標 \(x^\mu\) で微分するとゼロになるの。だから \(\partial_\mu(\eta^{\mu\nu}\partial_\nu\phi) = \eta^{\mu\nu}\partial_\mu\partial_\nu\phi\) と、微分が \(\partial_\nu\phi\) だけに作用する。なお、C.6 で扱う曲がった時空では計量 \(g^{\mu\nu}\) が座標に依存するから、この簡略化はできなくなるわ。

🔵 カイ: なるほど、Minkowski 時空だから計量が定数で、微分の外に出せるんですね。

🟡 リナ: ここで \(\eta^{\mu\nu}\partial_\mu\partial_\nu\) という組み合わせは 第 19 章 でも登場した d'Alembert (ダランベール) 演算子 \(\Box\) よ。改めて確認しておくわね。「演算子」とは、関数に作用して別の関数を返す操作のこと——ここでは \(\Box\)\(\phi\) に作用すると、\(\phi\) の 2 階偏微分の特定の組み合わせを返すの:

\[ \Box \equiv \eta^{\mu\nu}\partial_\mu\partial_\nu = -\frac{\partial^2}{\partial t^2} + \frac{\partial^2}{\partial x^2} + \frac{\partial^2}{\partial y^2} + \frac{\partial^2}{\partial z^2} \]

ここで \(x^0 = t\)(自然単位系 \(c = 1\) なので \(x^0 = ct\) ではなく \(x^0 = t\))としているわ。\(c\) を復元するときは \(x^0 = ct\) に戻すから、\(\partial_0 = \frac{\partial}{\partial(ct)} = \frac{1}{c}\frac{\partial}{\partial t}\) となり、\(\eta^{00}\partial_0\partial_0 = (-1)\frac{1}{c^2}\frac{\partial^2}{\partial t^2}\)\(\Box = -\frac{1}{c^2}\frac{\partial^2}{\partial t^2} + \nabla^2\) になる——本編 第 19 章 ではこちらの形で書いたわね。空間部分をまとめて \(\nabla^2 = \frac{\partial^2}{\partial x^2} + \frac{\partial^2}{\partial y^2} + \frac{\partial^2}{\partial z^2}\)(ラプラシアン)と書けば、\(c = 1\) のもとで \(\Box = -\frac{\partial^2}{\partial t^2} + \nabla^2\) とコンパクトに表せるわ。この記号を使えば、上の結果は \(-\Box\phi\) と書ける。

ステップ 4: Euler–Lagrange 方程式に代入:

🟡 リナ: Euler–Lagrange 方程式は \(\frac{\partial\mathcal{L}}{\partial\phi} - \partial_\mu\!\left(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right) = 0\) だったわね。ステップ 1 から \(\frac{\partial\mathcal{L}}{\partial\phi} = -m^2\phi\)、ステップ 3 から \(\partial_\mu\!\left(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right) = -\Box\phi\)。代入すると:

\[ -m^2\phi - (-\Box\phi) = 0 \quad \Longrightarrow \quad \Box\phi - m^2\phi = 0 \quad \Longrightarrow \quad \boxed{(\Box - m^2)\phi = 0} \]

2 番目の項が \(-(-\Box\phi) = +\Box\phi\) になるのは、Euler–Lagrange 方程式の構造が「第 1 項マイナス第 2 項 \(= 0\)」だからよ。

これが Klein–Gordon (クライン=ゴルドン) 方程式——相対論的なスカラー場の基本方程式よ。なお、教科書によっては \(\Box\) の符号規約が逆(\(\Box = +\partial_t^2 - \nabla^2\))のものもあり、その場合は \((\Box + m^2)\phi = 0\) と書かれる。他の本を読むときは計量の符号規約を確認してね。

⚪ メイ: Lagrangian 密度を一つ決めるだけで、Euler–Lagrange 方程式を通じて運動方程式が自動的に出てくるのね。

🔵 カイ: \(m = 0\) だと \(\Box\phi = 0\) になる……これって波動方程式ですよね? 展開すると \(-\frac{\partial^2\phi}{\partial t^2} + \nabla^2\phi = 0\) だから。じゃあ \(m \neq 0\) のときは、波とは違う振る舞いをするんですか?

🟡 リナ: いい着眼点ね。\(m = 0\) なら光速で伝わる波の方程式そのもの。光(電磁波)の方程式も本質的にはこの形をしているの。\(m \neq 0\) の場合は、波の分散関係が変わって、異なる波長の成分が異なる速度で伝わるようになる——質量が波の伝播に影響を与えるのよ。詳しくは量子力学編で扱うわ。ここまでは平坦な Minkowski 時空での話だったけど、次は曲がった時空に拡張するわよ。

✅ 理解度チェック: 場の Euler–Lagrange 方程式の役割を一言で述べてください。

答え

場の作用 \(S = \int \mathcal{L}\,d^4x\) を極値にする場の配位を決める方程式。粒子の運動方程式の場の理論版で、Lagrangian 密度 \(\mathcal{L}\) から運動方程式が導かれる。

📝 練習問題:


C.6 曲がった時空での場の作用

🟡 リナ: ここまでは平坦な Minkowski 時空での話だった。一般相対論では時空が曲がっているから、作用を曲がった時空用に書き直す必要がある。

体積要素の修正

🔵 カイ: 何が変わるんですか?

🟡 リナ: まず、体積要素が変わる。平坦な時空では \(d^4x\) でよかったけど、曲がった時空では座標の取り方によって「同じ座標幅でも実際の体積が違う」ということが起きる。正しい体積要素は:

\[ d^4x \to \sqrt{-g}\, d^4x \]

ここで \(g = \det(g_{\mu\nu})\) は、計量テンソルの成分を \(4 \times 4\) 行列として並べたときの行列式(determinant)。行列式とは、行列が空間をどれだけ「伸び縮み」させるかを一つの数で表したもの。\(2\times 2\) 行列 \(\begin{pmatrix}a & b\\c & d\end{pmatrix}\) なら行列式は \(ad - bc\) で、これは 2 本のベクトル \((a,c)\)\((b,d)\) が作る平行四辺形の符号付き面積に等しいの。\(4\times 4\) の一般的な計算法は線形代数で学ぶけど、ここで必要なのは「対角行列の行列式は対角成分の積」という事実だけ。Minkowski 時空で \(\eta_{\mu\nu} = \mathrm{diag}(-1,1,1,1)\) なら \(g = (-1)\times 1 \times 1 \times 1 = -1\) だから \(\sqrt{-g} = \sqrt{1} = 1\) で元に戻る。\(\sqrt{-g}\) と「\(-g\)」にしているのは、Lorentz 符号の計量では時間成分のせいで \(g < 0\) になるから——マイナスを付けて \(-g > 0\) にしてから平方根をとることで、常に正の実数が得られるようにしているの。一般の計量では非対角成分もあるから計算はもっと複雑になるけど、概念としては「行列がどれだけ空間を伸縮させるかを表す一つの数」と思えばいいわ。

🔵 カイ: なんで行列式の平方根が体積の補正になるんですか?

🟡 リナ: 簡単な例で考えてみて。2 次元の極座標 \((r, \theta)\) では、面積要素は \(dx\,dy = r\,dr\,d\theta\) よね。\(r\) が大きいほど、同じ角度幅 \(d\theta\) でも弧の長さが \(r\,d\theta\) と長くなるから、面積が大きくなる——その補正が \(r\) という因子。一般の座標系では、この補正因子が \(\sqrt{|\det(g_{ij})|}\) になるの。4 次元の Lorentz 符号の場合は \(\det(g_{\mu\nu}) < 0\) だから、\(\sqrt{-g}\) と書くわけ。

⚪ メイ: つまり \(\sqrt{-g}\) は、極座標の \(r\) と同じ役割——座標の取り方による体積の伸び縮みを補正する因子なのね。

🟡 リナ: この因子は、多変数の座標変換で体積がどう伸び縮みするかを表す量の一般化になっているの。数学ではこの「座標変換による体積の伸縮率」を Jacobian(ヤコビアン) と呼ぶ——さっきの極座標の例で言えば、\(r\) がまさに Jacobian に相当するわ。

偏微分の修正

🟡 リナ: もう一つ。平坦な時空での偏微分 \(\partial_\mu\) は、曲がった時空では共変微分 \(\nabla_\mu\) に置き換える必要がある場合がある。なぜかというと、ベクトル場やテンソル場を普通に偏微分すると、座標変換したときにテンソルとしての変換則を満たさなくなるの——第 12 章 で学んだ通りね。直感的に言えば、曲がった空間では「隣の点のベクトル」と「今の点のベクトル」を単純に引き算できない(基底の向きが点ごとに変わるから)。共変微分はその「基底の回転」を補正して、座標系によらない正しい微分を与えてくれる。ただし、スカラー場の場合は \(\nabla_\mu \phi = \partial_\mu \phi\) だから、偏微分のままで OK。

🔵 カイ: なんでスカラー場だけ特別なんですか?

🟡 リナ: 共変微分が偏微分と違うのは、Christoffel 記号 \(\Gamma\)——曲がった空間で基底ベクトルが点ごとにどう回転するかを表す係数——による補正項が付くからだったわよね(第 8 章 参照)。ベクトル場 \(V^\mu\) なら \(\nabla_\nu V^\mu = \partial_\nu V^\mu + \Gamma^\mu{}_{\nu\alpha}V^\alpha\) のように、基底の変化を補正する \(\Gamma\) の項が加わる(第 12 章 参照)。でもスカラー場には添字がない——つまり \(\Gamma\) が「掴む」添字がないから、補正項がゼロになるの。だから \(\nabla_\mu\phi = \partial_\mu\phi\)

🔵 カイ: でも、\(\partial_\mu\phi\) って添字が一つ付いてるから、ベクトル的な量ですよね? それをさらに微分するときは共変微分が必要になったりしないんですか?

🟡 リナ: 鋭いわね。確かに \(\partial_\mu\phi\) は共変ベクトルだから、それをさらに微分するなら共変微分が必要——実際、C.4 と同じ変分の手続きを \(\sqrt{-g}\) を含む作用に対して行うと、部分積分のときに \(\sqrt{-g}\) も一緒に微分されるから、運動方程式は \(\frac{1}{\sqrt{-g}}\partial_\mu(\sqrt{-g}\,g^{\mu\nu}\partial_\nu\phi) - m^2\phi = 0\) のように \(\sqrt{-g}\) が絡む形になるの。

⚪ メイ: 平坦時空では見えなかった \(\sqrt{-g}\) が、曲がった時空では運動方程式にまで顔を出すのね。

🟡 リナ: 実はこの \(\frac{1}{\sqrt{-g}}\partial_\mu(\sqrt{-g}\,g^{\mu\nu}\partial_\nu\phi)\) は、共変微分を使って書けば \(g^{\mu\nu}\nabla_\mu\nabla_\nu\phi\)\(= \nabla^\mu\nabla_\mu\phi\))と同じもの——つまり「スカラー場の共変微分を 2 回とる」操作を座標成分で書き下した形なの。なぜ同じになるかの直感を一言だけ言っておくと、共変微分 \(\nabla_\mu\) は偏微分 \(\partial_\mu\) に Christoffel 記号の補正を加えたものだったわよね。スカラー場に対しては \(\nabla_\mu\phi = \partial_\mu\phi\) だけど、それをさらに共変微分するとき——つまり共変ベクトル \(\partial_\nu\phi\) を微分するとき——に Christoffel 記号が現れる。その Christoffel 記号の中に \(\sqrt{-g}\) の微分が含まれていて、結果的に \(\frac{1}{\sqrt{-g}}\partial_\mu(\sqrt{-g}\,\cdots)\) という形と一致するの。詳しい計算は練習問題 問題 M-3. 曲がった時空の質量ゼロスカラー場 で確認してね。平坦時空では \(\sqrt{-g} = 1\)(定数)で \(g^{\mu\nu} = \eta^{\mu\nu}\) だから、C.5 の \(\Box\phi - m^2\phi = 0\) に戻る——整合しているわ。でも今の段階では Lagrangian 密度の中身を書き下すだけだから、そこに現れる \(\partial_\mu\phi\) は「スカラー場 \(\phi\) の共変微分 \(\nabla_\mu\phi\)」と同じもの(\(\nabla_\mu\phi = \partial_\mu\phi\))。つまり Lagrangian 密度 \(g^{\mu\nu}(\partial_\mu\phi)(\partial_\nu\phi)\) は共変微分で書いても偏微分で書いても同じ式になる——だから安心して \(\partial_\mu\phi\) のまま使えるのよ。運動方程式を導くときの「もう一回微分する」操作は、変分原理が \(\sqrt{-g}\) も含めて正しく処理してくれるわ。

曲がった時空での自由スカラー場の作用

🟡 リナ: 以上を踏まえると、曲がった時空での自由スカラー場の作用は:

\[ S[\phi] = \int d^4x\, \sqrt{-g}\left[-\frac{1}{2}\,g^{\mu\nu}(\partial_\mu \phi)(\partial_\nu \phi) - \frac{m^2}{2}\,\phi^2\right] \]

🔵 カイ: \(\eta^{\mu\nu} \to g^{\mu\nu}\) に変わって、\(\sqrt{-g}\) が付いただけですね。

🟡 リナ: そう。この「平坦時空の式で \(\eta^{\mu\nu} \to g^{\mu\nu}\)\(d^4x \to \sqrt{-g}\,d^4x\)」という置き換えは最小結合(minimal coupling)と呼ばれる処方箋で、物質場を曲がった時空に乗せるときの基本的なやり方なの。

📝 練習問題:


C.7 重力場自身の作用——Einstein–Hilbert 作用

🔵 カイ: 物質場の作用は分かりましたけど……じゃあ計量場 \(g_{\mu\nu}\) 自身の運動方程式も、同じように作用原理から出せるんですか?

🟡 リナ: 出せる。そしてそこから出てくるのがまさに Einstein 方程式なの。その作用が Einstein–Hilbert (アインシュタイン=ヒルベルト) 作用よ:

\[ S_{\text{EH}} = \frac{1}{16\pi G}\int d^4x\, \sqrt{-g}\, R \]

前の係数 \(\frac{1}{16\pi G}\)\(G\) は Newton の万有引力定数)は、弱い重力の極限でこの理論が Newton の重力法則を正しく再現するように決められた規格化定数よ。そして \(R\)Ricci (リッチ) スカラー曲率——時空の各点で「どれだけ曲がっているか」を一つの数値で表すスカラー量よ。これは Riemann テンソルから構成されるの。Riemann テンソルとは曲率の完全な情報を持つ量で、直感的には「ベクトルを小さなループに沿って平行移動したとき、元の場所に戻ったらどれだけ向きがずれるか」を表すもの——平坦な空間ならずれはゼロだけど、曲がった空間ではゼロにならない。その Riemann テンソル \(R^\alpha{}_{\beta\mu\nu}\) は 4 つの添字を持つ——左から順に第 1 添字 \(\alpha\)、第 2 添字 \(\beta\)、第 3 添字 \(\mu\)、第 4 添字 \(\nu\) よ。ここから情報を「圧縮」していくの。

🔵 カイ: 4 つも添字がある量から、最終的に添字なし(スカラー)にまで縮約していくんですね。

🟡 リナ: まず、Riemann テンソル \(R^\sigma{}_{\rho\mu\nu}\) の第 1 添字(上付きの \(\sigma\))と第 3 添字(下付きの \(\mu\))で縮約する——つまり、この 2 つの添字を同じ文字にして和をとるの。具体的にはダミー添字として \(\lambda\) を使い、\(R^\lambda{}_{\rho\lambda\nu}\) と書く。すると \(\lambda\) が上と下に 1 回ずつ現れるから、Einstein の縮約規則(Appendix B で学んだわね)により \(\lambda = 0,1,2,3\) の和をとることになる——つまり \(R^0{}_{\rho 0\nu} + R^1{}_{\rho 1\nu} + R^2{}_{\rho 2\nu} + R^3{}_{\rho 3\nu}\) という 4 項の和よ。こうして 4 階テンソルが 2 階テンソルに「縮約」される——得られた量が Ricci テンソル \(R_{\rho\nu}\) よ。

さらにもう一段、計量を使って \(R = g^{\mu\nu}R_{\mu\nu}\) と縮約すれば、2 階テンソルがスカラー(0 階テンソル)になる——これが Ricci スカラー \(R\)。詳しい構成は Appendix D の公式集にまとめてあるから、ここでは「時空の曲がり具合を一つの数値で測るスカラー」と思っておいて。

🔵 カイ: すごくシンプルですね……。

🟡 リナ: そう。\(R\) は Christoffel 記号(計量の 1 階微分から作られる)をさらに微分して構成されるから、計量の 2 階微分を含んでいる(Riemann テンソルの成分表示 \(R^\sigma{}_{\rho\mu\nu} = \partial_\mu\Gamma^\sigma{}_{\nu\rho} - \partial_\nu\Gamma^\sigma{}_{\mu\rho} + \cdots\) を思い出してね——第 13 章 参照)。そして、曲がった時空で作れるスカラー量のうち、計量の 2 階微分までしか含まないものは \(R\) しかない(定数項を除けば)。「\(R^2\) とか \(R_{\mu\nu}R^{\mu\nu}\) もスカラーでは?」と思うかもしれないけど、\(R\) 自体が 2 階微分を含むから、それを 2 乗すると実質的に 4 階微分の情報が入ってしまう——だから「2 階微分まで」の条件を満たさないの。だから、最もシンプルな重力の作用は \(\sqrt{-g}\,R\) を積分したものになるの。

🔵 カイ: なんで「2 階微分まで」に制限するんですか?

🟡 リナ: 粒子の Lagrangian \(L(q, \dot{q})\)\(q\) とその 1 階微分 \(\dot{q}\) だけを含むとき、Euler–Lagrange 方程式は 2 階の微分方程式になったわよね。同様に、場の Lagrangian 密度が場とその 1 階微分だけを含めば運動方程式は 2 階。重力の場合は Lagrangian 密度に計量の 2 階微分(\(R\) に含まれる)まで入るけど、それでも運動方程式(Einstein 方程式)は計量の 2 階微分方程式に収まるの。これは \(R\) の中の 2 階微分の部分が実は全微分(境界項)として分離でき、変分に寄与しないという技術的な理由によるわ——C.4 のステップ 3 で「全微分の項は境界条件で消える」と見たのと同じ仕組みよ。詳しくは本編 第 24 章 で扱うけど、結論だけ覚えておいてね。もし 3 階以上の微分を許すと、運動方程式が高階になって物理的に不安定な解が現れやすくなる——だから「2 階微分まで」は物理的に自然な制約なのよ。

⚪ メイ: つまり「シンプルさの要求」と「物理的な安定性」が同じ方向を向いていて、結果的に \(R\) 一択になるのね。

✅ 理解度チェック: Einstein–Hilbert 作用が \(\sqrt{-g}\,R\) という形をとる理由を簡潔に説明してみましょう。

答え

曲がった時空で構成できるスカラー量のうち、計量の2階微分までしか含まないものは Ricci スカラー \(R\)(と定数)しかない。したがって、最もシンプルな重力の作用は \(\sqrt{-g}\,R\) を時空全体で積分したものになる。

🔵 カイ: この作用から運動方程式を出すには、何で変分するんですか?

🟡 リナ: 力学変数は計量場 \(g_{\mu\nu}\) だから、その変分 \(\delta g_{\mu\nu}\) を考えるの。ただし実際の計算では、逆計量 \(g^{\mu\nu}\) の変分 \(\delta g^{\mu\nu}\) を使う方が式が簡潔になることが多い。\(g_{\mu\nu}\)\(g^{\mu\nu}\) は互いに逆行列の関係で結ばれているから、一方の変分を決めれば他方も決まる——どちらで変分しても同じ物理が出てくるわ。\(\delta S_{\text{EH}} = 0\) とすれば、真空の Einstein 方程式 \(G_{\mu\nu} = 0\) が導かれる。ここで \(G_{\mu\nu} = R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R\)Einstein テンソル——Ricci テンソルと Ricci スカラーから構成される量で、時空の曲がり方を記述するの。\(-\frac{1}{2}g_{\mu\nu}R\) という項は作用の変分計算から自然に出てくるのだけど、その結果がエネルギー保存則(\(\nabla_\mu T^{\mu\nu} = 0\))と自動的に整合するのは Bianchi 恒等式(\(\nabla_\mu G^{\mu\nu} = 0\))のおかげ——第 13 章第 15 章 で学んだわね。

🔵 カイ: でも逆行列の変分って、\(\delta g^{\mu\nu}\)\(\delta g_{\mu\nu}\) はどう関係するんですか? それに \(\sqrt{-g}\)\(R\)\(g^{\mu\nu}\) で変分するのって、めちゃくちゃ大変そう……。

🟡 リナ: 確かに計算は重いわ。\(\delta g^{\mu\nu}\)\(\delta g_{\mu\nu}\) の関係だけ答えておくと、\(g^{\mu\alpha}g_{\alpha\nu} = \delta^\mu_\nu\)(逆行列の定義)の両辺を変分すると、右辺の \(\delta^\mu_\nu\) は定数だから変分ゼロ。左辺は積の法則で \(\delta g^{\mu\alpha} \cdot g_{\alpha\nu} + g^{\mu\alpha} \cdot \delta g_{\alpha\nu} = 0\)。ここから \(\delta g^{\mu\alpha}\) について解けば \(\delta g^{\mu\nu} = -g^{\mu\alpha}g^{\nu\beta}\delta g_{\alpha\beta}\) が出る——逆行列の微分公式の一般化ね。\(\sqrt{-g}\)\(R\) の変分は本編 第 24 章 で一歩ずつ導出するから、ここでは精神だけ押さえておいて。その精神は C.4 の Euler–Lagrange 方程式と全く同じ——場 \(\phi\) の代わりに計量 \(g^{\mu\nu}\) が力学変数になっているだけ。

⚪ メイ: なるほど。C.4 では \(\delta\phi\) の係数をゼロとおいて Euler–Lagrange 方程式を得た。ここでも同じように \(\delta g^{\mu\nu}\) の係数をゼロとおけば Einstein 方程式が出る——力学変数が何であれ、変分原理の論理構造は同じなのね。

🟡 リナ: そう。さっきの \(G_{\mu\nu} = 0\) は重力だけ(真空)の場合。現実の宇宙には物質があるから、物質場の作用 \(S_m\) も加えた全作用

\[ S = S_{\text{EH}} + S_m = \frac{1}{16\pi G}\int d^4x\,\sqrt{-g}\,R + \int d^4x\,\sqrt{-g}\,\mathcal{L}_m \]

\(g^{\mu\nu}\) で変分すれば、完全な Einstein 方程式 \(G_{\mu\nu} = 8\pi G\, T_{\mu\nu}\) が得られる。エネルギー運動量テンソル \(T_{\mu\nu}\) は物質の作用 \(S_m\) を計量 \(g^{\mu\nu}\) で「微分」したもの——正確には汎関数微分したもの——として定義されるの。

🔵 カイ: 汎関数微分? 普通の微分とは違うんですか?

🟡 リナ: 普通の偏微分は「有限個の変数 \(x_1, x_2, \ldots\) のうち一つを少し動かしたときの変化率」よね。でも作用 \(S\) の「変数」は \(g^{\mu\nu}(x)\) という関数そのもの——時空の各点での値という無限個の自由度を持っている。だから「関数で微分する」ための道具が必要になるの。それが汎関数微分。

まず「汎関数」について一言。普通の関数は数値を入力して数値を返すけど、作用 \(S\)\(\phi(x)\) という関数全体を入力として受け取り、一つの数値を返す。こういう「関数から数値への対応」を汎関数(functional)と呼ぶの。\(S[\phi]\) と角括弧で書くのはそのしるし。

🔵 カイ: あ、だから作用は \(S[\phi]\) って角括弧で書いていたんですね! 普通の関数 \(f(x)\) と区別するためか。

🟡 リナ: そして汎関数微分は、「作用 \(S_m\)\(g^{\mu\nu}(x)\) の微小変化 \(\delta g^{\mu\nu}(x)\) に対してどれだけ変化するか」を表す量よ。具体的には、作用の変分が

\[ \delta S_m = \int d^4x\, \frac{\delta S_m}{\delta g^{\mu\nu}(x)}\,\delta g^{\mu\nu}(x) \]

と書けるとき、その係数 \(\frac{\delta S_m}{\delta g^{\mu\nu}(x)}\) が汎関数微分。ここで \(\mu, \nu\) は自由添字——和をとらず、各 \((\mu,\nu)\) の組(計 10 個の独立成分)に対して 1 本ずつ式が成り立っているの。「あれ、\(\mu\nu\) が 2 回出ているのに和をとらないの?」と思うかもしれないけど、分母の \(g^{\mu\nu}\) は「何で微分するか」を指定する記号であって、テンソルの添字ではないから縮約規則の対象外よ。記号が普通の微分の \(\frac{\partial}{\ }\) ではなく \(\frac{\delta}{\ }\) なのは、「関数で微分する」という特殊な操作であることを区別するため。

🟡 リナ: 実は C.4 で既にやっていたことそのものなの。あのとき \(\delta S = \int[\cdots]\delta\phi\,d^4x\) と書いて、\(\delta\phi\) の係数をゼロとおいたでしょう? あの括弧の中身 \(\frac{\partial\mathcal{L}}{\partial\phi} - \partial_\mu\left(\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\right)\) が、まさに \(\frac{\delta S}{\delta\phi(x)}\) に他ならないの。つまり汎関数微分は新しい計算法というより、C.4 でやった「変分して係数を読み取る」操作に名前を付けたものよ。

⚪ メイ: なるほど、C.4 の手順がそのまま汎関数微分の定義になっていたのね。

🔵 カイ: なるほど……でも一つ気になるのは、C.4 では \(\delta\phi\) は「任意の関数」だったから係数をゼロにできた。\(\delta g^{\mu\nu}\) の場合も本当に「任意」と言えるんですか? 計量って対称性とか制約がありそうですけど。

🟡 リナ: いい疑問ね。\(g^{\mu\nu}\) は対称テンソルだから \(\delta g^{\mu\nu}\) も対称(\(\delta g^{\mu\nu} = \delta g^{\nu\mu}\))という制約はある。でも、その制約の範囲内で「任意の対称な変分」を考えれば、同じ論法で係数をゼロにできるの。ポイントは、\(\delta S = \int (\text{何か})_{\mu\nu}\,\delta g^{\mu\nu}\,d^4x = 0\)\(\delta g^{\mu\nu}\) が対称なら、係数の対称部分だけがゼロになる——つまり \((\text{何か})_{\mu\nu} + (\text{何か})_{\nu\mu} = 0\) が要求されるの。結果として出てくる Einstein テンソル \(G_{\mu\nu}\) は最初から対称(\(G_{\mu\nu} = G_{\nu\mu}\))だから、この条件は \(G_{\mu\nu} = 0\) と同値になる——整合性が保たれるわ。

⚪ メイ: つまり、変分の対称性と方程式の対称性がちゃんと揃っているのね。

🟡 リナ: さて、エネルギー運動量テンソルはこの汎関数微分を使って:

\[ T_{\mu\nu} = -\frac{2}{\sqrt{-g}}\,\frac{\delta S_m}{\delta g^{\mu\nu}} \]

と定義される。

🔵 カイ: \(\sqrt{-g}\) で割ったり、\(2\) を掛けたり、マイナスが付いたり……この係数にはそれぞれ意味があるんですか?

🟡 リナ: あるわ。一つずつ説明するわね。まず \(\sqrt{-g}\) で割る理由——C.6 で見たように \(\sqrt{-g}\,d^4x\) が座標に依存しない「真の体積要素」だった。\(S_m\) の被積分関数には \(\sqrt{-g}\) が含まれているから、\(\frac{\delta S_m}{\delta g^{\mu\nu}}\) には \(\sqrt{-g}\) の因子が残る。それを \(\sqrt{-g}\) で割ることで、\(T_{\mu\nu}\) が「真の体積あたりの量」——つまり座標変換で正しくテンソルとして変換される量——になるの。

🔵 カイ: なるほど、\(\sqrt{-g}\) で割るのは「座標に依存しない密度」にするためなんですね。

🟡 リナ: 次に係数の \(2\)——これは \(g^{\mu\nu}\) が対称テンソル(\(g^{\mu\nu} = g^{\nu\mu}\))であることに由来する規約で、こう定義しておくと Einstein 方程式が \(G_{\mu\nu} = 8\pi G\,T_{\mu\nu}\) というきれいな形になるの。最後に符号のマイナス——これは計量の符号規約 \((-,+,+,+)\) のもとで \(T_{00}\)(エネルギー密度)が正の値になるように調整したもの。要するに、\(T_{\mu\nu}\) は「物質の作用を計量で変分したときの応答」——Lagrangian から自動的に得られるの。具体的に C.5 の自由スカラー場で \(T_{\mu\nu}\) を計算する練習は練習問題(問題 M-4. エネルギー運動量テンソルの導出)で扱うから、ぜひ手を動かしてみてね。

🔵 カイ: Lagrangian を一つ書けば、運動方程式もエネルギー運動量テンソルも全部出てくる……。でも逆に言えば、Lagrangian の形を間違えたら全部ずれるってことですよね? そもそも「正しい Lagrangian」はどうやって決めるんですか? 何でもアリなわけじゃないですよね?

🟡 リナ: いい疑問ね。実は「対称性」が強力な制約を与えるの。座標変換に対して作用が不変であること、計量の 2 階微分までしか含まないこと——そういった条件を課すと、選択肢はほとんど絞られる。本編 第 24 章 で「作用原理の 3 つの要請」として体系的に議論したわね。これが作用原理の威力よ。座標系に依存しない形で物理法則を記述でき、しかも全ての方程式が一つの原理から統一的に導かれる。一般相対論のような「座標系に特権がない」モデルにとって、これ以上ない道具なの。

📝 練習問題:


C.8 複数の場がある場合

🟡 リナ: 最後に、複数の場がある場合について補足しておくわ。現実の宇宙には計量場だけでなく、電磁場や物質場が共存している。その場合、全作用は:

\[ S = S_{\text{EH}}[g_{\mu\nu}] + S_m[\phi, A_\mu, \ldots;\, g_{\mu\nu}] \]

のように、各場の寄与と相互作用の和になる。

⚪ メイ: ということは、各場について独立に変分すれば、それぞれの運動方程式が出てくる?

🟡 リナ: その通り。\(g_{\mu\nu}\) で変分すれば Einstein 方程式、\(\phi\) で変分すれば Klein–Gordon 方程式、\(A_\mu\) で変分すれば Maxwell 方程式——全てが同じ作用原理から出てくるの。

🔵 カイ: 一つの作用 \(S\) から全部の方程式が出てくるのはすごいですけど……この枠組みに限界はないんですか? 例えば量子力学とは両立するんでしょうか?

🟡 リナ: いい疑問ね。実は、重力を量子化しようとするとこの枠組みには深刻な困難が生じる。それは 「量子重力問題への挑戦」編 で扱うテーマよ。

🔵 カイ: じゃあ、この理論にも限界があるんですね。もし限界があるとしたら、何を変えることになるんですか? 作用原理そのものが使えなくなるのか、それとも作用の中身を書き換えるのか……。

🟡 リナ: いい問いね。実はどちらの可能性も研究されている——作用原理という「枠組み」は維持しつつ中身の Lagrangian を修正する方向と、枠組み自体を根本から変える方向と。ただし、現時点ではこの枠組みは実験で反証されていない最良の仮説よ。その予測精度と美しさは、人類が手にした知的道具の中でも最高峰のものだと思うわ。

⚪ メイ: つまり、どちらの方向もあり得るけど、今のところ作用原理は生き残っているということね。

🔵 カイ: なるほど……対称性で形が決まるっていうのは美しいですね。でもそれって、もし将来もっと精密な実験で Einstein 方程式からのずれが見つかったら、Lagrangian を修正しないといけないってことですか?

🟡 リナ: その通り。対称性や簡潔さで候補を大きく絞ることはできるけど、最終的には実験・観測との整合性が判定基準になる。自然がどの Lagrangian を「選んでいる」かは、実験に聞くしかない——それが物理学の本質的な姿勢よ。

🟡 リナ: この章全体を振り返ると——Lagrangian 密度 \(\mathcal{L}\) を一つ決めれば、変分原理から運動方程式が出る。物質場なら Euler–Lagrange 方程式、重力場なら Einstein 方程式。C.8 で見たように複数の場があっても、全作用を各場で変分するだけ。「一つの原理から全てを導く」枠組みよ。

⚪ メイ: 粒子の作用原理から始まって、場の理論、曲がった時空、Einstein 方程式まで——全部が同じ変分の発想で繋がっている構造が見えてきたわ。

🔵 カイ: 確かに一本の原理で全部つながってるのは美しい。……でも逆に言えば、この「糸」が量子重力で切れるかもしれないってことですよね。

🟡 リナ: その「気になる」を大事にしてね。少なくとも、この章で学んだ「Lagrangian を書いて変分する」という手続きは、量子場理論の経路積分でも中心的な役割を果たしている。だから作用原理の発想自体は量子の世界でも生き残っているの——ただし、重力を量子化しようとすると新たな困難が現れる。それは 「量子重力問題への挑戦」編 のテーマよ。


次章予告

Appendix D では、本編で登場した代表的な時空——Schwarzschild、一般球対称、FRW 宇宙モデル、Minkowski——の計量・Christoffel 記号・Riemann テンソル・Ricci テンソル・Ricci スカラーを公式集として一覧にまとめる。自分で一から計算し直す手間を省き、計算結果の検算や問題演習の「辞書」として繰り返し参照できる実用的な付録だ。


参考文献

  • D. Tong, Lectures on General Relativity, Chapter 2: The Principle of Least Action (Cambridge, 2019).
  • T. Lancaster & S. J. Blundell, Quantum Field Theory for the Gifted Amateur, Chapter 11: Lagrangian Field Theory (Oxford University Press, 2014).
  • S. Carroll, Spacetime and Geometry, Chapter 4: Gravitation (Cambridge University Press, 2019).
  • L. D. Landau & E. M. Lifshitz, The Classical Theory of Fields, 4th ed., Chapter 2 (Butterworth-Heinemann, 1975).