Capítulo 6 Cuantización del campo electromagnético — La lucha con los grados de libertad de gauge¶
Resumen de los capítulos anteriores:
En Cap. 5 cuantizamos el campo de Dirac y confirmamos que las relaciones de anticonmutación de fermiones \(\{a_{\mathbf{p},s}, a_{\mathbf{q},r}^\dagger\} = (2\pi)^3 \delta^3(\mathbf{p} - \mathbf{q})\delta_{sr}\) realizan naturalmente el teorema de espín-estadística, y que las antipartículas aparecen como soluciones de energía positiva. Con esto se completó la cuantización del espín 0 (campo escalar) y espín 1/2 (campo de Dirac).
Objetivo de este capítulo
- Cuantizar el campo electromagnético (espín 1) y comprender que la simetría de gauge —una "redundancia en la descripción"— causa dificultades serias en la cuantización
- Superar estas dificultades mediante dos prescripciones: el gauge de Coulomb y el gauge de Lorenz, y derivar que físicamente el fotón solo tiene 2 polarizaciones transversales
6.1 Lagrangiano del campo de Maxwell — Punto de partida¶
🟡 Lina: Bien, hemos ido cuantizando el campo escalar y el campo de Dirac. El protagonista que falta es el fotón — la partícula de espín 1. El fotón aparece al cuantizar el campo electromagnético. Pero aquí nos espera una dificultad fundamental que no existía en los dos casos anteriores.
🔵 Kai: ¿Qué tipo de dificultad?
🟡 Lina: Para entenderla, comencemos escribiendo el Lagrangiano del campo electromagnético. Como aprendimos en Cap. 3, la teoría de campos parte de la densidad lagrangiana \(\mathcal{L}\). Para el campo electromagnético libre (sin fuentes como cargas o corrientes):
El coeficiente \(-1/4\) es una constante de normalización elegida para que al derivar las ecuaciones de Euler-Lagrange se obtengan correctamente las ecuaciones de Maxwell — lo verificaremos después. \(F_{\mu\nu}\) se llama el tensor de intensidad de campo (field strength tensor) y se define como:
\(A_\mu\) es el cuadripotencial (four-potential).
🔵 Kai: ¿Qué componentes tiene \(A_\mu\)?
🟡 Lina: Es un cuadrivector con 4 componentes.
\(A_0\) corresponde al potencial eléctrico (potencial escalar) que se estudia en el bachillerato, y \(\mathbf{A} = (A^1, A^2, A^3)\) (componentes contravariantes) es el potencial vectorial. Ten en cuenta que con la métrica \(\eta_{\mu\nu} = \mathrm{diag}(+1,-1,-1,-1)\) se tiene \(A^i = -A_i\) (las componentes espaciales cambian de signo entre índices arriba y abajo. En este capítulo, al expresar los campos eléctrico y magnético físicos usaremos las componentes contravariantes \(A^i\), mientras que en las discusiones del formalismo canónico usaremos frecuentemente las componentes covariantes \(A_i\)). El campo eléctrico \(\mathbf{E}\) y el campo magnético \(\mathbf{B}\) son:
(Estamos usando unidades naturales \(c = 1\), así que la fórmula del sistema gaussiano \(\mathbf{E} = -\nabla\Phi - \frac{1}{c}\frac{\partial\mathbf{A}}{\partial t}\) queda sin la \(c\)). Es decir, el campo eléctrico y magnético son cantidades "secundarias" derivadas de \(A_\mu\). Y mirando la definición (6.2), si intercambias \(\mu\) y \(\nu\) el orden de la resta se invierte, así que \(F_{\mu\nu} = -F_{\nu\mu}\) — es un tensor antisimétrico. Las componentes diagonales \(F_{\mu\mu}\) son automáticamente cero.
⚪ Mei: Ya veo, si es antisimétrico y la diagonal es cero, las componentes independientes son solo la parte triangular superior… \(4 \times 3 / 2 = 6\).
🟡 Lina: Así es. Y esas 6 corresponden exactamente a las 3 componentes del campo eléctrico y las 3 del campo magnético.
🟡 Lina: Exacto. Si escribimos explícitamente \(F^{\mu\nu} = \eta^{\mu\alpha}\eta^{\nu\beta}F_{\alpha\beta}\) con los índices subidos:
🔵 Kai: ¿Cómo se derivan las componentes de esta matriz? Por ejemplo, ¿por qué \(F^{0i} = -E_i\)?
🟡 Lina: Veámoslo paso a paso. Primero comparemos \(F_{0i} = \partial_0 A_i - \partial_i A_0\) con la ecuación (6.3). En la ecuación (6.3), \(\mathbf{A}\) es el potencial vectorial físico, es decir, las componentes contravariantes \(A^i\). Para bajar el índice usamos la métrica: \(A_i = \eta_{ij}A^j = (-\delta_{ij})A^j = -A^i\) (las componentes espaciales cambian de signo con la métrica). Como \(A_i = -A^i\):
(Verifiquemos. Como \(A_i = -A^i\), entonces \(\partial_0 A_i = -\partial_0 A^i\). Por lo tanto \(F_{0i} = \partial_0 A_i - \partial_i A_0 = -\partial_0 A^i - \partial_i A_0\). Por otro lado, de la ecuación (6.3), \(\nabla A_0\) es un vector cuya componente \(i\) es \(\partial A_0/\partial x^i\), así que \(E^i = -(\nabla A_0)_i - \dot{A}^i = -\partial_i A_0 - \partial_0 A^i\). Aquí \(\partial_i A_0 \equiv \partial A_0/\partial x^i\). Comparando ambas expresiones, \(F_{0i} = E^i\) coincide.) Ahora subimos los índices. Usando \(F^{\mu\nu} = \eta^{\mu\alpha}\eta^{\nu\beta}F_{\alpha\beta}\) para obtener \(F^{0i}\), con la métrica diagonal: para \(\mu = 0\), \(\eta^{0\alpha}\) es distinto de cero solo para \(\alpha = 0\); para \(\nu = i\), \(\eta^{i\beta}\) es distinto de cero solo para \(\beta = i\) (sin sumar). Por lo tanto:
(Aquí usamos \(\eta^{ii} = -1\) (sin convención de suma). Como \(F_{0i} = E^i\), entonces \(F^{0i} = -E^i\).) Por la antisimetría, \(F^{i0} = -F^{0i} = E^i\). Verificando en la matriz (6.4), las columnas \(i = 1, 2, 3\) de la primera fila son \(-E_x, -E_y, -E_z\), lo cual coincide con \(F^{0i} = -E^i\) (\(E^1 = E_x\), etc.).
🔵 Kai: Oh, los signos se determinan por la combinación de \(+1\) y \(-1\) de la métrica.
🟡 Lina: El campo eléctrico y el campo magnético unificados en un solo tensor antisimétrico — aquí se manifiesta la belleza de la relatividad especial.
🔵 Kai: ¿De este Lagrangiano (6.1) salen las ecuaciones de Maxwell?
🟡 Lina: Sí. Aplicamos la ecuación de Euler-Lagrange para campos que aprendimos en Cap. 3: \(\partial_\mu \frac{\partial \mathcal{L}}{\partial(\partial_\mu A_\nu)} - \frac{\partial \mathcal{L}}{\partial A_\nu} = 0\). Como \(\mathcal{L} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu}\) no contiene \(A_\nu\) directamente, el segundo término es cero. Calculando el primer término, resulta \(\frac{\partial \mathcal{L}}{\partial(\partial_\mu A_\nu)} = -F^{\mu\nu}\) (el coeficiente \(-1/4\) y el factor 4 proveniente de la antisimetría se cancelan), y el resultado es:
Esta es la forma covariante de las ecuaciones de Maxwell en el vacío. Tomando \(\nu = 0\) se obtiene la ley de Gauss \(\nabla \cdot \mathbf{E} = 0\); tomando \(\nu = i\) se obtiene la ley de Ampère-Maxwell \(\nabla \times \mathbf{B} = \frac{\partial \mathbf{E}}{\partial t}\).
⚪ Mei: ¿Y las otras 2 ecuaciones de Maxwell — \(\nabla \cdot \mathbf{B} = 0\) y la ley de Faraday?
🟡 Lina: Esas son identidades que se cumplen automáticamente a partir de la definición (6.2) de \(F_{\mu\nu}\) (identidades de Bianchi). Organicemos la procedencia de las 4 ecuaciones de Maxwell.
Tabla 6.1: Forma covariante y origen de las ecuaciones de Maxwell
| Ecuación de Maxwell | Componente | Forma covariante | Origen |
|---|---|---|---|
| Ley de Gauss \(\nabla \cdot \mathbf{E} = 0\) | \(\nu = 0\) | \(\partial_\mu F^{\mu 0} = 0\) | Ecuación de movimiento (6.5) |
| Ampère-Maxwell \(\frac{\partial \mathbf{E}}{\partial t} = \nabla \times \mathbf{B}\) | \(\nu = i\) | \(\partial_\mu F^{\mu i} = 0\) | Ecuación de movimiento (6.5) |
| \(\nabla \cdot \mathbf{B} = 0\) | — | Identidad de Bianchi (6.6) | Automática por la definición de \(F_{\mu\nu}\) |
| Faraday \(\nabla \times \mathbf{E} = -\frac{\partial \mathbf{B}}{\partial t}\) | — | Identidad de Bianchi (6.6) | Automática por la definición de \(F_{\mu\nu}\) |
Como el orden de las derivadas parciales es intercambiable, al sustituir todos los términos se cancelan.
🔵 Kai: ¡Las 4 ecuaciones de Maxwell salen todas de un solo Lagrangiano y una definición!
✅ Verificación de comprensión: Demuestra directamente a partir de la definición que \(F_{\mu\nu} = \partial_\mu A_\nu - \partial_\nu A_\mu\) es antisimétrico (\(F_{\mu\nu} = -F_{\nu\mu}\)).
Respuesta
Intercambiando \(\mu\) y \(\nu\): \(F_{\nu\mu} = \partial_\nu A_\mu - \partial_\mu A_\nu = -(\partial_\mu A_\nu - \partial_\nu A_\mu) = -F_{\mu\nu}\). Simplemente se invierte el orden de la resta, por lo que el signo se invierte.
📝 Ejercicios:
- Expresar \(F_{\mu\nu}F^{\mu\nu}\) en términos de \(\mathbf{E}\) y \(\mathbf{B}\) → Problema B-1. Antisimetría del tensor de intensidad de campo y verificación de sus componentes
6.2 Simetría de gauge U(1) — La redundancia en la descripción¶
🟡 Lina: Ahora viene el núcleo de este capítulo. El Lagrangiano (6.1) posee una enorme simetría que no existía en el campo escalar ni en el campo de Dirac. Es la simetría de gauge (gauge symmetry).
La siguiente transformación del cuadripotencial deja la física completamente invariante:
donde \(\lambda(x)\) es una función arbitraria del espacio-tiempo. Esto se llama transformación de gauge (gauge transformation).
🔵 Kai: ¿Una "función arbitraria"? Eso es un grado de libertad enorme. ¿Por qué la física no cambia?
🟡 Lina: Calcula el tensor de intensidad de campo \(F_{\mu\nu}\).
Como el orden de las derivadas parciales es intercambiable, \(\partial_\mu \partial_\nu \lambda = \partial_\nu \partial_\mu \lambda\). Por lo tanto:
Si \(F_{\mu\nu}\) es invariante, entonces \(\mathcal{L} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu}\) también lo es. Ni el campo eléctrico \(\mathbf{E}\) ni el campo magnético \(\mathbf{B}\) cambian.
⚪ Mei: Es decir, \(A_\mu\) y \(A_\mu + \partial_\mu \lambda\) describen la misma física.
🟡 Lina: Exactamente. \(A_\mu\) tiene una "ambigüedad esencial". Quiero enfatizar un punto muy importante aquí.
La simetría de gauge no es una "simetría" en el sentido usual. No conecta "estados físicos diferentes" como lo hace una rotación espacial, sino que conecta diferentes descripciones del mismo estado físico. Es decir, representa una redundancia (redundancy) contenida en nuestra descripción.
🔵 Kai: Redundancia… ¿Es como cuando cambias el sistema de coordenadas de un mapa, pero Tokio sigue siendo Tokio?
🟡 Lina: Excelente analogía. Exactamente así. \(A_\mu\) es como las "coordenadas", y lo que tiene significado físico es \(F_{\mu\nu}\) (es decir, \(\mathbf{E}\) y \(\mathbf{B}\)) — las "cantidades independientes de las coordenadas". Mira Fig. 6.1「Diagrama conceptual de la transformación de gauge」. La transformación de gauge cambia \(A_\mu\), pero la cantidad física \(F_{\mu\nu}\) permanece invariante — he resumido esta estructura en la figura.
Fig. 6.1: Diagrama conceptual de la transformación de gauge. La transformación de gauge conecta diferentes descripciones de la misma física. El potencial \(A_\mu\) cambia, pero la cantidad física \(F_{\mu\nu}\) (campos eléctrico y magnético) permanece invariante.
✅ Verificación de comprensión: Demuestra que \(F_{\mu\nu}\) es invariante bajo la transformación de gauge \(A_\mu \to A_\mu + \partial_\mu \lambda\), sustituyendo en la definición de la ecuación (6.2).
Respuesta
\(F_{\mu\nu}' = \partial_\mu(A_\nu + \partial_\nu \lambda) - \partial_\nu(A_\mu + \partial_\mu \lambda) = \partial_\mu A_\nu - \partial_\nu A_\mu + \partial_\mu \partial_\nu \lambda - \partial_\nu \partial_\mu \lambda\). Como el orden de las derivadas parciales es intercambiable, \(\partial_\mu \partial_\nu \lambda = \partial_\nu \partial_\mu \lambda\). Por lo tanto \(F_{\mu\nu}' = F_{\mu\nu}\).
🔵 Kai: Pero si hay redundancia, ¿por qué usar \(A_\mu\)? ¿No bastaría con describir todo solo con \(\mathbf{E}\) y \(\mathbf{B}\)?
🟡 Lina: En realidad, no se puede escribir bien el Lagrangiano solo con \(\mathbf{E}\) y \(\mathbf{B}\). Para escribir un Lagrangiano covariante de Lorentz se necesita \(A_\mu\). Además, en mecánica cuántica hay fenómenos como el efecto Aharonov-Bohm donde \(A_\mu\) mismo juega un papel físico. El efecto Aharonov-Bohm es el sorprendente fenómeno donde el patrón de interferencia de electrones que pasan por una región con campo magnético \(\mathbf{B} = 0\) depende del flujo magnético que rodea esa región (es decir, la integral de línea de \(\mathbf{A}\)). Aunque \(\mathbf{E}\) y \(\mathbf{B}\) sean cero, \(\mathbf{A}\) tiene efectos físicos — es evidencia de que el potencial no es una mera herramienta de cálculo. Aunque contenga redundancia, hay razones profundas para usar \(A_\mu\).
Simetría de gauge y transformación U(1) local¶
🟡 Lina: Veamos la transformación de gauge (6.7) desde el lado del campo de materia (campo de partículas cargadas). El campo electromagnético \(A_\mu\) es "el campo que transmite la fuerza", pero también necesitamos el lado que recibe la fuerza — el campo de partículas con carga. Aquí, para simplificar al máximo, usaremos el campo escalar complejo que aprendimos en Cap. 4 como representante del "campo de partículas cargadas". En Cap. 4 lo escribimos como \(\hat{\psi}\) en las fórmulas de expansión en modos, pero aquí lo escribiremos como \(\phi\) para evitar confusión con el espinor de Dirac. Su Lagrangiano es:
El campo escalar complejo tiene una sola componente, así que el conjugado complejo \(*\) y el conjugado hermítico \(\dagger\) significan lo mismo. Este Lagrangiano es invariante bajo la transformación U(1) global:
(\(\alpha\) es una constante). Por el teorema de Noether de Cap. 3, la cantidad conservada correspondiente a esta simetría es la carga eléctrica.
🔵 Kai: "Global" significa que se rota en el mismo ángulo \(\alpha\) en todas partes del universo, ¿verdad?
🟡 Lina: Así es. Pero ahora planteemos una pregunta ambiciosa. ¿Se puede hacer invariante incluso si cambiamos la fase independientemente en cada punto del espacio-tiempo? Es decir, exigir invariancia bajo la transformación local:
⚪ Mei: Como \(\alpha(x)\) depende de \(x\), al derivar aparecerán términos extra.
🟡 Lina: Exacto. \(\partial_\mu \phi \to e^{i\alpha(x)}(\partial_\mu \phi + i(\partial_\mu \alpha)\phi)\), y el término extra \(i(\partial_\mu \alpha)\phi\) sobrevive. La invariancia del Lagrangiano se rompe.
🔵 Kai: Entonces, ¿la invariancia local es imposible?
🟡 Lina: No. Aquí está la idea genial. El problema es que al calcular \(\partial_\mu(e^{i\alpha}\phi)\) aparece el término extra \(i(\partial_\mu \alpha)\phi\). Para cancelarlo, necesitamos "algo" que compense con \(-i(\partial_\mu \alpha)\) cada vez que derivamos.
Razonemos al revés. Queremos que \(D_\mu \phi\) siga la misma regla de transformación que \(\phi\): \(D_\mu \phi \to e^{i\alpha} D_\mu \phi\). Con la derivada ordinaria \(\partial_\mu\) aparece el término extra \(i(\partial_\mu \alpha)\phi\). Así que añadimos un "término de corrección" a la derivada, y ese término de corrección debe producir exactamente \(-i(\partial_\mu \alpha)\phi\) durante la transformación para cancelar. Entonces introducimos un nuevo campo \(A_\mu\) y reemplazamos la derivada ordinaria por la "derivada covariante" (covariant derivative):
Aquí \(q\) es la constante de acoplamiento, que físicamente corresponde a la carga de la partícula (para el electrón, \(q = -e\)). En el sistema de unidades naturales de física de partículas, además de \(c = \hbar = 1\), se elige también \(\varepsilon_0 = 1\) para las unidades electromagnéticas (llamado sistema de unidades de Heaviside-Lorentz). En el sistema SI la fuerza de Coulomb es \(F = q^2/(4\pi\varepsilon_0 r^2)\), así que al eliminar \(\varepsilon_0\), \(q^2\) tiene dimensiones de fuerza×distancia\(^2\). Además, con \(\hbar = c = 1\) donde las dimensiones de longitud, tiempo y energía se unifican, \(q^2/(4\pi)\) se convierte en una cantidad adimensional. De hecho, esto se ve en que la constante de estructura fina \(\alpha = q^2/(4\pi) \approx 1/137\) es adimensional. Es decir, en este sistema de unidades la carga \(q\) misma es adimensional.
🔵 Kai: ¿Por qué \(+iq\)? ¿No podría ser \(+q\) o \(+iA_\mu\)?
🟡 Lina: Buena pregunta. Se ve razonando al revés. Al expandir \(\partial_\mu(e^{i\alpha}\phi)\) aparece el término extra \(+i(\partial_\mu \alpha)\phi\). Para cancelarlo, necesitamos un término en \(D_\mu\) que produzca \(-i(\partial_\mu \alpha)\phi\). Si \(A_\mu\) se desplaza en \(\Delta A_\mu\) durante la transformación, la contribución del término de corrección \(iq A_\mu\) en \(D_\mu\) es \(iq \cdot \Delta A_\mu \cdot \phi\). Para que esto sea igual a \(-i(\partial_\mu \alpha)\phi\), necesitamos \(iq \cdot \Delta A_\mu = -i(\partial_\mu \alpha)\), es decir \(\Delta A_\mu = -\frac{1}{q}\partial_\mu \alpha\). Dicho de otro modo, si el coeficiente en \(D_\mu\) no es \(iq\) (el producto de \(i\) y \(q\)), esta cancelación no funciona.
⚪ Mei: Es decir, \(i\) proviene del \(e^{i\alpha}\) de la transformación de fase, y \(q\) es la constante de acoplamiento que mencionó la profesora Lina — la magnitud de la carga.
🟡 Lina: Así es. La relación entre la función de gauge \(\lambda\) de la ecuación (6.7) y la fase del campo de materia \(\alpha\) es \(\lambda = -\alpha/q\). Sustituyendo esto en la ecuación (6.7):
El signo menos aparece porque, para cancelar el término extra \(+i(\partial_\mu \alpha)\phi\) en la transformación de \(D_\mu \phi\), \(A_\mu\) necesita desplazarse en \(-\frac{1}{q}\partial_\mu \alpha\). Con esta correspondencia, \(D_\mu \phi\) sigue la misma regla de transformación que \(\phi\):
🔵 Kai: Espera un momento. ¿Por qué es así? Quiero verificarlo con el cálculo.
🟡 Lina: Muy bien. Hagámoslo. Calculemos \(D_\mu' \phi'\) después de la transformación.
Expandiendo \(\partial_\mu(e^{i\alpha}\phi)\) por la regla del producto:
El primer y cuarto término se cancelan:
⚪ Mei: Ya veo. La transformación de \(A_\mu\) absorbe exactamente el término extra de \(\partial_\mu \alpha\). Si \(D_\mu \phi\) sigue la misma regla de transformación que \(\phi\), entonces el término cinético del Lagrangiano también debería ser invariante de gauge.
🟡 Lina: Exactamente. De hecho, si reemplazamos el término cinético del Lagrangiano de \(\partial_\mu\phi^*\,\partial^\mu\phi\) a \((D^\mu \phi)^\dagger (D_\mu \phi)\), como \(D_\mu\phi \to e^{i\alpha}D_\mu\phi\) y \((D_\mu\phi)^\dagger \to (D_\mu\phi)^\dagger e^{-i\alpha}\), las fases se cancelan y automáticamente es invariante de gauge.
🟡 Lina: Así es. Y si añadimos como Lagrangiano propio de \(A_\mu\) el invariante de gauge \(-\frac{1}{4}F_{\mu\nu}F^{\mu\nu}\), toda la teoría se vuelve invariante de gauge.
Aquí emerge un mensaje asombroso:
Solo con exigir la simetría U(1) local, la existencia del campo electromagnético \(A_\mu\) y la forma de su acoplamiento con el campo de materia quedan determinados de forma única. La simetría genera la fuerza.
🔵 Kai: Increíble… ¿La respuesta a "por qué existe la fuerza electromagnética" es "porque admitimos la libertad local de la fase"?
🟡 Lina: Así es. Y este principio no se limita a la fuerza electromagnética. De la simetría local SU(2)×U(1) se deriva la fuerza débil, y de la simetría local SU(3) se deriva la fuerza fuerte. Esto lo estudiaremos en detalle en Cap. 17 con la teoría de Yang-Mills.
✅ Verificación de comprensión: ¿Cuándo surge la necesidad de reemplazar la derivada ordinaria \(\partial_\mu\) por la derivada covariante \(D_\mu = \partial_\mu + iqA_\mu\)? ¿Y qué se deduce como resultado?
Respuesta
Cuando se exige la simetría U(1) local (que el Lagrangiano sea invariante aunque se cambie la fase independientemente en cada punto del espacio-tiempo). Con la derivada ordinaria, en \(\partial_\mu(e^{i\alpha(x)}\psi)\) aparece un término extra con \(\partial_\mu \alpha\), por lo que es necesario introducir un nuevo campo \(A_\mu\) que lo absorba y reemplazar por la derivada covariante. Como resultado, la existencia del campo electromagnético y la forma de su acoplamiento con el campo de materia quedan determinados de forma única.
6.3 La simetría de gauge impide la cuantización — Desaparición del momento conjugado¶
🟡 Lina: Habiendo confirmado la belleza de la simetría de gauge, ahora nos enfrentamos a la dificultad. Intentemos cuantizar canónicamente el campo electromagnético.
Cuando cuantizamos el campo escalar en Cap. 4, ¿cuál fue el primer paso?
🔵 Kai: Eh… definir el momento conjugado al campo e imponer relaciones de conmutación, ¿verdad?
🟡 Lina: Así es. Definimos el momento conjugado \(\pi = \partial \mathcal{L}/\partial \dot{\phi}\) e impusimos la relación de conmutación a tiempos iguales \([\phi(\mathbf{x},t),\, \pi(\mathbf{y},t)] = i\delta^3(\mathbf{x} - \mathbf{y})\). Hagamos lo mismo para \(A_\mu\). El momento conjugado de \(A_\mu\) es:
Expandiendo el Lagrangiano \(\mathcal{L} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu}\) y derivando con respecto a \(\partial_0 A_\mu\), para las componentes espaciales \(\mu = i\):
(Verifiquemos el cálculo. Para \(\mathcal{L} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu}\), se cumple \(\frac{\partial \mathcal{L}}{\partial(\partial_\rho A_\sigma)} = -F^{\rho\sigma}\) (el coeficiente \(-1/4\) y el factor 2×2 de la antisimetría se cancelan). Tomando \(\rho = 0\), \(\sigma = i\) se obtiene \(\pi^i = -F^{0i}\). Como confirmamos en la ecuación (6.4), \(F^{0i} = -E^i\), así que \(\pi^i = -(-E^i) = E^i\). Es decir, el momento conjugado de \(\mathbf{A}\) es el campo eléctrico \(\mathbf{E}\).) Hasta aquí bien. El problema es la componente temporal \(\mu = 0\).
🔵 Kai: ¡¿Cero?! ¿Por qué?
🟡 Lina: Mira la definición de \(F_{\mu\nu}\). \(F_{00} = \partial_0 A_0 - \partial_0 A_0 = 0\) (por la antisimetría). Y \(F_{0i} = \partial_0 A_i - \partial_i A_0\) no contiene \(\partial_0 A_0\). Es decir, \(\dot{A}_0 = \partial_0 A_0\) no aparece en absoluto en el Lagrangiano.
⚪ Mei: Si \(\dot{A}_0\) no aparece en ninguna parte, el término correspondiente a la "velocidad" de \(A_0\) es cero… Cuando cuantizamos el campo escalar, \(\dot{\phi}\) creaba la energía cinética.
🟡 Lina: Así es. Como \(A_0\) no tiene un término correspondiente a la energía cinética, no puede tratarse como variable dinámica independiente. Que \(\pi^0 = 0\) significa que la relación de conmutación canónica
no puede escribirse. El lado izquierdo es \([A_0, 0] = 0\), pero el lado derecho es \(i\delta^3(\mathbf{x} - \mathbf{y}) \neq 0\). Surge una contradicción.
🔵 Kai: Vaya… Con el campo escalar y el campo de Dirac no había este problema.
🟡 Lina: Así es. Este es un problema específico de la simetría de gauge. Físicamente, refleja que no todas las 4 componentes de \(A_\mu\) son grados de libertad físicos independientes. Que la física no cambie bajo la transformación de gauge \(A_\mu \to A_\mu + \partial_\mu \lambda\) significa que en la configuración de \(A_\mu\) están mezcladas "la física real" y "la descripción redundante".
🔵 Kai: Entonces, ¿cuántos grados de libertad son realmente físicos de los 4 componentes?
🟡 Lina: Primero, como \(A_0\) no es variable dinámica, 4 → 3. Además, hay 1 grado de libertad de la transformación de gauge \(\lambda(x)\), así que 3 → 2. Los grados de libertad físicos son 2. Esto corresponde a que la luz tiene 2 polarizaciones (por ejemplo, polarización horizontal y vertical).
🔵 Kai: Un campo de 4 componentes, pero físicamente solo 2 grados de libertad… Los otros 2 son la redundancia del gauge.
🟡 Lina: Así es. Si no procesamos esta redundancia, la cuantización no puede avanzar. El método de procesamiento se llama fijación de gauge (gauge fixing). En Fig. 6.2「Conteo de los grados de libertad físicos del campo electromagnético」 he ilustrado esta reducción de grados de libertad.
Fig. 6.2: Conteo de los grados de libertad físicos del campo electromagnético. De las 4 componentes de \(A_\mu\), se pierde 1 porque \(\pi^0 = 0\) (\(A_0\) no es variable dinámica), y con la condición de fijación de gauge se pierde otra más, quedando como grados de libertad físicos solo las 2 polarizaciones transversales del fotón.
✅ Verificación de comprensión: El campo electromagnético \(A_\mu\) tiene 4 componentes, pero los grados de libertad físicos son solo 2. Explica la razón por la que se reduce de 4 a 2.
Respuesta
Primero, como el Lagrangiano no contiene \(\dot{A}_0\), \(A_0\) no es una variable dinámica independiente, reduciéndose de 4 → 3. Además, hay 1 grado de libertad de la transformación de gauge \(A_\mu \to A_\mu + \partial_\mu \lambda\), y eligiendo la función arbitraria \(\lambda(x)\) se puede fijar 1 componente, reduciéndose de 3 → 2. Los 2 grados de libertad restantes corresponden a las 2 polarizaciones transversales del fotón.
✅ Verificación de comprensión: Explica a partir de la definición de \(F_{\mu\nu}\) por qué el Lagrangiano del campo de Maxwell \(\mathcal{L} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu}\) no contiene \(\dot{A}_0\).
Respuesta
En \(F_{\mu\nu} = \partial_\mu A_\nu - \partial_\nu A_\mu\), lo que podría contener \(\partial_0 A_0\) son los términos de la forma \(F_{0\nu}\), pero \(F_{00} = \partial_0 A_0 - \partial_0 A_0 = 0\), y \(F_{0i} = \partial_0 A_i - \partial_i A_0\) contiene \(\partial_0 A_i\) pero no \(\partial_0 A_0\). Por lo tanto \(F_{\mu\nu}F^{\mu\nu}\) tampoco contiene \(\dot{A}_0\), y \(\pi^0 = \partial\mathcal{L}/\partial\dot{A}_0 = 0\).
6.4 Cuantización en el gauge de Coulomb — Un método donde se ven los grados de libertad físicos¶
🟡 Lina: Como primer enfoque de fijación de gauge, presentaré el gauge de Coulomb. La condición es:
Es decir, la divergencia del potencial vectorial \(\mathbf{A}\) es cero.
🔵 Kai: ¿Por qué se elige esta condición?
🟡 Lina: Tiene dos ventajas. Primera, \(\nabla \cdot \mathbf{A} = 0\) significa que \(\mathbf{A}\) es transversal. En la transformada de Fourier queda \(\mathbf{k} \cdot \tilde{\mathbf{A}}(\mathbf{k}) = 0\), es decir, \(\mathbf{A}\) solo tiene componentes perpendiculares a la dirección de propagación \(\mathbf{k}\). Las polarizaciones físicas se ven directamente.
⚪ Mei: Intuitivamente es la estrategia de "eliminar lo sobrante (la onda longitudinal) desde el principio".
🟡 Lina: Segunda, en el vacío se puede hacer \(A_0 = 0\). De la ecuación (6.3), \(\nabla \cdot \mathbf{E} = -\nabla^2 A_0 - \partial_t(\nabla \cdot \mathbf{A})\), pero en el gauge de Coulomb \(\nabla \cdot \mathbf{A} = 0\) el segundo término desaparece, y la ley de Gauss \(\nabla \cdot \mathbf{E} = 0\) se convierte en \(\nabla^2 A_0 = 0\). Imponiendo condiciones de frontera (\(A_0 \to 0\) en el infinito), la única solución es \(A_0 = 0\). Este es un resultado del teorema de unicidad de la ecuación de Laplace. Intuitivamente, una función que satisface \(\nabla^2 A_0 = 0\) (llamada función armónica) tiene la propiedad de que "el valor en cada punto es igual al promedio de los valores circundantes". Si \(A_0\) toma un valor positivo en algún punto, el promedio de su entorno también debe ser positivo, y a su vez el entorno de ese entorno… propagando el valor positivo hasta el infinito. Esto contradice la condición de frontera \(A_0 \to 0\) (que se anule en el infinito). Por lo tanto, la única posibilidad es \(A_0 \equiv 0\).
🔵 Kai: Ya veo, que \(A_0\) se anule no es simplemente una "elección", sino que sale necesariamente de la ecuación y las condiciones de frontera.
⚪ Mei: Es decir, en el gauge de Coulomb, \(A_0\) desaparece y además la condición de gauge \(\nabla \cdot \mathbf{A} = 0\) elimina la componente longitudinal de \(\mathbf{A}\). Las variables dinámicas que quedan son solo las 2 componentes transversales.
🟡 Lina: Una organización perfecta. Procedamos ahora concretamente con la cuantización.
Expansión de Fourier y vectores de polarización¶
🟡 Lina: Escribamos la ecuación de movimiento (6.5) \(\partial_\mu F^{\mu\nu} = 0\) en el gauge de Coulomb (\(\nabla \cdot \mathbf{A} = 0\), \(A_0 = 0\)). El objetivo es mostrar que "cada componente de \(\mathbf{A}\) satisface la ecuación de onda \(\Box A^i = 0\)" — la expresión matemática de que la luz se propaga como onda. Tomando la componente \(\nu = i\):
En el gauge de Coulomb, como \(A_0 = 0\), de la ecuación (6.3) se tiene \(E^i = -\dot{A}^i\). Como confirmamos en la ecuación (6.4), \(F^{0i} = -E^i\), así que \(F^{0i} = -(-\dot{A}^i) = \dot{A}^i\).
🔵 Kai: Es decir, \(\partial_0 F^{0i} = \ddot{A}^i\).
🟡 Lina: Así es. Ahora calculemos \(\partial_j F^{ji}\). \(F^{ji} = \eta^{j\alpha}\eta^{i\beta}F_{\alpha\beta}\), pero con la métrica diagonal, \(\eta^{j\alpha}\) es distinto de cero solo cuando \(\alpha = j\), e igualmente \(\eta^{i\beta}\) solo cuando \(\beta = i\). Así que en la suma sobre \(\alpha\), \(\beta\) solo sobrevive el término con \(\alpha = j\), \(\beta = i\): \(F^{ji} = \eta^{j\alpha}\eta^{i\beta}F_{\alpha\beta}\big|_{\alpha=j,\,\beta=i} = \eta^{jj}\eta^{ii}F_{ji}\) (\(j\), \(i\) son índices libres fijos y no se suman. Con la métrica diagonal, los términos con \(\alpha \neq j\) o \(\beta \neq i\) son cero) \(= (-1)(-1)F_{ji} = F_{ji} = \partial_j A_i - \partial_i A_j\). Aquí, como \(\partial^j = \eta^{jk}\partial_k = -\partial_j\) y \(A^i = -A_i\), entonces \(\partial^j A^i = (-\partial_j)(-A_i) = \partial_j A_i\). Por lo tanto, escrito con índices arriba también tenemos \(F^{ji} = \partial^j A^i - \partial^i A^j\) con el mismo valor. Usando esto:
Recordemos la operación de subir índices. Como aprendimos en Cap. 2, con la métrica QFT \(\eta^{jk} = -\delta^{jk}\) (componentes espaciales), entonces \(\partial^j = \eta^{jk}\partial_k = -\partial_j\). Por lo tanto \(\partial_j \partial^j\) (sumando sobre \(j\)) \(= \sum_{j=1}^3 \partial_j \partial^j = \sum_{j=1}^3 \partial_j(-\partial_j) = -(\partial_1^2 + \partial_2^2 + \partial_3^2) = -\nabla^2\).
🔵 Kai: El signo menos de la métrica hace que \(\partial_j \partial^j = -\nabla^2\).
🟡 Lina: Así es. El segundo término es \(-\partial^i(\partial_j A^j)\), pero aquí organicemos la relación entre la divergencia física \(\nabla \cdot \mathbf{A}\) y la contracción de índices \(\partial_j A^j\). La divergencia física del potencial vectorial es \(\nabla \cdot \mathbf{A} = \sum_j \frac{\partial A^j}{\partial x^j} = \sum_j \partial_j A^j\) (\(A^j\) son componentes contravariantes). La condición del gauge de Coulomb \(\nabla \cdot \mathbf{A} = 0\) significa directamente \(\partial_j A^j = 0\). Por lo tanto el segundo término \(-\partial^i(\partial_j A^j) = 0\) se anula, y queda \(\partial_j F^{ji} = -\nabla^2 A^i\).
Combinando ambos: \(\ddot{A}^i - \nabla^2 A^i = 0\), es decir:
Cada componente satisface la ecuación de onda. Expandamos la solución en ondas planas.
donde \(\omega_{\mathbf{k}} = |\mathbf{k}|\) (como el fotón tiene masa cero, \(\omega = |\mathbf{k}|c\), y en unidades naturales \(c = 1\): \(\omega = |\mathbf{k}|\)), \(kx = \omega_{\mathbf{k}} t - \mathbf{k} \cdot \mathbf{x}\).
\(\boldsymbol{\epsilon}(\mathbf{k}, \lambda)\) son los vectores de polarización (polarization vectors), con \(\lambda = 1, 2\).
🔵 Kai: ¿Qué son los vectores de polarización?
🟡 Lina: Son vectores que representan la dirección de oscilación de la luz. La condición del gauge de Coulomb \(\nabla \cdot \mathbf{A} = 0\) escrita en el espacio de Fourier es:
Es decir, los vectores de polarización deben ser perpendiculares al vector de onda \(\mathbf{k}\) (dirección de propagación). En 3 dimensiones, el plano perpendicular a \(\mathbf{k}\) es bidimensional, así que se pueden tomar \(\lambda = 1, 2\) vectores de polarización independientes.
⚪ Mei: Ya veo, como el plano perpendicular es bidimensional, hay 2 vectores base. Eso corresponde al número de polarizaciones físicas.
🟡 Lina: Así es. Por ejemplo, si \(\mathbf{k}\) apunta en la dirección \(z\):
Esta es la base de polarización lineal. Si quieres la base de polarización circular:
Estos corresponden a estados de helicidad \(\pm 1\).
🔵 Kai: ¿Qué es la "helicidad"?
🟡 Lina: Es una cantidad que indica si el espín (algo así como la rotación propia) gira a la derecha o a la izquierda tomando como eje la dirección de propagación de la partícula. Más precisamente, es la componente del momento angular de espín en la dirección de propagación. El fotón es una partícula de espín 1, pero como tiene masa cero, la helicidad solo puede tomar los valores \(+1\) (polarización circular derecha) y \(-1\) (polarización circular izquierda). El valor \(0\) (polarización longitudinal) no existe para partículas de masa cero.
🔵 Kai: ¿Por qué no puede tomar el valor \(0\) si la masa es cero? Si el espín es 1, deberían haber 3 valores: \(-1, 0, +1\).
🟡 Lina: Buena pregunta. Para una partícula con masa, efectivamente hay 3. Pero una partícula de masa cero se mueve a la velocidad de la luz, así que no existe un "sistema de reposo". Sin sistema de reposo, solo puede definirse físicamente la rotación en el plano perpendicular a la dirección de propagación (polarización transversal). Intuitivamente, como no puedes "adelantar y mirar de frente" a una partícula que viaja a la velocidad de la luz, no hay forma de distinguir físicamente la vibración en la dirección de propagación (polarización longitudinal). Y matemáticamente, el estado correspondiente a helicidad \(0\) puede eliminarse mediante una transformación de gauge — es decir, es parte de la redundancia de la simetría de gauge. Esta es la consecuencia de la simetría de gauge.
⚪ Mei: "No puedes adelantarla, así que no puedes distinguir la vibración longitudinal" — la intuición física y la matemática de la simetría de gauge están conectadas.
Relaciones de conmutación canónicas¶
🟡 Lina: Ahora el paso de la cuantización. Como vimos en la ecuación (6.16), el momento conjugado de \(A_i\) es \(\pi^i = -F^{0i} = E^i\). En el gauge de Coulomb, como \(A_0 = 0\), la ecuación (6.3) \(\mathbf{E} = -\nabla A_0 - \dot{\mathbf{A}}\) se simplifica a \(\mathbf{E} = -\dot{\mathbf{A}}\). Es decir, en el gauge de Coulomb \(E^i = -\dot{A}^i\), y combinando con la ecuación (6.16) \(\pi^i = E^i\), tenemos \(\pi^i = -\dot{A}^i\). (Organicemos la subida y bajada de índices. En la ecuación (6.16), \(\pi^i = E^i\) (índice arriba). Para bajar el índice espacial usamos \(\eta_{ji} = -\delta_{ji}\): \(\pi_j = \eta_{ji}\pi^i = -\pi^j = -E^j\). Igualmente \(A_i = \eta_{ij}A^j = -A^j\) así que \(\dot{A}_i = -\dot{A}^i\). En el gauge de Coulomb, como \(E^i = -\dot{A}^i\), se tiene \(\pi^i = E^i = -\dot{A}^i = \dot{A}_i\), lo cual es consistente. En la relación de conmutación (6.24) usaremos la forma con índices abajo \([A_i, \pi_j]\) porque la correspondencia con el operador de proyección \(\delta_{ij}^\perp\) se ve más clara.)
Impongamos las relaciones de conmutación canónicas. Sin embargo, aquí se necesita cuidado. La expansión (6.20) de \(\mathbf{A}\) está escrita con componentes contravariantes \(A^i\), pero en el formalismo canónico es estándar usar las componentes covariantes \(A_i = -A^i\) (como anticipamos al principio). Si simplemente escribimos \([A_i(\mathbf{x}, t),\, \pi_j(\mathbf{y}, t)] = i\delta_{ij}\,\delta^3(\mathbf{x} - \mathbf{y})\), el lado derecho incluye todas las componentes de \(A_i\) (longitudinales y transversales). Pero en el gauge de Coulomb, como \(\nabla \cdot \mathbf{A} = 0\), \(A_i\) no tiene componente longitudinal. Escribir una relación de conmutación para una componente que no existe es contradictorio. Por eso, en el lado derecho de la relación de conmutación también hay que incluir una proyección que seleccione "solo la componente transversal":
donde
🔵 Kai: En vez del usual \(\delta_{ij}\,\delta^3(\mathbf{x}-\mathbf{y})\), se resta \(k_i k_j/|\mathbf{k}|^2\).
🟡 Lina: Así es. \(\delta_{ij} - k_i k_j/|\mathbf{k}|^2\) es el operador de proyección que "elimina la componente en la dirección \(\mathbf{k}\)". Concretamente, si multiplicas un vector arbitrario \(v_j\) por esto, obtienes \(v_i - k_i(\mathbf{k}\cdot\mathbf{v})/|\mathbf{k}|^2\), donde la componente en la dirección de \(\mathbf{k}\) se resta limpiamente. Esto excluye la componente longitudinal de las relaciones de conmutación para ser consistente con la restricción \(\nabla \cdot \mathbf{A} = 0\) (en Fourier: \(\mathbf{k} \cdot \tilde{\mathbf{A}} = 0\)).
Traducido al lenguaje de operadores de creación y aniquilación:
⚪ Mei: La misma forma de relaciones de conmutación que para el campo escalar. Solo que se añade el índice de polarización \(\lambda\). Si tiene la misma estructura que el capítulo anterior, \(a^\dagger(\mathbf{k}, \lambda)\) es el operador que "crea un fotón con momento \(\mathbf{k}\) y polarización \(\lambda\)".
🟡 Lina: Así es. El Hamiltoniano (operador de energía) también se puede calcular:
(la energía del punto cero se elimina con el ordenamiento normal). Esto expresa que "cada modo \((\mathbf{k}, \lambda)\) del fotón tiene energía \(\omega_{\mathbf{k}} = |\mathbf{k}|\)".
🔵 Kai: ¡La relación de Planck \(E = \hbar\omega\) sale naturalmente! (En unidades naturales con \(\hbar = 1\), \(E = \omega\)). Es decir, la cuantización que Planck introdujo como "hipótesis" en 1900 sale automáticamente al cuantizar el campo. Pero espera — dijiste "se elimina con el ordenamiento normal" como si nada, pero cada modo tiene una energía del punto cero de \(\frac{1}{2}\omega\), y hay infinitos modos, así que el total es infinito. Parece que estamos descartando un infinito…
⚪ Mei: Sí, en Cap. 4 con el campo escalar también surgió el mismo problema.
🟡 Lina: Buena pregunta. En realidad el problema de la energía del punto cero es un tema profundo, que también mencionamos en Cap. 4 con el campo escalar. El ordenamiento normal es una operación de "desplazar la referencia de energía", y se justifica mientras solo las diferencias relativas de energía tengan significado físico. Sin embargo, cuando se considera la gravedad, se conecta con el problema de la constante cosmológica, que es un problema no resuelto. Aquí lo aceptaremos como "una prescripción para definir la referencia de energía del campo libre".
🔵 Kai: Ya veo… Es decir, solo "la diferencia de energía" es física. Pero espera. La gravedad responde al valor absoluto de la energía, ¿verdad? Entonces, ¿el infinito que "descartamos" con el ordenamiento normal reaparece en cuanto consideramos la gravedad?
🟡 Lina: Exactamente. Esa es la esencia del problema de la constante cosmológica. Hay una discrepancia de \(10^{120}\) veces entre la energía del vacío de la teoría cuántica de campos y el valor observado cosmológicamente — es uno de los mayores problemas no resueltos de la física moderna. Pero ahora concentrémonos en la cuantización del campo libre.
🔵 Kai: Entendido. Lo dejo en un rincón de mi mente como problema no resuelto.
🟡 Lina: Así es. Ahora, confirmemos algo importante. El cuanto de la luz — el fotón — ha nacido de la cuantización del campo.
✅ Verificación de comprensión: En la cuantización del campo electromagnético en el gauge de Coulomb, ¿qué representa físicamente el estado creado por el operador de creación \(a^\dagger(\mathbf{k}, \lambda)\)?
Respuesta
Representa el estado en el que se ha añadido un fotón con momento \(\mathbf{k}\) y polarización \(\lambda\) (\(\lambda = 1\) o \(2\)) al vacío. Del Hamiltoniano (6.28), la energía de este fotón es \(\omega_{\mathbf{k}} = |\mathbf{k}|\), lo cual corresponde a la relación de Planck \(E = \hbar\omega\) (en unidades naturales, \(E = \omega\)).
Fig. 6.3: Modos de polarización del fotón. Por la condición de onda transversal \(\mathbf{k} \cdot \boldsymbol{\epsilon} = 0\), las polarizaciones físicas son solo las 2 perpendiculares a la dirección de propagación (\(\lambda = 1, 2\)). En el gauge de Lorenz que veremos más adelante (6.6「Cuantización en el gauge de Lorenz — Covariante pero con fantasmas」) se introducen formalmente la polarización longitudinal y la polarización escalar, pero estas son no físicas y finalmente se eliminan.
En Fig. 6.3「Modos de polarización del fotón」 he resumido los modos de polarización del fotón.
✅ Verificación de comprensión: Explica por qué las polarizaciones físicas del fotón son 2 en el gauge de Coulomb, a partir de la condición \(\mathbf{k} \cdot \boldsymbol{\epsilon} = 0\).
Respuesta
\(\boldsymbol{\epsilon}\) es un vector tridimensional, pero la condición \(\mathbf{k} \cdot \boldsymbol{\epsilon} = 0\) prohíbe la componente en la dirección de \(\mathbf{k}\). El plano perpendicular a \(\mathbf{k}\) es bidimensional, por lo que hay 2 vectores de polarización independientes. Estos corresponden a las 2 polarizaciones físicas del fotón.
📝 Ejercicios:
- Realizabilidad del gauge de Coulomb → Problema M-2. Conteo de grados de libertad en el gauge de Coulomb
6.5 Problemas del gauge de Coulomb¶
🟡 Lina: El gauge de Coulomb tiene la gran ventaja de que los grados de libertad físicos se ven explícitamente. Pero también tiene un defecto grave.
🔵 Kai: ¿Cuál?
🟡 Lina: La covariancia de Lorentz no es manifiesta. La condición \(\nabla \cdot \mathbf{A} = 0\) contiene solo derivadas espaciales y no trata tiempo y espacio en pie de igualdad. Es decir, aunque \(\nabla \cdot \mathbf{A} = 0\) se cumpla en un sistema de referencia inercial, en general esta condición se rompe al hacer un boost a otro sistema inercial.
⚪ Mei: Esto significa que la consistencia con la relatividad especial es difícil de ver. Es complicado verificar durante los cálculos que la invariancia de Lorentz se mantiene.
🟡 Lina: Exacto. En los cálculos prácticos de amplitudes de dispersión, el formalismo covariante de Lorentz es muchísimo más conveniente. Ahí es donde aparece el gauge de Lorenz.
Nota terminológica: El "Lorenz" del gauge de Lorenz se refiere a Ludvig Lorenz, un físico danés, y es diferente del Hendrik Lorentz de las transformaciones de Lorentz. Es confuso, pero históricamente es así.
✅ Verificación de comprensión: ¿Qué significa que la condición del gauge de Coulomb \(\nabla \cdot \mathbf{A} = 0\) no sea covariante de Lorentz?
Respuesta
\(\nabla \cdot \mathbf{A} = 0\) contiene solo derivadas espaciales y no trata tiempo y espacio en pie de igualdad. Por lo tanto, aunque esta condición se cumpla en un sistema de referencia inercial, en general se rompe al hacer un boost de Lorentz a otro sistema inercial. Tiene la desventaja de que es difícil verificar durante los cálculos que la invariancia de Lorentz se mantiene.
6.6 Cuantización en el gauge de Lorenz — Covariante pero con fantasmas¶
Condición del gauge de Lorenz¶
🟡 Lina: La condición del gauge de Lorenz es:
Como está escrita en forma cuadrivectorial, es covariante de Lorentz. Si esta condición se cumple en un sistema inercial, se cumple en todos los sistemas inerciales.
🔵 Kai: Comparada con \(\nabla \cdot \mathbf{A} = 0\) del gauge de Coulomb, aquí también se incluye la componente temporal \(\partial_0 A^0\).
🟡 Lina: Así es. \(\partial_\mu A^\mu = \partial_0 A^0 + \nabla \cdot \mathbf{A} = 0\), tratando tiempo y espacio en pie de igualdad.
Bajo el gauge de Lorenz, la ecuación de movimiento (6.5) toma una forma simple. Escribiendo la ecuación (6.5) en términos de \(A_\nu\):
Usando la condición del gauge de Lorenz \(\partial_\mu A^\mu = 0\), el segundo término se anula:
¡Cada componente satisface independientemente la ecuación de onda! Esto es muy simple.
⚪ Mei: En el gauge de Coulomb la manipulación de los índices arriba/abajo y el Laplaciano era complicada, pero en el gauge de Lorenz se obtiene directamente \(\Box A^\nu = 0\) — eso sí que es conveniente.
Adición del término de fijación de gauge¶
🟡 Lina: Sin embargo, para realizar la cuantización canónica en el gauge de Lorenz se necesita un artificio. Con el Lagrangiano original (6.1) tal cual, el problema \(\pi^0 = 0\) persiste. Por eso, añadimos un término de fijación de gauge (gauge-fixing term) al Lagrangiano.
La idea es así. En vez de imponer "duramente" la condición del gauge de Lorenz \(\partial_\mu A^\mu = 0\), añadimos un término que da una "penalización de energía" a las configuraciones con \(\partial_\mu A^\mu \neq 0\). Igual que un potencial de resorte \(\frac{1}{2}kx^2\) penaliza el desplazamiento desde \(x = 0\), \((\partial_\mu A^\mu)^2\) penaliza la desviación de la condición de Lorenz:
donde \(\xi\) es un parámetro arbitrario (el parámetro de gauge) que controla la "intensidad" de la penalización. La elección \(\xi = 1\) se llama gauge de Feynman.
🔵 Kai: ¿Al añadir el término de fijación de gauge, no se rompe la simetría de gauge?
🟡 Lina: Pregunta aguda. Efectivamente, \((\partial_\mu A^\mu)^2\) no es invariante bajo la transformación de gauge (6.7). Por lo tanto la simetría de gauge se rompe explícitamente. Sin embargo, se puede demostrar que los observables físicos finales (secciones eficaces de dispersión, etc.) no dependen de \(\xi\). Este es un resultado muy profundo: el "eco residual" de la simetría de gauge protege los resultados físicos.
⚪ Mei: Es decir, durante el cálculo se fija el gauge rompiendo la simetría, pero el resultado final no depende de la elección del gauge.
✅ Verificación de comprensión: ¿Cuál es el propósito de añadir el término de fijación de gauge \(-\frac{1}{2\xi}(\partial_\mu A^\mu)^2\) al Lagrangiano? ¿Y por qué no hay problema a pesar de romper la simetría de gauge?
Respuesta
El propósito es resolver el problema de que con el Lagrangiano original \(\pi^0 = 0\) impide la cuantización canónica. El término de fijación de gauge añade un término que contiene \(\dot{A}_0\), haciendo \(\pi^0 \neq 0\). Aunque la simetría de gauge se rompe explícitamente, se puede demostrar que los observables físicos finales (amplitudes de dispersión, etc.) no dependen del parámetro de gauge \(\xi\), por lo que no afecta a las conclusiones físicas.
🟡 Lina: Exacto. Veamos qué cambia al añadir el término de fijación de gauge. Calculando el momento conjugado de \(A^0\) (como vimos en la ecuación (6.17), la contribución de \(-\frac{1}{4}F_{\mu\nu}F^{\mu\nu}\) es cero, así que solo contribuye el término de fijación de gauge):
🔵 Kai: ¡Ya no es cero! El término de fijación de gauge ha "resucitado" \(\dot{A}_0\).
🟡 Lina: Verifiquemos el cálculo. \(\partial_\mu A^\mu = \partial_0 A^0 + \partial_1 A^1 + \partial_2 A^2 + \partial_3 A^3\), así que contiene \(\dot{A}_0 \equiv \partial_0 A_0 = \partial A_0/\partial t\) (la subida y bajada de índices se hace con \(A^\mu = \eta^{\mu\nu}A_\nu\) (sumando sobre \(\nu\)), pero con la métrica diagonal \(A^0 = \eta^{0\nu}A_\nu = \eta^{00}A_0 = (+1)A_0 = A_0\). La componente temporal no cambia de signo entre arriba y abajo. Por lo tanto \(\partial_0 A_0 = \partial_0 A^0\). Sin embargo, las componentes espaciales sí cambian: \(A^i = \eta^{i\nu}A_\nu\) (sumando sobre \(\nu\)) \(= \eta^{ii}A_i\) (con la métrica diagonal solo el término \(\nu = i\) es distinto de cero) \(= (-1)A_i = -A_i\), así que cuidado con el signo). Derivando el término de fijación de gauge \(-\frac{1}{2\xi}(\partial_\mu A^\mu)^2\) con respecto a \(\partial_0 A_0\), por la regla de la cadena (derivación de funciones compuestas):
(Aquí, de \(\partial_\mu A^\mu = \partial_0 A^0 + \partial_1 A^1 + \partial_2 A^2 + \partial_3 A^3\), lo que contiene \(\partial_0 A_0\) es solo el primer término \(\partial_0 A^0 = \partial_0 A_0\) (porque \(A^0 = A_0\)). El resto \(\partial_i A^i\) son derivadas espaciales e independientes de \(\partial_0 A_0\). Por lo tanto \(\partial(\partial_\mu A^\mu)/\partial(\partial_0 A_0) = 1\).)
Gracias a que el término de fijación de gauge añade al Lagrangiano un término que contiene \(\dot{A}_0\), \(\pi^0\) ya no es idénticamente cero. Resolviendo en la otra dirección: \(\dot{A}_0 = -\xi\pi^0 - \partial_i A^i\), así que \(A_0\) y \(\pi^0\) pueden tratarse como un par de variables canónicas independientes. Ahora podemos escribir relaciones de conmutación canónicas para las 4 componentes:
⚪ Mei: Con esto encaja en el mismo "molde" que el campo escalar. Las 4 componentes se cuantizan en pie de igualdad.
Las 4 polarizaciones y la expansión de Fourier¶
🟡 Lina: Derivemos la ecuación de movimiento en el gauge de Feynman (\(\xi = 1\)). Aplicamos la ecuación de Euler-Lagrange al Lagrangiano de la ecuación (6.31) \(\mathcal{L}_{\text{gf}} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu} - \frac{1}{2}(\partial_\mu A^\mu)^2\). Como \(\mathcal{L}_{\text{gf}}\) no contiene \(A_\sigma\) directamente, el segundo término de la ecuación de Euler-Lagrange \(\partial_\rho \frac{\partial \mathcal{L}}{\partial(\partial_\rho A_\sigma)} - \frac{\partial \mathcal{L}}{\partial A_\sigma} = 0\) es cero. Calculemos el primer término dividido en dos partes.
Primero, la contribución de \(-\frac{1}{4}F_{\mu\nu}F^{\mu\nu}\). Igual que en la derivación de la ecuación (6.5): \(\frac{\partial(-\frac{1}{4}F_{\mu\nu}F^{\mu\nu})}{\partial(\partial_\rho A_\sigma)} = -F^{\rho\sigma}\), y aplicando \(\partial_\rho\) obtenemos \(-\partial_\rho F^{\rho\sigma}\). Sustituyendo \(F^{\rho\sigma} = \partial^\rho A^\sigma - \partial^\sigma A^\rho\): \(\partial_\rho F^{\rho\sigma} = \partial_\rho(\partial^\rho A^\sigma - \partial^\sigma A^\rho) = \Box A^\sigma - \partial^\sigma(\partial_\rho A^\rho)\), así que resulta \(-(\Box A^\sigma - \partial^\sigma(\partial_\mu A^\mu))\).
🔵 Kai: Ahora viene la parte del término de fijación de gauge.
🟡 Lina: Así es. Calculemos la contribución de \(-\frac{1}{2}(\partial_\mu A^\mu)^2\). Escribiendo \(\partial_\mu A^\mu = \eta^{\alpha\beta}\partial_\alpha A_\beta\), como \(\frac{\partial}{\partial(\partial_\rho A_\sigma)}(\eta^{\alpha\beta}\partial_\alpha A_\beta) = \eta^{\alpha\beta}\delta^\rho_\alpha\delta^\sigma_\beta = \eta^{\rho\sigma}\):
Aplicando \(\partial_\rho\): \(-\partial^\sigma(\partial_\mu A^\mu)\).
🔵 Kai: Ya tenemos ambas contribuciones. ¿Qué pasa al sumarlas?
🟡 Lina: Sumémoslas. Cambiando el índice \(\sigma\) por \(\nu\) y combinando:
Los términos \(\partial^\nu(\partial_\mu A^\mu)\) se cancelan:
🔵 Kai: ¡Oh, se cancelan limpiamente! En el gauge de Feynman los dos términos se anulan exactamente.
🟡 Lina: Así es. Cada componente satisface independientemente la ecuación de Klein-Gordon sin masa, así que la expansión es:
donde aparecen 4 vectores de polarización \(\epsilon^\mu(\mathbf{k}, \lambda)\) con \(\lambda = 0, 1, 2, 3\).
🔵 Kai: ¿4? Pero antes dijiste que los grados de libertad físicos son 2…
🟡 Lina: Buena observación. En el gauge de Lorenz, para mantener la covariancia de Lorentz, cuantizamos las 4 componentes de \(A_\mu\) en pie de igualdad. Como \(A_\mu\) es un vector de 4 componentes, la "dirección de oscilación" de cada modo de Fourier también debe especificarse en el espacio de 4 dimensiones — igual que una onda en 3 dimensiones necesita expandir la dirección de oscilación en 3 vectores base, en 4 dimensiones se necesitan 4 bases (vectores de polarización). La condición del gauge de Lorenz \(\partial_\mu A^\mu = 0\) no se impone como identidad de operadores, sino como condición sobre los estados físicos (condición de Gupta-Bleuler) más adelante. Por eso, en la etapa de la expansión se necesitan las 4 polarizaciones, y las componentes no físicas se "eliminan" después con una prescripción.
Veamos las 4 polarizaciones concretamente. Para \(\mathbf{k} = (0, 0, k)\) (dirección \(z\)):
Tabla 6.2: Clasificación de los 4 vectores de polarización del fotón (para \(\mathbf{k} = (0,0,k)\))
| \(\lambda\) | Nombre | \(\epsilon^\mu(\mathbf{k}, \lambda)\) | Carácter |
|---|---|---|---|
| 1 | Transversal (transverse) | \((0, 1, 0, 0)\) | Física |
| 2 | Transversal (transverse) | \((0, 0, 1, 0)\) | Física |
| 3 | Longitudinal (longitudinal) | \((0, 0, 0, 1)\) | No física |
| 0 | Escalar (scalar) | \((1, 0, 0, 0)\) | No física |
⚪ Mei: \(\lambda = 1, 2\) son las polarizaciones físicas de la luz, y \(\lambda = 3\) (dirección de propagación) y \(\lambda = 0\) (dirección temporal) son no físicas. Son las componentes que en el gauge de Coulomb se eliminaban desde el principio, pero aquí se mantienen todas temporalmente.
🟡 Lina: Una nota. En esta tabla he escrito la forma simplificada tomando la dirección de \(\mathbf{k}\) como eje \(z\). Las polarizaciones transversales (\(\lambda = 1, 2\)) satisfacen \(k_\mu \epsilon^\mu(\mathbf{k}, \lambda) = 0\), pero la polarización escalar (\(\lambda = 0\)) y la longitudinal (\(\lambda = 3\)) individualmente no la satisfacen (en 6.7「El método de Gupta-Bleuler — Confinando a los fantasmas」 confirmaremos concretamente que \(k_\mu \epsilon^\mu(\mathbf{k}, 0) = \omega \neq 0\), etc.). Esto no es un problema — la condición del gauge de Lorenz \(\partial_\mu A^\mu = 0\) se impone como condición de Gupta-Bleuler (6.7「El método de Gupta-Bleuler — Confinando a los fantasmas」) sobre los estados físicos, no como identidad de operadores, así que no es necesario que cada vector de polarización individual satisfaga \(k_\mu \epsilon^\mu = 0\). En formulaciones rigurosas a veces se redefinen los vectores de polarización como combinaciones lineales dependientes de \(k^\mu\), pero la estructura esencial de la condición de Gupta-Bleuler se entiende igualmente con esta base.
Problema de la norma negativa — Aparición de fantasmas¶
🟡 Lina: Aquí aparece un problema grave. Si traducimos la relación de conmutación (6.33) al lenguaje de operadores de creación y aniquilación:
Aquí \(\eta_{\lambda\lambda'}\) es una cantidad para los índices de polarización \(\lambda, \lambda' = 0, 1, 2, 3\), que numéricamente tiene el mismo patrón que la métrica del espacio-tiempo \(\eta_{\mu\nu} = \mathrm{diag}(+1,-1,-1,-1)\), pero su significado es diferente — es el patrón de signos que proviene del producto interno de Minkowski de los vectores de polarización, escrito convenientemente así. Diré primero la conclusión. \(-\eta_{\lambda\lambda'}\) es \(+1\) (normal) para \(\lambda = 1, 2, 3\) y \(-1\) (¡anómalo!) para \(\lambda = 0\). Es decir, solo la polarización escalar tiene el signo de la relación de conmutación invertido. Explicaré paso a paso por qué es así.
Primero, por qué aparece el producto interno de los vectores de polarización. Cuando sustituimos la expansión de Fourier (6.35) en la relación de conmutación canónica (6.33), aparece la relación de conmutación de \(a\) y \(a^\dagger\) junto con los coeficientes de los vectores de polarización. Recuerda el caso del campo escalar — en Cap. 4, sustituyendo \(\phi(\mathbf{x}) = \int \frac{d^3k}{(2\pi)^3}\frac{1}{\sqrt{2\omega}}(a_\mathbf{k} e^{i\mathbf{k}\cdot\mathbf{x}} + a^\dagger_\mathbf{k} e^{-i\mathbf{k}\cdot\mathbf{x}})\) en \([\phi, \pi] = i\delta^3\) derivamos \([a, a^\dagger] = \delta^3\). Ahora es la misma estructura, pero el campo tiene multiplicado un vector de polarización \(\epsilon_\mu\). Al sustituir aparecen términos como \(\epsilon_\mu(\mathbf{k},\lambda)\,\epsilon^\nu(\mathbf{k},\lambda')\,[a(\mathbf{k},\lambda), a^\dagger(\mathbf{k}',\lambda')]\) y comparando con el \(\delta_\mu^{\ \nu}\) del lado derecho se determina \([a, a^\dagger]\). En esta "comparación" es necesario contraer el índice \(\mu\) de los vectores de polarización, y ahí aparece naturalmente el producto interno de Minkowski \(\eta_{\mu\nu}\,\epsilon^\mu(\mathbf{k},\lambda)\,\epsilon^\nu(\mathbf{k},\lambda')\).
🔵 Kai: Ya veo, como los vectores de polarización multiplican al campo, al "leer" la relación de conmutación aparece el producto interno.
🟡 Lina: Calculemos concretamente con los vectores de polarización de la tabla. Para el caso \(\lambda = \lambda'\): si \(\lambda = 0\) entonces \(\epsilon^\mu = (1,0,0,0)\) y \(\eta_{\mu\nu}\epsilon^\mu\epsilon^\nu = \eta_{00}(1)(1) = (+1)(1)(1) = +1\). Si \(\lambda = 1\) entonces \(\epsilon^\mu = (0,1,0,0)\) y \(\eta_{\mu\nu}\epsilon^\mu\epsilon^\nu = \eta_{11}(1)(1) = (-1)(1)(1) = -1\). Igualmente para \(\lambda = 2, 3\) también \(-1\). Es decir, el producto interno de los vectores de polarización tiene el patrón de signos \(\mathrm{diag}(+1,-1,-1,-1)\).
Este patrón de signos es \(\mathrm{diag}(+1,-1,-1,-1)\), que casualmente tiene la misma forma que la métrica del espacio-tiempo \(\eta_{\mu\nu}\). Esto es porque elegimos los vectores de polarización en las direcciones de los ejes coordenados.
Nota: En la ecuación (6.36), convenientemente escribimos este patrón de signos como \(\eta_{\lambda\lambda'}\), pero es una cantidad para los índices de polarización \(\lambda = 0,1,2,3\), diferente de la métrica para los índices espacio-temporales \(\mu, \nu\). El símbolo es el mismo pero el significado es diferente — distínguelos por el contexto.
Este producto interno aparece en el lado derecho de la relación de conmutación como \(-\eta_{\lambda\lambda'}\). Por lo tanto, \(-\eta_{\lambda\lambda'}\) es \(-(-1) = +1\) para \(\lambda = 1, 2, 3\) y \(-(+1) = -1\) para \(\lambda = 0\).
🔵 Kai: ¿Por qué el signo de la métrica entra en la relación de conmutación?
🟡 Lina: Pregunta central. En una palabra, porque el momento conjugado de \(A_0\) tiene un signo menos. Expliquémoslo paso a paso.
Recuerda el campo escalar. \(\pi = \dot{\phi}\), y de la relación de conmutación \([\phi, \pi] = i\delta^3\) sale \([a, a^\dagger] = +\delta^3\). Como \(\pi\) y \(\dot{\phi}\) tienen el mismo signo, sale positivo.
Pero en el caso de \(A_0\), como vimos en la ecuación (6.32), \(\pi^0 = -\frac{1}{\xi}\partial_\mu A^\mu\). En el gauge de Feynman (\(\xi = 1\)): \(\pi^0 = -\partial_\mu A^\mu\). Este signo menos es decisivo. La relación de conmutación canónica \([A_0(\mathbf{x}), \pi^0(\mathbf{y})] = i\delta^3(\mathbf{x}-\mathbf{y})\) no cambia, pero debido al signo menos en \(\pi^0\), al sustituir la expansión de Fourier y traducir a la relación de conmutación de \(a\) y \(a^\dagger\), aparece un signo menos en el lado derecho.
⚪ Mei: Es decir, la causa raíz es que la diferencia de signos de la métrica de Minkowski \(\eta_{00} = +1\) y \(\eta_{ii} = -1\) da un "sabor" diferente a la estructura dinámica de \(A_0\) y \(A_i\).
🟡 Lina: Y la causa fundamental de este signo menos es la métrica de Minkowski. La diferencia entre \(\eta_{00} = +1\) y \(\eta_{ii} = -1\) hace que la estructura de los momentos conjugados de \(A_0\) y \(A_i\) sea diferente, y finalmente solo la relación de conmutación de \(\lambda = 0\) tiene el signo invertido. Como resultado:
Mientras que para las componentes espaciales \(\lambda = 1, 2, 3\), el signo menos de la métrica y el de la definición del momento conjugado se cancelan, obteniéndose el signo positivo usual.
Como resultado, \(-\eta_{\lambda\lambda'}\) es \(+1\) para \(\lambda = 1, 2, 3\) y \(-1\) para \(\lambda = 0\). Para las polarizaciones transversales (\(\lambda = 1, 2\)) y la longitudinal (\(\lambda = 3\)):
Pero para la polarización escalar (\(\lambda = 0\)):
🔵 Kai: ¡¿Signo menos?! ¿Eso no es problemático?
🟡 Lina: Sí lo es. Calcula la norma del estado de una partícula. Sea \(|1_{\mathbf{k},0}\rangle = a^\dagger(\mathbf{k}, 0)|0\rangle\):
La norma es negativa.
⚪ Mei: Norma negativa significa que la probabilidad puede ser negativa… Eso es físicamente imposible.
🟡 Lina: Así es. Estos estados de norma negativa a veces se llaman "fantasmas" (ghosts). Al cuantizar las 4 componentes para mantener la covariancia de Lorentz, como precio se cuelan "fantasmas" no físicos.
🔵 Kai: ¿Qué hacemos?
🟡 Lina: Aquí aparece el método de Gupta-Bleuler.
6.7 El método de Gupta-Bleuler — Confinando a los fantasmas¶
🟡 Lina: La idea es así. "No todos los estados son físicos. Imponemos una condición adicional sobre los estados físicos y excluimos los estados de norma negativa del espacio de estados físico".
Concretamente, la condición del gauge de Lorenz \(\partial_\mu A^\mu = 0\) se impone no como ecuación de operadores, sino como condición sobre los estados físicos.
donde \(A^{\mu(+)}\) es la parte de frecuencia positiva de \(A^\mu\). Volviendo a mirar la expansión en modos (6.35), \(A_\mu\) consiste en dos tipos de términos: los que contienen \(a(\mathbf{k},\lambda)\,e^{-ikx}\) y los que contienen \(a^\dagger(\mathbf{k},\lambda)\,e^{+ikx}\). Al primero (la parte con el operador de aniquilación \(a\)) lo escribimos \(A^{\mu(+)}\), y al segundo (la parte con el operador de creación \(a^\dagger\)) lo escribimos \(A^{\mu(-)}\). En la condición (6.40) usamos solo la parte de frecuencia positiva \(A^{\mu(+)}\).
🔵 Kai: ¿Por qué \(e^{-i\omega t}\) es la de "frecuencia positiva"? \(e^{+i\omega t}\) parece más positiva…
🟡 Lina: Como aprendimos en Mecánica Cuántica Cap. 7, el factor temporal de un estado estacionario con energía \(E_n\) es \(e^{-iE_n t/\hbar}\). En unidades naturales \(\hbar = 1\): \(e^{-iEt}\). Así que \(e^{-i\omega t}\) (\(\omega > 0\)) corresponde a "un modo con energía positiva \(\omega\)". A esto lo llamamos "parte de frecuencia positiva". Y mirando la expansión en modos (6.35), el término \(e^{-ikx} = e^{-i\omega t + i\mathbf{k}\cdot\mathbf{x}}\) lleva multiplicado el operador de aniquilación \(a\). Por eso tiene la propiedad \(A^{\mu(+)}|0\rangle = 0\) (aniquila el vacío).
🔵 Kai: ¿Por qué "solo la parte de frecuencia positiva"? ¿No se puede imponer \(\partial_\mu A^\mu = 0\) sobre el total?
🟡 Lina: Si impusiéramos \(\partial_\mu A^\mu = 0\) como identidad de operadores, entraría en contradicción con la relación de conmutación (6.33). La razón resumida es: como \(\pi^0 = -\partial_\mu A^\mu\) (ecuación (6.32)), \(\partial_\mu A^\mu = 0\) significaría \(\pi^0 = 0\). Pero la relación de conmutación (6.33) exige \([A_0, \pi^0] = i\delta^3 \neq 0\) — \(\pi^0 = 0\) y \([A_0, \pi^0] \neq 0\) son incompatibles.
Por eso, como compromiso, se impone no como "identidad de operadores" sino como "condición sobre los estados físicos". Usando solo la parte de frecuencia positiva \(A^{\mu(+)}\), gracias a la propiedad \(A^{\mu(+)}|0\rangle = 0\) (el operador de aniquilación aniquila el vacío), se evita la contradicción. Y para los valores esperados físicos se cumple:
Es decir, "entre estados físicos la condición del gauge de Lorenz se cumple en sentido débil".
⚪ Mei: ¿Cómo queda la condición (6.40) escrita en modos de Fourier?
🟡 Lina: La parte de frecuencia positiva de la ecuación (6.35), \(A^{\mu(+)}\), es el término que contiene \(e^{-ikx}\): \(\int \frac{d^3k}{(2\pi)^3} \frac{1}{\sqrt{2\omega_{\mathbf{k}}}} \sum_\lambda \epsilon^\mu(\mathbf{k},\lambda)\, a(\mathbf{k},\lambda)\, e^{-ikx}\). Aplicando \(\partial_\mu\), de \(e^{-ikx}\) sale \(-ik_\mu\), así que \(\partial_\mu A^{\mu(+)} \propto \sum_\lambda k_\mu \epsilon^\mu(\mathbf{k}, \lambda)\, a(\mathbf{k}, \lambda)\, e^{-ikx}\). Imponiendo la condición (6.40) para cada modo de Fourier, se necesita \(\sum_\lambda k_\mu \epsilon^\mu(\mathbf{k}, \lambda)\, a(\mathbf{k}, \lambda)\, |\psi_{\text{phys}}\rangle = 0\) para cada \(\mathbf{k}\). Para las polarizaciones transversales (\(\lambda = 1, 2\)) se cumple \(k_\mu \epsilon^\mu(\mathbf{k}, \lambda) = 0\). Verifiquémoslo. Si \(\mathbf{k}\) está en la dirección \(z\), \(k_\mu = (\omega, 0, 0, -\omega)\) (las componentes espaciales de \(k^\mu = (\omega, 0, 0, \omega)\) multiplicadas por \(-1\)). \(\epsilon^\mu(\mathbf{k}, 1) = (0, 1, 0, 0)\) así que \(k_\mu \epsilon^\mu = \omega \cdot 0 + 0 \cdot 1 + 0 + (-\omega) \cdot 0 = 0\). Para \(\epsilon^\mu(\mathbf{k}, 2) = (0, 0, 1, 0)\) también es cero.
🔵 Kai: Las polarizaciones transversales satisfacen automáticamente la condición, así que la restricción efectiva solo se aplica a la polarización escalar y la longitudinal.
🟡 Lina: Exacto. Por lo tanto, efectivamente solo quedan los términos \(\lambda = 0, 3\):
Cuando \(\mathbf{k}\) está en la dirección \(z\), \(k^\mu = (\omega, 0, 0, \omega)\) así que bajando el índice \(k_\mu = \eta_{\mu\nu}k^\nu = (\omega, 0, 0, -\omega)\) (las componentes espaciales cambian de signo). Usando esto: \(k_\mu \epsilon^\mu(\mathbf{k}, 0) = \omega \cdot 1 + 0 + 0 + (-\omega) \cdot 0 = \omega\), \(k_\mu \epsilon^\mu(\mathbf{k}, 3) = \omega \cdot 0 + 0 + 0 + (-\omega) \cdot 1 = -\omega\). Sustituyendo en la ecuación (6.42):
Como \(\omega \neq 0\) podemos dividir, obteniendo \(a(\mathbf{k}, 0)|\psi_{\text{phys}}\rangle = a(\mathbf{k}, 3)|\psi_{\text{phys}}\rangle\). Esto significa que "la operación de aniquilar un fotón \(\lambda = 0\)" y "la operación de aniquilar un fotón \(\lambda = 3\)" dan el mismo resultado sobre los estados físicos. Intuitivamente, en los estados físicos los fotones escalares y los fotones longitudinales siempre aparecen en pares, y no se permite un estado donde exista solo uno de ellos. (Para una dirección general de \(\mathbf{k}\) también se cumple \(k_\mu \epsilon^\mu = 0\) para las polarizaciones transversales, ya que por definición son perpendiculares a \(\mathbf{k}\) y tienen componente temporal cero.)
Como consecuencia de esta condición, en los estados físicos los fotones escalares (\(\lambda = 0\)) y los fotones longitudinales (\(\lambda = 3\)) siempre aparecen en pares y se cancelan mutuamente.
🔵 Kai: "Se cancelan", ¿qué significa concretamente?
🟡 Lina: Intuitivamente es así. Los fotones escalares tienen norma negativa, y los fotones longitudinales tienen norma positiva. La condición de Gupta-Bleuler fuerza a que siempre aparezcan "en igual número". Como resultado, la norma del espacio de estados físicos recupera la positividad:
Se recupera la definición positiva.
🔵 Kai: Hmm, intuitivamente entiendo que "como son el mismo número, se cancelan"… Pero "mayor o igual a cero" significa que hay estados con norma exactamente cero, ¿no? ¿Qué significan físicamente los estados con norma cero?
🟡 Lina: Exactamente. Los estados formados solo por pares de fotones escalares y longitudinales tienen norma exactamente cero. Estos son estados "donde nada se observa" — es decir, indistinguibles del vacío. La construcción del espacio de estados físicos tiene dos etapas. Primero, restringimos al subespacio que satisface la condición de Gupta-Bleuler. Segundo, como los estados de norma cero son "indistinguibles del vacío", los consideramos "físicamente iguales" y los ignoramos. Así, solo quedan los estados de polarización transversal con norma positiva.
🔵 Kai: Ya veo… Es decir, "norma cero = si lo observas no ves nada = igual que el vacío".
⚪ Mei: Así es. Primero con la condición se seleccionan los estados físicos, y luego se ignoran los estados de norma cero como "iguales al vacío" — con estas dos etapas se evita el problema de la norma negativa. Finalmente, los fotones físicos son solo las polarizaciones transversales \(\lambda = 1, 2\).
🔵 Kai: Es decir, los fantasmas "aparecen pero no pueden subir al escenario físico" — están confinados. Pero me resulta un poco incómodo… "Existen estados no físicos en la teoría pero los ignoramos", ¿está realmente bien? ¿No pueden hacer travesuras los fantasmas durante los cálculos?
🟡 Lina: Buena preocupación. De hecho, en los cálculos de amplitudes de dispersión se puede demostrar matemáticamente que las contribuciones de \(\lambda = 0, 3\) siempre se cancelan. Lo que garantiza esto es la identidad de Ward — una relación que aprenderemos en Cap. 9. Así que más que "ignorar", es más preciso decir "la cancelación está garantizada".
En el gauge de Coulomb, como desde el principio solo cuantizamos las 2 polarizaciones transversales, el problema de la norma negativa no aparece. En el gauge de Lorenz, para mantener la covariancia de Lorentz, cuantizamos las 4 polarizaciones y después excluimos los estados no físicos con la condición de Gupta-Bleuler. En ambos enfoques la conclusión física final es la misma — el fotón tiene 2 polarizaciones transversales. En Fig. 6.4「Estructura del espacio de estados según el método de Gupta-Bleuler」 he resumido esta estructura.
Fig. 6.4: Estructura del espacio de estados según el método de Gupta-Bleuler. Del espacio de Fock total se selecciona el espacio de estados físicos que satisface la condición de Gupta-Bleuler \(\partial_\mu A^{\mu(+)}|\psi_{\rm phys}\rangle = 0\). Los fotones escalares (norma negativa) y los fotones longitudinales se cancelan, y en los estados físicos la norma recupera la definición positiva.
🔵 Kai: Es tranquilizador que los dos métodos den la misma respuesta.
🟡 Lina: Así es. Esta es la esencia de la invariancia de gauge — "la elección del gauge no afecta los resultados físicos".
✅ Verificación de comprensión: Explica en 2-3 frases la razón por la que aparecen estados de norma negativa en la cuantización en el gauge de Lorenz y cómo la condición de Gupta-Bleuler resuelve el problema.
Respuesta
Al cuantizar las 4 componentes de \(A_\mu\) para mantener la covariancia de Lorentz, debido al signo \(\eta_{00} = +1\) de la métrica de Minkowski, los estados de polarización escalar (\(\lambda = 0\)) tienen norma negativa. La condición de Gupta-Bleuler \(\partial_\mu A^{\mu(+)}|\psi_{\text{phys}}\rangle = 0\) fuerza a que en los estados físicos los fotones escalares y longitudinales se cancelen, recuperándose la norma definida positiva en el espacio de estados físicos. Como resultado, los fotones físicos son solo las 2 polarizaciones transversales.
6.8 Propagador del fotón — El parámetro de gauge \(\xi\)¶
🟡 Lina: Como será necesario en capítulos posteriores (los diagramas de Feynman de Cap. 8), derivemos el propagador del fotón. El propagador es una cantidad que representa la amplitud de probabilidad de que una partícula creada en un punto del espacio-tiempo \(x\) se propague a otro punto \(y\). Matemáticamente se define como el valor esperado en el vacío del producto ordenado en el tiempo de los operadores de campo \(\langle 0|T\{A_\mu(x)A_\nu(y)\}|0\rangle\). \(T\) es el producto ordenado en el tiempo — la operación de "poner a la izquierda lo que ocurre después temporalmente" — intuitivamente es una herramienta que selecciona automáticamente el orden causal "un fotón nace en \(x\) y se absorbe en \(y\) (o viceversa)". Lo estudiaremos formalmente en Cap. 7. Aquí solo mostraré el resultado. El propagador del fotón en el gauge de Feynman (\(\xi = 1\)) es:
Es decir, en el espacio de momentos:
Aquí \(i\varepsilon\) (\(\varepsilon > 0\) es un número positivo infinitesimal) es una prescripción para evitar el punto donde el denominador se anula (\(k^2 = 0\), es decir, donde el fotón está en la capa de masa). Físicamente cumple el papel de seleccionar la "propagación causal" — que la causa preceda al efecto. Lo estudiaremos en detalle en Cap. 7.
🔵 Kai: Se parece al propagador del campo escalar \(i/(k^2 - m^2 + i\varepsilon)\). Es la forma con \(m = 0\) multiplicada por \(\eta_{\mu\nu}\). Pero si el valor de \(\xi\) es diferente, la forma del propagador cambia — ¿cómo se garantiza que los resultados físicos sean los mismos?
🟡 Lina: Buena pregunta. Intuitivamente, se puede demostrar que los términos \(k_\mu k_\nu\) siempre se anulan en el cálculo de cantidades físicas invariantes de gauge. Para un \(\xi\) general:
Con \(\xi = 1\) (gauge de Feynman) el segundo término desaparece y queda simple, por eso en los cálculos prácticos el gauge de Feynman es el más utilizado.
⚪ Mei: Que la amplitud de dispersión física sea la misma sin importar el valor de \(\xi\) — esa es la consecuencia de la invariancia de gauge.
🟡 Lina: Así es. Lo que garantiza que el término \(k_\mu k_\nu\) se cancele es la identidad de Ward, una relación que estudiaremos en detalle en Cap. 9.
📝 Ejercicios:
- Transformada de Fourier inversa del propagador del fotón en el gauge de Feynman → Problema A-2. Lagrangiano con término de fijación de gauge y propagador del fotón
- Condición de Gupta-Bleuler y estados físicos → Problema M-3. Relación de completitud de los vectores de polarización
6.9 Por qué el fotón no tiene masa — La protección de la simetría de gauge¶
🟡 Lina: Para terminar, quiero transmitir un mensaje muy profundo. ¿Por qué el fotón tiene masa cero?
🔵 Kai: Eh… ¿experimentalmente porque la velocidad de la luz es finita, y si el fotón tuviera masa iría más lento que la luz?
🟡 Lina: Experimentalmente es así. Pero la razón teórica es más profunda. Si quisieras darle masa \(m\) al fotón, tendrías que añadir al Lagrangiano un término de masa:
La misma estructura que el término de masa del campo escalar \(\frac{1}{2}m^2\phi^2\) en Cap. 4 — un término cuadrático en el campo con coeficiente proporcional a \(m^2\). Pero mira cómo se comporta bajo la transformación de gauge (6.7):
Aparecen términos extra — no es invariante de gauge.
⚪ Mei: Es decir, la simetría de gauge prohíbe el término de masa. Mientras se mantenga la simetría de gauge, el fotón debe tener masa cero.
🟡 Lina: Exacto. Este es un ejemplo del principio profundo de que "la simetría determina las leyes físicas". Dicho al revés, si quieres darle masa al fotón, debes romper la simetría de gauge de alguna forma. Eso es el mecanismo de Higgs que estudiaremos en Cap. 19 — el mecanismo por el cual los bosones \(W\) y \(Z\) adquieren masa.
✅ Verificación de comprensión: Explica por qué el término de masa \(\frac{1}{2}m^2 A_\mu A^\mu\) es incompatible con la simetría de gauge.
Respuesta
Bajo la transformación de gauge \(A_\mu \to A_\mu + \partial_\mu \lambda\), \(A_\mu A^\mu \to A_\mu A^\mu + 2A^\mu \partial_\mu \lambda + (\partial_\mu \lambda)(\partial^\mu \lambda)\), aparecen términos extra y no es invariante. Por lo tanto, añadir un término de masa al Lagrangiano rompe la simetría de gauge, y mientras se mantenga la simetría de gauge la masa del fotón debe ser cero.
🔵 Kai: La simetría de gauge es realmente increíble. Exige la existencia de la fuerza, protege que la masa del fotón sea cero… Pero espera. Los bosones \(W\) y \(Z\) que transmiten la fuerza débil tienen masa, ¿verdad? Si también se derivan de la simetría de gauge, deberían tener masa cero, ¿no?
🟡 Lina: Pregunta excelente. La resolución de esa contradicción es el mecanismo de Higgs que estudiaremos en Cap. 19. "Rompiendo espontáneamente" la simetría de gauge se puede dar masa a los bosones de gauge. Y como aprenderemos en Cap. 17, al extender este principio a grupos no abelianos (SU(2) y SU(3)), se derivan la fuerza débil y la fuerza fuerte. El principio de gauge es el pilar central que sostiene toda la física de partículas moderna.
Resumen — Comparación de los dos métodos de cuantización¶
🟡 Lina: Organicemos lo que aprendimos en este capítulo.
Tabla 6.3: Comparación de los métodos de cuantización: gauge de Coulomb y gauge de Lorenz
| Gauge de Coulomb | Gauge de Lorenz + Gupta-Bleuler | |
|---|---|---|
| Condición de gauge | \(\nabla \cdot \mathbf{A} = 0\) | \(\partial_\mu A^\mu = 0\) |
| Covariancia de Lorentz | No manifiesta | Manifiesta |
| Grados de libertad cuantizados | Solo 2 polarizaciones transversales | Las 4 polarizaciones |
| Problema de norma negativa | No ocurre | Ocurre → Resuelto por Gupta-Bleuler |
| Fotón físico | 2 polarizaciones | 2 polarizaciones (seleccionadas por condición) |
| Conveniencia de cálculo | No apto para cálculos de dispersión | Buena compatibilidad con reglas de Feynman |
⚪ Mei: En ambos métodos la física final es la misma. El fotón tiene masa cero, espín 1 y 2 polarizaciones transversales (helicidad \(\pm 1\)). Y todo esto se deriva de la simetría de gauge — la invariancia U(1) local.
🔵 Kai: Al principio, cuando escuché "redundancia", pensé que solo era un fastidio, pero resulta que esa redundancia gobierna la física.
🟡 Lina: Así es. La simetría de gauge: 1. Exige la existencia del campo electromagnético \(A_\mu\) (U(1) local → derivada covariante → \(A_\mu\)) 2. Determina unívocamente la forma del acoplamiento con el campo de materia (\(\partial_\mu \to D_\mu\)) 3. Protege la masa cero del fotón (el término de masa no es invariante de gauge) 4. Restringe los grados de libertad físicos a 2 (4 componentes → 2 polarizaciones)
🔵 Kai: Que de un solo principio salga todo esto… Pero U(1) es un grupo simple que solo "rota la fase", ¿verdad? Si lo extendemos a SU(2) o SU(3), ¿qué cambia esencialmente?
🟡 Lina: Pregunta central. U(1) es un grupo abeliano — el resultado no cambia al intercambiar el orden de las transformaciones. Pero SU(2) y SU(3) son grupos no abelianos, donde el orden de las transformaciones cambia el resultado. Como consecuencia, el campo de gauge mismo porta "carga" y los campos de gauge interactúan entre sí. El fotón no tiene carga así que los fotones no interactúan directamente entre sí, pero los gluones (partículas que transmiten la fuerza fuerte) tienen "carga de color" y los gluones interactúan entre sí. Esta es la esencia de la teoría de Yang-Mills, que describe todas las fuerzas de la naturaleza (excepto la gravedad). Lo estudiaremos en detalle en Cap. 17. En Fig. 6.5「Comparación de métodos de fijación de gauge. Comparación entre el gauge de Coulomb y el gauge de Lorenz + Gupta-Bleuler. Los enfoques son diferentes pero la conclusión final es la misma」 he resumido la visión global de los dos métodos de cuantización.
Fig. 6.5: Comparación de métodos de fijación de gauge. Comparación entre el gauge de Coulomb y el gauge de Lorenz + Gupta-Bleuler. Los enfoques son diferentes pero la conclusión final es la misma — los fotones físicos son 2 polarizaciones transversales.
✅ Verificación de comprensión: Enumera los 4 roles que cumple la simetría de gauge para el fotón.
Respuesta
(1) De la exigencia de simetría U(1) local se deriva la existencia del campo electromagnético \(A_\mu\). (2) Mediante la derivada covariante \(D_\mu = \partial_\mu + iqA_\mu\) la forma del acoplamiento con el campo de materia queda determinada unívocamente. (3) Como el término de masa \(m^2 A_\mu A^\mu\) no es invariante de gauge, la masa cero del fotón queda protegida. (4) Por la redundancia de la transformación de gauge, los grados de libertad físicos del campo vectorial de 4 componentes quedan restringidos a las 2 polarizaciones transversales.
6.10 Conexión con el campo de Maxwell estudiado en mecánica cuántica¶
🟡 Lina: Para terminar, confirmemos la conexión con lo que aprendimos en Mecánica Cuántica Cap. 27. En aquel capítulo anticipamos la imagen de que "los modos de oscilación del campo son partículas".
🔵 Kai: Sí. Era la historia de que "así como los modos de vibración de una cuerda de violín son sonido, los modos de oscilación del campo son partículas". Pero si una onda electromagnética clásica es "un estado donde muchos fotones oscilan coordinados", ¿en qué se diferencia concretamente el estado de un solo fotón del estado de onda clásica?
🟡 Lina: Buena pregunta. El estado de un fotón \(|1_{\mathbf{k},\lambda}\rangle\) tiene valor esperado del campo eléctrico cero, y cada vez que se mide sale un valor aleatorio — el número de fotones está determinado, pero la "amplitud" del campo eléctrico es indeterminada. En cambio, lo que corresponde a una onda electromagnética clásica es un estado especial llamado "estado coherente" (coherent state). La imagen es un estado donde el número de fotones es indeterminado pero la amplitud y fase del campo eléctrico están casi determinadas — la luz láser es justamente algo cercano a esto.
🔵 Kai: Vaya, la luz láser es un "estado coherente"… Eso es un estado especial desde el punto de vista de la mecánica cuántica.
🟡 Lina: Matemáticamente se define como un autoestado del operador de aniquilación \(a\) (\(a|\alpha\rangle = \alpha|\alpha\rangle\), \(\alpha\) es un número complejo). En Mecánica Cuántica Cap. 9, para el oscilador armónico aprendimos que \(\hat{a}|n\rangle = \sqrt{n}|n-1\rangle\) — el estado numérico \(|n\rangle\) no era autoestado de \(\hat{a}\). El estado coherente es una superposición de estados numéricos \(|\alpha\rangle = e^{-|\alpha|^2/2}\sum_n \frac{\alpha^n}{\sqrt{n!}}|n\rangle\), un estado especial que "no cambia de forma" al aplicarle \(\hat{a}\). Como \(\hat{a}\) no es hermítico, el autovalor \(\alpha\) puede ser complejo en vez de real.
🔵 Kai: "Al aplicar el operador de aniquilación la forma del estado no cambia" — ¿eso significa que aunque quites un fotón el estado sigue siendo el mismo?
🟡 Lina: Sí, intuitivamente es exactamente eso. Es como sacar un vaso de agua de un cubo y que el nivel apenas cambie — como hay tantísimos fotones, al quitar 1 la "forma" del conjunto no cambia. \(|\alpha|^2\) representa el número promedio de fotones, y la fase de \(\alpha\) corresponde a la fase del campo eléctrico. Cuando el número promedio de fotones es muy grande, el valor esperado del campo eléctrico se aproxima a la forma de onda clásica \(E_0 \cos(\omega t - \mathbf{k}\cdot\mathbf{x})\). La definición matemática precisa se estudia en óptica cuántica, pero aquí quédate con que "en el límite de muchos fotones se recupera la electrodinámica clásica".
🔵 Kai: Ya veo. El estado de un fotón es "el número de partículas está determinado pero el valor del campo es indeterminado", la onda clásica es "el valor del campo está casi determinado pero el número de partículas es indeterminado" — son justo la relación inversa.
⚪ Mei: El número de partículas y la fase tienen una relación complementaria como la de incertidumbre. Una estructura similar a "posición y momento" en mecánica cuántica está viva también en la teoría de campos.
🟡 Lina: En este capítulo realizamos la cuantización del campo para el campo electromagnético. Descompusimos el campo de Maxwell clásico en modos de Fourier y cuantizamos cada modo como un oscilador armónico de mecánica cuántica. Como resultado:
- Cada excitación del modo \((\mathbf{k}, \lambda)\) es "un fotón con momento \(\mathbf{k}\) y polarización \(\lambda\)"
- \(n\) excitaciones → \(n\) fotones (espacio de Fock)
- Onda electromagnética clásica → estado coherente de muchos fotones
⚪ Mei: Es decir, la electrodinámica clásica de Maxwell se recupera como el límite en que hay gran cantidad de fotones.
🟡 Lina: Así es. Con esto se completa la cuantización de campos libres de espín 0 (Cap. 4), espín 1/2 (Cap. 5) y espín 1 (este capítulo). A partir del próximo capítulo, por fin "mezclaremos" estos campos — introduciremos las interacciones.
Adelanto del próximo capítulo¶
Con los campos libres de espín 0, 1/2 y 1 listos, entramos en la etapa de "mezclar" campo con campo. En Cap. 7 añadiremos un término de interacción al Lagrangiano y formularemos la matriz S para describir sistemáticamente los procesos de dispersión. Con la serie de Dyson y el producto ordenado en el tiempo como herramientas, desvelaremos la estructura de la expansión perturbativa y abriremos la puerta a la poderosa herramienta de cálculo que son los diagramas de Feynman.
Referencias¶
- Quantum Field Theory for the Gifted Amateur (Lancaster & Blundell) Capítulo 14 "Gauge Invariance and the Electromagnetic Field"
- David Tong, Quantum Field Theory Lecture Notes Capítulo 7 "Quantizing the Electromagnetic Field"
- 場の量子論:不変性と自由場を中心にして(場上) Capítulo 3 "Forma relativista de las ecuaciones de Maxwell e invariancia de gauge"
- 場の量子論:不変性と自由場を中心にして(場上) Capítulo 7 "Principio de gauge — La fuerza nace de la simetría"
- 場の量子論:不変性と自由場を中心にして(場上) Capítulo 13 "Cuantización del campo de Maxwell — La lucha con los grados de libertad de gauge"
- Quantum Field Theory and the Standard Model (Schwartz) Capítulo 6 "Spin 1 and Gauge Invariance"
- Quantum Field Theory and the Standard Model (Schwartz) Capítulo 7 "Scalar QED"
Feedback on this page
Let us know if something was unclear, incorrect, or could be improved.




