Capítulo 5 Cuantización del campo de Dirac — Relaciones de anticonmutación de fermiones¶
Resumen de los capítulos anteriores:
En Cap. 4, ejecutamos la cuantización canónica del campo escalar real. Al promover los campos a operadores e imponer las relaciones de conmutación a tiempos iguales \([\hat{\phi}(\boldsymbol{x}), \hat{\pi}(\boldsymbol{y})] = i\delta^{(3)}(\boldsymbol{x} - \boldsymbol{y})\), aparecieron los operadores de creación y aniquilación \(\hat{a}^\dagger_{\boldsymbol{p}}, \hat{a}_{\boldsymbol{p}}\), y vimos que las excitaciones del campo pueden interpretarse como "partículas". Confirmamos la estructura del espacio de Fock y que la estadística de Bose-Einstein se deriva naturalmente de las relaciones de conmutación.
Objetivos de este capítulo
- Cuantizar el campo de Dirac (campo de espín \(1/2\))
- Experimentar que al imponer relaciones de conmutación como en el campo escalar surge una falla fatal: la energía no está acotada inferiormente, y comprender que como remedio las relaciones de anticonmutación son inevitables
- Confirmar que de las relaciones de anticonmutación se derivan naturalmente el principio de exclusión de Pauli y la estadística de Fermi-Dirac, y aprender el espacio de Fock de fermiones, antipartículas y las transformaciones \(C, P, T\)
5.1 Repaso de la ecuación de Dirac — La necesidad del espinor de 4 componentes¶
🟡 Lina: En Cap. 4 cuantizamos el campo escalar — un campo de espín 0. Pero las partículas que constituyen la materia en la naturaleza — electrones, quarks, neutrinos — son todas partículas de espín \(1/2\). Hoy por fin vamos a cuantizar el campo de Dirac, que describe estas partículas.
🔵 Kai: En Mecánica Cuántica Cap. 27 se anticipó la ecuación de Dirac, ¿verdad? Era la idea de "factorizar" la ecuación de Klein-Gordon para obtener una ecuación de primer orden en la derivada temporal.
🟡 Lina: Buena memoria. Repasemos. El punto de partida es la relación relativista entre energía y momento
convertida en operadores, la ecuación de Klein-Gordon
En el sistema de unidades naturales \(\hbar = c = 1\) se escribe
Esta es una ecuación de segunda derivada en el tiempo, y tenía el problema de que la densidad de probabilidad podía volverse negativa.
🔵 Kai: Por eso Dirac quiso hacer la derivada temporal de primer orden, ¿no?
⚪ Mei: Como el problema era esa "segunda derivada", quería convertirla en primera.
🟡 Lina: Así es. La idea de Dirac fue la siguiente. Si quieres que la derivada temporal sea de primer orden, te gustaría escribir la ecuación \(i\partial_t \psi = \sqrt{-\nabla^2 + m^2}\,\psi\) sustituyendo la "raíz cuadrada" \(E = \sqrt{|\boldsymbol{p}|^2 + m^2}\) de \(E^2 = |\boldsymbol{p}|^2 + m^2\) por operadores. Pero si hay un operador diferencial dentro de la raíz cuadrada, al hacer la expansión de Taylor aparecen derivadas de orden infinito y no se obtiene una ecuación local. La idea genial de Dirac fue realizar la "raíz cuadrada" del d'Alembertiano \(\Box \equiv \partial_\mu \partial^\mu\) usando matrices. Concretamente, se introducen 4 matrices \(\gamma^\mu\) tales que
se cumpla. Así, \(\gamma^\mu \partial_\mu\) es un operador diferencial de primer orden, y se puede escribir la ecuación de primer orden \((\gamma^\mu \partial_\mu + \text{constante})\psi = 0\).
🔵 Kai: Si expandimos \((\gamma^\mu \partial_\mu)^2\) obtenemos \(\gamma^\mu \gamma^\nu \partial_\mu \partial_\nu\), ¿verdad? Como el orden de las derivadas parciales se puede intercambiar, \(\partial_\mu \partial_\nu\) es simétrico en \(\mu, \nu\)... ¿entonces eso impone alguna condición sobre \(\gamma^\mu \gamma^\nu\)?
🟡 Lina: Exacto. Como \(\partial_\mu \partial_\nu\) es simétrico, la parte antisimétrica de \(\gamma^\mu \gamma^\nu\) desaparece y solo queda la parte simétrica. La condición necesaria es
es decir, la relación de anticonmutación
Aquí \(\eta^{\mu\nu} = \mathrm{diag}(+1, -1, -1, -1)\) es la métrica de Minkowski y \(\mathbf{1}\) es la matriz identidad. Esta relación se llama álgebra de Clifford.
🔵 Kai: ¡Apareció una relación de anticonmutación! Pero esta es una relación de anticonmutación entre las matrices \(\gamma\), no de los operadores de campo, ¿verdad?
🟡 Lina: Correcto. La relación de anticonmutación aquí es una propiedad puramente algebraica de las matrices. Es diferente de las relaciones de anticonmutación que aparecen en la cuantización de campos. Sin embargo, es interesante que en el punto de partida de la ecuación de Dirac ya está oculta la estructura de "anticonmutación".
🟡 Lina: Veamos qué se puede leer de la ecuación (5.1) sustituyendo valores concretos de \(\mu, \nu\).
⚪ Mei: Lo intento.
- \(\mu = \nu = 0\): como \(\eta^{00} = +1\), tenemos \((\gamma^0)^2 = +\mathbf{1}\)
- \(\mu = \nu = i\) (componentes espaciales): como \(\eta^{ii} = -1\), tenemos \((\gamma^i)^2 = -\mathbf{1}\)
- \(\mu \neq \nu\): como \(\eta^{\mu\nu} = 0\), tenemos \(\gamma^\mu \gamma^\nu = -\gamma^\nu \gamma^\mu\) (diferentes matrices \(\gamma\) anticonmutan)
Ahí está.
🔵 Kai: Las matrices de Pauli son \(2 \times 2\) y hay 3, pero necesitamos 4 matrices \(\gamma\). ¿No se puede con \(2 \times 2\)?
🟡 Lina: Buena pregunta. Las matrices \(2 \times 2\) agotan su base con la matriz identidad \(\mathbf{1}\) y las 3 matrices de Pauli \(\sigma^1, \sigma^2, \sigma^3\). Para satisfacer el álgebra de Clifford se necesitan 4 matrices mutuamente anticonmutantes, pero en \(2 \times 2\) solo se pueden tener como máximo 3 (las matrices de Pauli son exactamente eso). No hay espacio para una cuarta. Por eso el mínimo es matrices \(4 \times 4\), y la función de onda \(\psi\) tiene 4 componentes. Esto es el espinor de Dirac (Dirac spinor).
✅ Verificación de comprensión: Explica por qué el espinor de Dirac tiene 4 componentes, desde la perspectiva del álgebra de Clifford y el tamaño de las matrices.
Respuesta
Para satisfacer el álgebra de Clifford \(\{\gamma^\mu, \gamma^\nu\} = 2\eta^{\mu\nu}\) se necesitan 4 matrices mutuamente anticonmutantes, pero en matrices \(2 \times 2\) solo se pueden tener como máximo 3 (las matrices de Pauli). Se requieren matrices de al menos \(4 \times 4\), y la función de onda \(\psi\) que actúa sobre ellas se convierte en un espinor de Dirac de 4 componentes.
Forma final de la ecuación de Dirac¶
🟡 Lina: Usando las matrices \(\gamma\), podemos factorizar la ecuación de Klein-Gordon. Verifiquémoslo.
Primero una nota importante: las matrices \(\gamma\) son matrices constantes que no dependen de las coordenadas, así que el operador diferencial \(\partial_\mu\) pasa a través de \(\gamma\) y solo actúa sobre \(\psi\) que viene después. Por eso el orden de \(i\), \(\gamma\), \(\partial\) se puede intercambiar libremente.
Expandamos término a término. Aparecen 4 términos:
- Término 1 (derivada×derivada): \((-i\gamma^\mu\partial_\mu)(i\gamma^\nu\partial_\nu) = (-i)(i)\gamma^\mu\gamma^\nu\partial_\mu\partial_\nu = +\gamma^\mu\gamma^\nu\partial_\mu\partial_\nu\) (porque \((-i)(i) = -(i^2) = -(-1) = +1\))
- Término 2 (derivada×masa): \((-i\gamma^\mu\partial_\mu)(-m) = +im\gamma^\mu\partial_\mu\)
- Término 3 (masa×derivada): \((-m)(i\gamma^\nu\partial_\nu) = -im\gamma^\nu\partial_\nu\)
- Término 4 (masa×masa): \((-m)(-m) = m^2\)
Veamos los términos cruzados (término 2 + término 3). \(\mu\) y \(\nu\) son ambos índices mudos (nombres provisionales para "sumar sobre todo") que recorren \(0, 1, 2, 3\), así que \(\gamma^\mu\partial_\mu = \gamma^0\partial_0 + \gamma^1\partial_1 + \gamma^2\partial_2 + \gamma^3\partial_3\) y \(\gamma^\nu\partial_\nu = \gamma^0\partial_0 + \gamma^1\partial_1 + \gamma^2\partial_2 + \gamma^3\partial_3\) son lo mismo con las letras cambiadas. Por lo tanto \(+im\gamma^\mu\partial_\mu - im\gamma^\mu\partial_\mu = 0\) y los términos cruzados se cancelan. Solo quedan el término 1 y el término 4. Procesemos más el término 1. Cualquier producto de matrices se puede descomponer en parte simétrica y antisimétrica: \(\gamma^\mu\gamma^\nu = \frac{1}{2}\{\gamma^\mu, \gamma^\nu\} + \frac{1}{2}[\gamma^\mu, \gamma^\nu]\). Sustituyendo el álgebra de Clifford \(\{\gamma^\mu, \gamma^\nu\} = 2\eta^{\mu\nu}\):
Como \(\partial_\mu\partial_\nu\) es simétrico bajo el intercambio \(\mu \leftrightarrow \nu\), la contracción con la parte antisimétrica \([\gamma^\mu, \gamma^\nu]\) es cero. Finalmente \(\gamma^\mu\gamma^\nu \partial_\mu \partial_\nu = \eta^{\mu\nu}\partial_\mu\partial_\nu = \partial_\mu\partial^\mu\). Por lo tanto
Hemos confirmado la factorización. Es decir, el operador de Klein-Gordon \(\partial_\mu\partial^\mu + m^2\) se descompone en el producto de dos operadores de primer orden. Para obtener la ecuación de Dirac, basta con igualar a cero el factor de la derecha:
Esta es la ecuación de Dirac. Aquí introduzco la notación slash (notación de Feynman). Para cualquier cuadrivector \(A\) se define \(\not\!A \equiv \gamma^\mu A_\mu\) (contracción de las matrices \(\gamma\) con las componentes con índice inferior \(A_\mu\)). Aplicada al operador diferencial: \(\not\!\partial \equiv \gamma^\mu \partial_\mu\), y la ecuación de Dirac se escribe compactamente como \((i\not\!\partial - m)\psi = 0\). Más adelante también usaremos \(\not\!p \equiv \gamma^\mu p_\mu\).
Confirmemos que esta solución satisface también la ecuación de Klein-Gordon. Si actuamos con \((-i\not\!\partial - m)\) por la izquierda sobre ambos miembros de \((i\not\!\partial - m)\psi = 0\), usando directamente el resultado de la factorización \((-i\not\!\partial - m)(i\not\!\partial - m) = \partial_\mu\partial^\mu + m^2\), obtenemos \((\partial_\mu\partial^\mu + m^2)\psi = 0\) — la ecuación de Klein-Gordon. Dicho de otra forma, las soluciones de la ecuación de Dirac satisfacen automáticamente la ecuación de Klein-Gordon. Es decir
🔵 Kai: ¡Tanto la derivada temporal como la espacial son de primer orden! ¿Se satisface también la covariancia de Lorentz?
🟡 Lina: Buena pregunta. Para verificarlo necesitamos saber cómo se transforma \(\psi\) bajo transformaciones de Lorentz. Lo veremos en la siguiente sección.
✅ Verificación de comprensión: A partir del álgebra de Clifford \(\{\gamma^\mu, \gamma^\nu\} = 2\eta^{\mu\nu}\), deduce que \(\gamma^0 \gamma^1 = -\gamma^1 \gamma^0\).
Respuesta
Para \(\mu = 0, \nu = 1\), como \(\eta^{01} = 0\), tenemos \(\{\gamma^0, \gamma^1\} = \gamma^0\gamma^1 + \gamma^1\gamma^0 = 0\). Por lo tanto \(\gamma^0\gamma^1 = -\gamma^1\gamma^0\).
📝 Ejercicios:
- Derivación de propiedades de las matrices \(\gamma\) a partir del álgebra de Clifford → Problema B-1. Cálculo básico del álgebra de Clifford
5.2 Representación espinorial del grupo de Lorentz — Los espinores no son vectores¶
🟡 Lina: En Cap. 2 aprendimos cómo se transforman los campos bajo transformaciones de Lorentz. Recordemos: el campo escalar se transforma como \(\phi(x) \to \phi'(x) = \phi(\Lambda^{-1}x)\) — es decir, "si quieres conocer el valor del campo en el punto \(x\) en el sistema transformado, trae el valor de la posición correspondiente \(\Lambda^{-1}x\) en el sistema original" (la perspectiva de "transformación activa" que aprendimos en Cap. 2 — se mueve el sistema físico manteniendo fijo el sistema de coordenadas). El campo vectorial se transforma como \(A^\mu(x) \to \Lambda^\mu{}_\nu A^\nu(\Lambda^{-1}x)\), donde no solo cambia el argumento de las coordenadas sino que también se mezclan las componentes. Entonces, ¿cómo se transforma el espinor de Dirac \(\psi\)?
🔵 Kai: Tiene 4 componentes, así que se transforma como un vector con \(\Lambda^\mu{}_\nu\)... ¿o no?
🟡 Lina: No. El espinor es un objeto fundamentalmente diferente de un vector. La diferencia más fácil de entender es:
Si rotas un vector \(360°\) vuelve a su estado original. Pero si rotas un espinor \(360°\) su signo se invierte, y necesitas rotarlo \(720°\) para que vuelva al original.
🔵 Kai: ¿Eh? ¿No vuelve al original al rotar \(360°\)? ¿Eso puede ocurrir en la realidad?
🟡 Lina: De hecho fue confirmado en el experimento de interferencia de neutrones de Rauch y colaboradores en 1975. Dividieron un haz de neutrones en dos, rotaron solo uno en un campo magnético y luego los recombinaron. Se observó que con una rotación de \(360°\) el patrón de interferencia se invertía, y con \(720°\) volvía al original. Recuerda las propiedades del espín \(1/2\) que aprendiste en mecánica cuántica. Con el operador de rotación \(D(\boldsymbol{\theta}) = e^{-\frac{i}{2}\boldsymbol{\sigma}\cdot\boldsymbol{\theta}}\) usando las matrices de Pauli \(\boldsymbol{\sigma}\), al sustituir \(\theta = 2\pi\) (\(360°\)) alrededor del eje \(z\): \(e^{-i\pi\sigma^3} = \cos\pi \cdot \mathbf{1} - i\sin\pi \cdot \sigma^3 = -\mathbf{1}\).
🔵 Kai: Como hay un \(1/2\) en el exponente del operador de rotación, al rotar \(2\pi\) solo avanza \(\pi\) y da \(-\mathbf{1}\). Pero si solo se invierte el signo, ¿es físicamente observable? Se supone que la fase global no se puede medir...
🟡 Lina: Buen punto. Efectivamente la fase global no se puede medir. Pero en un experimento de interferencia se mide la fase relativa entre dos caminos, así que si rotas solo uno de ellos \(360°\), el patrón de interferencia se invierte — el experimento de Rauch observó exactamente eso.
⚪ Mei: Es decir, lo que la profesora mostró antes \(e^{-i\pi\sigma^3} = -\mathbf{1}\) es para el caso \(\theta = 2\pi\), y si ponemos \(\theta = 4\pi\) en la misma fórmula obtenemos \(e^{-2i\pi} = +1\) y vuelve al original — por eso se necesitan \(720°\). El \(1/2\) en el exponente es la causa de todo.
Descomposición del álgebra de Lorentz — Dos \(\mathfrak{su}(2)\)¶
🟡 Lina: Veamos más en profundidad la estructura del grupo de Lorentz. Como aprendimos en Cap. 2, hay 2 tipos de transformaciones de Lorentz — rotaciones espaciales (3 alrededor de los ejes, 3 en total) y boosts que cambian a diferentes sistemas inerciales (3 direcciones, 3 en total). Escribimos los generadores respectivos como generadores de rotaciones \(\mathbf{J} = (J^1, J^2, J^3)\) y generadores de boosts \(\mathbf{K} = (K^1, K^2, K^3)\). "Generador" significa el operador que produce una transformación infinitesimal — en el mismo sentido en que en mecánica cuántica el momento angular \(\hat{L}_z\) genera rotaciones infinitesimales alrededor del eje \(z\). \(J^i\) genera rotaciones espaciales y \(K^i\) genera boosts. Concretamente, la rotación infinitesimal en el plano \(xy\) es generada por \(J^3\), y el boost infinitesimal en la dirección \(x\) es generado por \(K^1\) — es decir, \(J^i\) corresponde a rotaciones alrededor del eje \(i\), y \(K^i\) a boosts en la dirección \(i\). En total son 6, y las relaciones de conmutación entre ellos se pueden derivar de la condición de definición de las matrices de transformación de Lorentz \(\Lambda^T\eta\Lambda = \eta\). La idea es: al sustituir una transformación infinitesimal \(\Lambda^\mu{}_{\nu} = \delta^\mu{}_{\nu} + \omega^\mu{}_{\nu}\) (\(\omega\) infinitesimal) en la condición de definición, se obtiene \(\omega_{\mu\nu} = -\omega_{\nu\mu}\) (antisimétrico). Estos 6 parámetros antisimétricos corresponden a 3 rotaciones + 3 boosts, y se pueden definir los respectivos generadores \(J^i\), \(K^i\). Las relaciones de conmutación entre generadores se determinan a partir de la diferencia de orden al realizar dos transformaciones infinitesimales sucesivas — exactamente la misma idea con la que en mecánica cuántica se deriva \([\hat{L}_x, \hat{L}_y] = i\hbar\hat{L}_z\) a partir de la diferencia entre "rotación infinitesimal alrededor del eje \(x\) → rotación infinitesimal alrededor del eje \(y\)" y el orden inverso. Por ejemplo, para obtener \([J^1, J^2]\), se realizan sucesivamente la rotación infinitesimal en el plano \(xz\) (generada por \(J^2\)) y la rotación infinitesimal en el plano \(yz\) (generada por \(J^1\)), y se calcula la diferencia al intercambiar el orden. Que esa diferencia sea proporcional a la rotación infinitesimal en el plano \(xy\) (generada por \(J^3\)) da \([J^1, J^2] = iJ^3\) (para detalles véase Apéndice B). Los resultados son
Aquí \(\varepsilon^{ijk}\) es el símbolo de Levi-Civita — \(\varepsilon^{123} = 1\), el signo se invierte con cada intercambio de índices (ejemplo: \(\varepsilon^{213} = -1\)), y es cero si algún índice se repite; es el símbolo completamente antisimétrico.
La ecuación (5.3a) tiene la misma forma que las relaciones de conmutación del momento angular que aprendimos en mecánica cuántica \([\hat{L}_i, \hat{L}_j] = i\hbar\varepsilon_{ijk}\hat{L}_k\) (con \(\hbar = 1\) en unidades naturales). La ecuación (5.3b) significa que "el generador de boost \(K^j\) se transforma como un vector bajo rotaciones" — es decir, si aplicas la rotación generada por \(J^i\) a \(K^j\), este se mezcla con otras componentes \(K^k\). Exactamente la misma estructura que cuando rotas un vector ordinario \(\boldsymbol{v} = (v^1, v^2, v^3)\) y sus componentes se mezclan. El signo menos en la ecuación (5.3c), comparando con (5.3a), significa que "el conmutador de \(K\) con \(K\) produce \(J\), pero con signo opuesto al conmutador de \(J\) con \(J\)". Esto refleja la diferencia esencial entre rotaciones y boosts — las rotaciones son operaciones dentro del espacio, pero los boosts mezclan tiempo y espacio, y el signo de la componente temporal de la métrica de Minkowski \(\eta^{00} = +1\) (el espacio tiene \(-1\)) es el origen de este menos.
🔵 Kai: Me llama la atención el signo menos en el lado derecho de (5.3c). ¿El conmutador de boosts produce rotaciones...?
🟡 Lina: Sí, esa es la estructura no trivial del grupo de Lorentz. Intuitivamente, hacer un boost en dirección \(x\) y luego un boost en dirección \(y\), comparado con hacerlos en orden inverso, da un resultado ligeramente diferente — esa diferencia se manifiesta como una rotación en el plano \(xy\). En un ejemplo cotidiano, cuando un avión vuela hacia el este (boost en dirección \(x\)) y luego gira al norte (boost en dirección \(y\)), comparado con volar primero al norte y luego girar al este, la orientación final del avión difiere ligeramente — ese desfase corresponde a una rotación. Esto se conoce como la precesión de Thomas y es la expresión matemática del factor de corrección \(1/2\) (factor de Thomas) en la interacción espín-órbita del átomo de hidrógeno. Por ahora basta con recordar el hecho de que "la no conmutatividad de los boosts produce rotaciones".
Ahora te presento un truco genial. Definimos una nueva combinación de generadores:
🔵 Kai: Es extraño que se multiplique por \(i\). ¿Por qué esta combinación? ¿Qué representan físicamente \(J_+\) y \(J_-\)?
🟡 Lina: Buena duda. \(J_\pm\) no son observables físicos, sino herramientas matemáticas para hacer visible la estructura del álgebra. Es la misma idea de introducir números complejos \(z = x + iy\) para que los problemas bidimensionales se vean mejor. La motivación es la siguiente. Mirando la ecuación (5.3a), \([J^i, J^j] = i\varepsilon^{ijk}J^k\) tiene la misma forma que las relaciones de conmutación del momento angular que aprendimos en mecánica cuántica — la forma de \(\mathfrak{su}(2)\). Es natural preguntarse "¿se puede hacer que \(K\) tenga la misma forma?" Pero mirando (5.3c), el lado derecho de \([K^i, K^j]\) tiene \(-i\varepsilon^{ijk}J^k\) con un signo menos, así que solo con \(K\) no se obtiene la forma de \(\mathfrak{su}(2)\). Entonces multiplicamos \(K\) por la unidad imaginaria \(i\). El conmutador tiene esta propiedad: si \(c\) es solo un número (una constante, no un operador), entonces \([cA, cB] = c^2[A, B]\). Verifícalo: \([cA, cB] = (cA)(cB) - (cB)(cA) = c^2(AB - BA) = c^2[A, B]\). \(c\) puede ser real o complejo. Si sustituimos \(c = i\) (unidad imaginaria), \([iK^i, iK^j] = i^2[K^i, K^j] = (-1) \times (-i\varepsilon^{ijk}J^k) = +i\varepsilon^{ijk}J^k\) y el signo menos desaparece. Es decir, multiplicar por \(i\) hace que \(i^2 = -1\) cancele el molesto signo menos. Si combinamos \(J\) e \(iK\) apropiadamente, podemos esperar que salga la bonita forma de \(\mathfrak{su}(2)\). Calculemos concretamente. Usando las ecuaciones (5.3a)–(5.3c), calcula \([J^i_+, J^j_+]\).
🟡 Lina: Hagámoslo juntos. Primero expandimos:
Sustituyendo las relaciones de conmutación (5.3a)–(5.3c) en cada término:
🔵 Kai: A ver, el segundo término es \(-\varepsilon^{ijk}K^k\) y el tercer término también \(-\varepsilon^{ijk}K^k\)... ¿eh, los términos de \(K\) no se cancelan?
🟡 Lina: Espera, hagámoslo más cuidadosamente. Primero el segundo término: directamente de (5.3b), \([J^i, K^j] = i\varepsilon^{ijk}K^k\), así que \(i[J^i, K^j] = i \cdot i\varepsilon^{ijk}K^k = -\varepsilon^{ijk}K^k\). Ahora el tercer término: por la definición del conmutador \([A, B] = AB - BA\), tenemos \([K^i, J^j] = -[J^j, K^i]\). La ecuación (5.3b) es una relación que se cumple para cualesquiera \(a, b\) en la forma \([J^a, K^b] = i\varepsilon^{abc}K^c\), así que sustituyendo \(a = j\), \(b = i\) obtenemos \([J^j, K^i] = i\varepsilon^{jic}K^c = i\varepsilon^{jik}K^k\) (la última igualdad solo cambia el nombre del índice de suma de \(c\) a \(k\)). Aquí \(\varepsilon^{jik}\) es \(\varepsilon^{ijk}\) con los primeros dos índices \(i, j\) intercambiados, así que \(\varepsilon^{jik} = -\varepsilon^{ijk}\). Por lo tanto \([J^j, K^i] = -i\varepsilon^{ijk}K^k\). Entonces \([K^i, J^j] = -[J^j, K^i] = +i\varepsilon^{ijk}K^k\). El tercer término es \(i[K^i, J^j] = i \cdot i\varepsilon^{ijk}K^k = -\varepsilon^{ijk}K^k\). Sumando el segundo y tercer términos: \(-2\varepsilon^{ijk}K^k\).
Por otro lado, el primer término es \(i\varepsilon^{ijk}J^k\), y el cuarto es \((-1)(-i\varepsilon^{ijk}J^k) = +i\varepsilon^{ijk}J^k\). Sumados: \(2i\varepsilon^{ijk}J^k\).
En total:
🔵 Kai: A ver, una expresión mezclada de \(J\) y \(K\) al final vuelve a la forma solo con \(J_+\). Como \(J^k + iK^k = 2J^k_+\)... ¡efectivamente da \(i\varepsilon^{ijk}J^k_+\)! Pero, ¿por qué cierra tan limpiamente?
🟡 Lina: Esa es la astucia de la definición (5.4). Se combina \(iK\) desde el principio para que los términos de \(J\) y \(K\) se recombinen en la definición de \(J_+\) — es decir, está diseñado "calculando hacia atrás" para "crear un álgebra cerrada solo con \(J_+\)".
Un cálculo similar muestra que \(J_-\) también cierra independientemente, y además el conmutador entre \(J_+\) y \(J_-\) es cero. El cálculo de \([J^i_-, J^j_-]\) tiene exactamente la misma estructura que para \(J_+\), solo cambia el signo de \(iK\). Que \([J^i_+, J^j_-]\) sea cero también se puede confirmar expandiendo y viendo que los términos de \(J\) y \(K\) se cancelan entre sí — ¡inténtalo tú mismo! Resumiendo los resultados:
🔵 Kai: ¡Ooh! ¡\(\mathbf{J}_+\) y \(\mathbf{J}_-\) se han hecho completamente independientes! Además, cada una de sus relaciones de conmutación tiene la misma forma que las relaciones de conmutación del momento angular \([J^i, J^j] = i\varepsilon^{ijk}J^k\) que aprendimos en mecánica cuántica. Pero los \(\mathbf{J}\) y \(\mathbf{K}\) originales eran generadores de operaciones completamente diferentes — rotaciones y boosts — y al reorganizarlos en \(\mathbf{J}_+\) y \(\mathbf{J}_-\), ¡ambos se vuelven "algo parecido al momento angular"! ¿Quiere decir que dos "momentos angulares" independientes estaban escondidos dentro de las transformaciones de Lorentz? ¿Qué significado físico tiene esto?
🟡 Lina: Buena pregunta. El significado físico es el siguiente — la estructura de las relaciones de conmutación \([J^i, J^j] = i\varepsilon^{ijk}J^k\) se llama en matemáticas el álgebra de Lie \(\mathfrak{su}(2)\). No necesitas recordar el nombre, pero básicamente significa "un álgebra con las mismas relaciones de conmutación que el momento angular". Las ecuaciones (5.5a) y (5.5b) tienen ambas la misma forma que \(\mathfrak{su}(2)\), y la ecuación (5.5c) muestra que \(\mathbf{J}_+\) y \(\mathbf{J}_-\) son mutuamente independientes. Es decir —
El álgebra de Lorentz se descompone en el producto directo de dos álgebras \(\mathfrak{su}(2)\) independientes: \(\mathfrak{su}(2) \oplus \mathfrak{su}(2)\).
Lo que esto significa es que las representaciones del grupo de Lorentz se clasifican por el par de "representación \(\mathfrak{su}(2)\) de \(\mathbf{J}_+\)" y "representación \(\mathfrak{su}(2)\) de \(\mathbf{J}_-\)": \((j_+, j_-)\). Como aprendimos en mecánica cuántica, las representaciones de \(\mathfrak{su}(2)\) están determinadas por el valor del espín \(j = 0, 1/2, 1, \ldots\), así que con la combinación \((j_+, j_-)\) se obtienen sistemáticamente todas las representaciones del grupo de Lorentz.
🔵 Kai: ¿Dos \(\mathfrak{su}(2)\) independientes? ¿Qué representaciones concretas hay?
🟡 Lina: Veamos algunas representaciones:
Tabla 5.1: Representaciones irreducibles representativas del grupo de Lorentz
| Representación \((j_+, j_-)\) | Nombre | Número de componentes | Ejemplo |
|---|---|---|---|
| \((0, 0)\) | Escalar | \(1\) | Campo de Higgs |
| \((1/2, 0)\) | Espinor de Weyl levógiro | \(2\) | Neutrino levógiro |
| \((0, 1/2)\) | Espinor de Weyl dextrógiro | \(2\) | Neutrino dextrógiro |
| \((1/2, 0) \oplus (0, 1/2)\) (ambos combinados) | Espinor de Dirac | \(4\) | Electrón |
| \((1/2, 1/2)\) | Vector | \(4\) | Fotón |
🔵 Kai: ¿Cómo se determina el número de componentes?
🟡 Lina: La representación de espín \(j\) de \(\mathfrak{su}(2)\) tiene dimensión \(2j + 1\), ¿recuerdas? El número de componentes de la representación \((j_+, j_-)\) es \((2j_+ + 1)(2j_- + 1)\). Por ejemplo, \((1/2, 0)\) tiene \(2 \times 1 = 2\) componentes, y \((1/2, 1/2)\) tiene \(2 \times 2 = 4\) componentes.
🔵 Kai: ¡Entiendo! ¡El espinor de Dirac tiene 4 componentes porque es \((1/2, 0) \oplus (0, 1/2)\), combinando 2 componentes levógiras y 2 dextrógiras!
La diferencia entre levógiro y dextrógiro — El boost las distingue¶
🟡 Lina: Los espinores de Weyl levógiro y dextrógiro reciben la misma transformación bajo rotaciones. Ambos rotan con \(\mathbf{J} = \boldsymbol{\sigma}/2\). La diferencia aparece en los boosts.
Sumando las dos ecuaciones de (5.4): \(J^i_+ + J^i_- = \frac{1}{2}(J^i + iK^i) + \frac{1}{2}(J^i - iK^i) = J^i\). Restando: \(J^i_+ - J^i_- = \frac{1}{2}(J^i + iK^i) - \frac{1}{2}(J^i - iK^i) = iK^i\), así que \(\mathbf{K} = -i(\mathbf{J}_+ - \mathbf{J}_-)\). Usando esto:
- Levógiro \((1/2, 0)\): \(j_+ = 1/2\) así que \(\mathbf{J}_+\) se realiza en la representación de espín \(1/2\) — como aprendimos en mecánica cuántica, \(\boldsymbol{\sigma}/2\) (la mitad de las matrices de Pauli). Por otro lado \(j_- = 0\) así que \(\mathbf{J}_- = 0\). Sustituyendo en la inversa de (5.4) \(\mathbf{K} = -i(\mathbf{J}_+ - \mathbf{J}_-)\): \(\mathbf{K} = -i\boldsymbol{\sigma}/2\)
- Dextrógiro \((0, 1/2)\): \(j_+ = 0\) así que \(\mathbf{J}_+ = 0\), \(j_- = 1/2\) así que \(\mathbf{J}_- = \boldsymbol{\sigma}/2\). Igualmente \(\mathbf{K} = -i(0 - \boldsymbol{\sigma}/2) = +i\boldsymbol{\sigma}/2\)
🔵 Kai: ¡El signo del generador de boost es opuesto! Son iguales bajo rotaciones pero difieren bajo boosts.
🟡 Lina: Así es. Es decir, si separamos el espinor de Dirac en las 2 componentes superiores \(\psi_L\) (levógiras) y las 2 inferiores \(\psi_R\) (dextrógiras)
entonces bajo rotaciones \(\psi_L\) y \(\psi_R\) se transforman igual, pero bajo boosts reciben transformaciones diferentes.
⚪ Mei: En la tabla anterior, que \((1/2, 0) \oplus (0, 1/2)\) tenga 4 componentes es porque junta las 2 componentes levógiras y las 2 dextrógiras en una sola entidad.
🟡 Lina: Exacto. Cuando la masa \(m \neq 0\), la ecuación de Dirac acopla \(\psi_L\) y \(\psi_R\). De hecho, si reescribes el término de masa del lagrangiano \(m\bar{\psi}\psi\) en términos levógiro/dextrógiro, obtienes \(m(\bar{\psi}_L\psi_R + \bar{\psi}_R\psi_L)\), donde se ve que \(\psi_L\) y \(\psi_R\) se mezclan. Por eso, para describir partículas con masa se necesitan tanto la componente levógira como la dextrógira, y el espinor de Dirac de 4 componentes aparece necesariamente. En Fig. 5.1「Estructura del espinor de Dirac」 resumo esta estructura. Los detalles de la representación espinorial están resumidos en Apéndice B, consúltalo según necesites.
Fig. 5.1: Estructura del espinor de Dirac. El espinor de Dirac de 4 componentes combina las 2 componentes del espinor de Weyl levógiro \((1/2, 0)\) con las 2 componentes del espinor de Weyl dextrógiro \((0, 1/2)\). El término de masa \(m\bar{\psi}\psi\) acopla ambos.
✅ Verificación de comprensión: Menciona una consecuencia física de que el álgebra de Lorentz se descomponga en \(\mathfrak{su}(2) \oplus \mathfrak{su}(2)\).
Respuesta
Las representaciones del grupo de Lorentz se clasifican por el par de espines \(\mathfrak{su}(2)\) independientes \((j_+, j_-)\). Esto permite clasificar sistemáticamente los campos: escalar \((0,0)\), espinor de Weyl \((1/2, 0)\) o \((0, 1/2)\), espinor de Dirac \((1/2, 0) \oplus (0, 1/2)\), vector \((1/2, 1/2)\), etc.
5.3 Lagrangiano del campo de Dirac y preparación para la cuantización canónica¶
🟡 Lina: Ahora entremos en la preparación para cuantizar el campo de Dirac. Como aprendimos en Cap. 3, el primer paso de la cuantización de campos es escribir la densidad lagrangiana clásica.
🔵 Kai: En el caso del campo escalar, la estrategia era "elegir un lagrangiano tal que la ecuación de Euler-Lagrange dé la ecuación de Klein-Gordon". Pero la ecuación de Dirac es una ecuación diferencial de primer orden para un espinor de 4 componentes, así que la forma del lagrangiano debe ser bastante diferente.
🟡 Lina: Buena intuición. La estrategia es la misma — "elegir un lagrangiano tal que las ecuaciones de Euler-Lagrange den la ecuación de Dirac". Sin embargo, como bien dices, al ser una ecuación diferencial de primer orden, la estructura del lagrangiano es bastante diferente del campo escalar. La respuesta es:
🔵 Kai: ¿Qué es \(\bar{\psi}\)? ¿Es diferente de \(\psi^\dagger\)?
🟡 Lina: Buena pregunta. \(\bar{\psi}\) se llama el adjunto de Dirac (Dirac adjoint) y se define como
La razón de usar \(\psi^\dagger \gamma^0\) en vez de simplemente \(\psi^\dagger\) es que \(\bar{\psi}\psi\) sea un escalar de Lorentz (una cantidad invariante bajo transformaciones de Lorentz). Con \(\psi^\dagger \psi\) no se obtiene un escalar de Lorentz.
🔵 Kai: Entendí que \(\psi^\dagger \psi\) no da un escalar de Lorentz, pero ¿por qué al insertar \(\gamma^0\) funciona? ¿Tiene \(\gamma^0\) alguna propiedad especial?
🟡 Lina: Buena pregunta. Bajo una transformación de Lorentz (rotación o boost), el espinor de Dirac se transforma como \(\psi \to S\psi\). Aquí \(S\) es una matriz \(4 \times 4\) de transformación que depende de qué transformación de Lorentz se realiza. Para rotaciones, \(S\) es unitaria (\(S^\dagger S = \mathbf{1}\)), pero para boosts es no unitaria — es decir \(S^\dagger S \neq \mathbf{1}\). Por eso cuando \(\psi \to S\psi\), \(\psi^\dagger \psi \to \psi^\dagger S^\dagger S \psi \neq \psi^\dagger \psi\) y no es invariante.
En cambio, si insertamos \(\gamma^0\), \(\bar{\psi}\psi \to \psi^\dagger S^\dagger \gamma^0 S \psi\), y como propiedad de la representación espinorial se cumple \(S^\dagger \gamma^0 S = \gamma^0\). Por ahora basta con aceptar esta relación — los detalles de la derivación están en Apéndice B. Usando esta relación: \(\bar{\psi}\psi \to \psi^\dagger S^\dagger \gamma^0 S \psi = \psi^\dagger \gamma^0 \psi = \bar{\psi}\psi\), y es invariante de Lorentz. Es decir, \(\gamma^0\) compensa la no unitariedad de los boosts.
⚪ Mei: Entiendo, \(\psi^\dagger \psi\) se rompe bajo boosts, pero \(\psi^\dagger \gamma^0 \psi\) se mantiene invariante gracias a \(S^\dagger \gamma^0 S = \gamma^0\).
🟡 Lina: Exacto. Ahora confirmemos que de este lagrangiano realmente sale la ecuación de Dirac. Aquí hay una técnica. Como \(\psi\) es un campo complejo, tiene dos grados de libertad independientes: la parte real \(\psi_{\mathrm{Re}}\) y la parte imaginaria \(\psi_{\mathrm{Im}}\). En el principio variacional, lo básico era "escribir las ecuaciones de Euler-Lagrange para cada grado de libertad independiente". En vez de variar con respecto a \(\psi_{\mathrm{Re}}\) y \(\psi_{\mathrm{Im}}\), podemos tratar \(\psi\) y \(\bar{\psi} = \psi^\dagger \gamma^0\) (el hermítico conjugado de \(\psi\) multiplicado por \(\gamma^0\)) como variables independientes y obtenemos el mismo número de ecuaciones. Esto es simplemente un cambio de variables sin cambiar la física — igual que usar \(z = x + iy\), \(z^* = x - iy\) en vez de coordenadas \(x, y\). Variando respecto a \(\bar{\psi}\) se obtiene la ecuación de Dirac \((i\not\!\partial - m)\psi = 0\), y variando respecto a \(\psi\) su ecuación conjugada. Escribamos primero la ecuación de Euler-Lagrange respecto a \(\bar{\psi}\):
Mirando \(\mathcal{L} = \bar{\psi}(i\gamma^\mu \partial_\mu - m)\psi\), como \(\partial_\mu \bar{\psi}\) (la derivada de \(\bar{\psi}\)) no aparece en ninguna parte, el segundo término es cero. El primer término es "derivar" \(\mathcal{L}\) respecto a \(\bar{\psi}\) — precisamente derivar respecto a cada componente espinorial \(\bar{\psi}_\alpha\) (\(\alpha = 1, 2, 3, 4\)). Como \(\mathcal{L} = \bar{\psi}(i\gamma^\mu \partial_\mu - m)\psi = \sum_{\alpha=1}^{4} \bar{\psi}_\alpha [(i\gamma^\mu \partial_\mu - m)\psi]_\alpha\) (donde el índice \(\alpha\) recorre las 4 componentes del espinor) es lineal en cada \(\bar{\psi}_\alpha\) (solo está multiplicado en primer grado), al derivar respecto a \(\bar{\psi}_\alpha\) queda lo restante al quitar \(\bar{\psi}_\alpha\) — igual que al derivar \(y = ax\) respecto a \(x\) queda \(a\):
Estas son 4 ecuaciones para \(\alpha = 1, 2, 3, 4\), y escritas conjuntamente: \((i\gamma^\mu \partial_\mu - m)\psi = 0\) — ¡la ecuación de Dirac misma!
🔵 Kai: ¡Oh, con solo variar respecto a \(\bar{\psi}\) sale directamente la ecuación de Dirac! El lagrangiano está bien diseñado.
Momento conjugado — Gran diferencia con el campo escalar¶
🟡 Lina: Ahora calculemos el momento conjugado necesario para la cuantización canónica. El momento conjugado a \(\psi\) es
Expandiendo \(\mathcal{L} = \bar{\psi}(i\gamma^\mu \partial_\mu - m)\psi\), el término que contiene \(\dot{\psi} = \partial_0 \psi\) es solo el término con \(\mu = 0\): \(i\bar{\psi}\gamma^0 \partial_0 \psi\). Este término es lineal en \(\dot{\psi}\) (solo está multiplicado en primer grado), así que "derivar respecto a \(\dot{\psi}\)" es la operación de extraer el coeficiente de \(\dot{\psi}\) — igual que derivar \(f = a\dot{\psi}\) respecto a \(\dot{\psi}\) y que quede \(a\). Por lo tanto
Sustituyendo \(\bar{\psi} = \psi^\dagger \gamma^0\): \(\Pi = i\psi^\dagger (\gamma^0)^2 = i\psi^\dagger\). Aquí usamos \((\gamma^0)^2 = \mathbf{1}\) (resultado del álgebra de Clifford (5.1) con \(\mu = \nu = 0\)).
🔵 Kai: ¿Eh? ¿El momento conjugado es \(i\psi^\dagger\)? En el campo escalar era \(\pi = \dot{\phi}\), una cantidad independiente de \(\phi\)...
🟡 Lina: Sí, esta es una gran característica del campo de Dirac. Como la ecuación de Dirac es de primer orden en el tiempo, basta especificar \(\psi\) como condición inicial para determinar completamente la evolución temporal. \(\dot{\psi}\) no es un grado de libertad independiente. Que el momento conjugado se pueda escribir en términos de \(\psi^\dagger\) mismo es un reflejo de este hecho.
⚪ Mei: Es decir, en el campo escalar \(\phi\) y \(\dot{\phi}\) eran dos condiciones iniciales independientes, pero para el campo de Dirac basta con \(\psi\). Es natural si la ecuación es de primer orden.
Densidad hamiltoniana¶
🟡 Lina: Obtengamos la densidad hamiltoniana mediante la transformada de Legendre:
Expandiendo el lagrangiano como \(\mathcal{L} = i\bar{\psi}\gamma^0\partial_0\psi + i\bar{\psi}\gamma^j\partial_j\psi - m\bar{\psi}\psi\), como \(\bar{\psi}\gamma^0 = \psi^\dagger(\gamma^0)^2 = \psi^\dagger\), el primer término es \(i\psi^\dagger \dot{\psi}\). Esto es igual a \(\Pi\dot{\psi} = i\psi^\dagger \dot{\psi}\), así que en \(\mathcal{H} = \Pi\dot{\psi} - \mathcal{L}\) se cancela \(i\psi^\dagger\dot{\psi}\):
🔵 Kai: El término con derivada temporal se cancela, y solo quedan la derivada espacial y el término de masa.
🟡 Lina: Así es. Sustituyendo \(\bar{\psi} = \psi^\dagger\gamma^0\): \(\bar{\psi}\gamma^j = \psi^\dagger\gamma^0\gamma^j\) y \(m\bar{\psi}\psi = m\psi^\dagger\gamma^0\psi\), así que
Definiendo \(\boldsymbol{\gamma} \cdot \nabla \equiv \gamma^1\partial_1 + \gamma^2\partial_2 + \gamma^3\partial_3 = \gamma^j\partial_j\), como ambos términos tienen \(\psi^\dagger\) (vector fila \(1 \times 4\)) a la izquierda y \(\psi\) (vector columna \(4 \times 1\)) a la derecha, podemos agrupar la matriz \(4 \times 4\) que queda entre ellos:
Aquí simplemente agrupamos la matriz \(4 \times 4\) entre \(\psi^\dagger\) (vector fila \(1 \times 4\)) y \(\psi\) (vector columna \(4 \times 1\)) — la forma de producto matricial \(\psi^\dagger M \psi\).
Alternativamente, expandiendo la ecuación de Dirac \((i\gamma^\mu\partial_\mu - m)\psi = 0\): \(i\gamma^0\partial_0\psi = -i\gamma^j\partial_j\psi + m\psi\). Multiplicando por \(\gamma^0\) por la izquierda (usando \((\gamma^0)^2 = \mathbf{1}\)): \(i\partial_0\psi = (-i\gamma^0\boldsymbol{\gamma}\cdot\nabla + m\gamma^0)\psi\). Esto es exactamente lo que está dentro del paréntesis en (5.9), así que para campos que satisfacen la ecuación de movimiento (esta situación se llama "en la capa de masa" (on-shell) — el estado en que el campo satisface la ecuación de movimiento):
se escribe de forma simple. En la cuantización usaremos la imagen de Heisenberg, así que los operadores de campo satisfacen la ecuación de movimiento (ecuación de Dirac) — la misma estructura que el campo escalar satisfaciendo la ecuación de Klein-Gordon en Cap. 4. Por eso es válido usar esta expresión.
✅ Verificación de comprensión: Indica en qué se diferencia esencialmente el momento conjugado del campo de Dirac del caso del campo escalar.
Respuesta
En el campo escalar \(\pi = \dot{\phi}\), y \(\phi\) y \(\dot{\phi}\) son variables independientes. En el campo de Dirac \(\Pi = i\psi^\dagger\), y el momento conjugado se escribe directamente en términos del conjugado complejo del campo \(\psi\). Esto es un reflejo de que la ecuación de Dirac es de primer orden en el tiempo.
5.4 Intentemos cuantizar con relaciones de conmutación — Y la catástrofe¶
🟡 Lina: Bien, ahora sí, ¡a cuantizar! Siguiendo el mismo procedimiento que en Cap. 4, promovemos el campo \(\psi\) y el momento conjugado \(\psi^\dagger\) a operadores.
Primero, intentemos deliberadamente imponer relaciones de conmutación como en el campo escalar. ¿Por qué "deliberadamente"? Porque quiero que experimenten que esto está mal.
🔵 Kai: ¿Vamos a hacer primero el error?
🟡 Lina: La mejor forma de entender "por qué son necesarias las relaciones de anticonmutación" es ver concretamente "qué se rompe con las relaciones de conmutación".
Expansión en modos¶
🟡 Lina: Primero, expandamos el campo en las soluciones de onda plana de la ecuación de Dirac. La relación relativista entre energía y momento \(E^2 = |\boldsymbol{p}|^2 + m^2\) admite dos soluciones: \(E = +\sqrt{|\boldsymbol{p}|^2 + m^2}\) y \(E = -\sqrt{|\boldsymbol{p}|^2 + m^2}\). La ecuación de Dirac también tiene estos dos tipos de soluciones — soluciones de energía positiva \(u^s(\boldsymbol{p})e^{-ip \cdot x}\) (\(p^0 = E_{\boldsymbol{p}} > 0\)) y soluciones de energía negativa \(v^s(\boldsymbol{p})e^{+ip \cdot x}\). La solución general es una superposición de ambas:
Aquí adoptamos la convención de medida de integración \(\int \frac{d^3p}{(2\pi)^3}\) (en Cap. 4 usamos \(\int \frac{d^3p}{(2\pi)^{3/2}}\), pero esta convención es más conveniente para organizar los factores de \((2\pi)\) al calcular amplitudes de dispersión en capítulos posteriores, así que a partir de este capítulo unificamos con esta convención. Al citar resultados de Cap. 4, ten cuidado con esta diferencia). La diferencia de convención solo cambia dónde aparecen los factores de \((2\pi)\), sin afectar los resultados físicos (probabilidades y secciones eficaces). Es como medir longitudes en "metros" o en "centímetros" — los números cambian pero la física es la misma. Concretamente, en la convención de Cap. 4 el lado derecho de las relaciones de conmutación era \(\delta^{(3)}(\boldsymbol{p} - \boldsymbol{q})\), pero en la convención de este capítulo es \((2\pi)^3\delta^{(3)}(\boldsymbol{p} - \boldsymbol{q})\). Igualmente, la normalización de estados de una partícula cambia a \(\langle\boldsymbol{p}|\boldsymbol{q}\rangle = (2\pi)^3\delta^{(3)}(\boldsymbol{p} - \boldsymbol{q})\). Esto no es más que la diferencia entre absorber el \((2\pi)^3\) de la medida de integración en la normalización de los operadores, o dejarlo en el lado derecho de las relaciones de (anti)conmutación. De acuerdo con este cambio de convención, observa que en las relaciones de (anti)conmutación del campo que siguen también aparece \((2\pi)^3\) en el lado derecho.
Tomando el hermítico conjugado de ambos miembros de (5.11), los operadores se intercambian \(\hat{b}^s \to \hat{b}^{s\dagger}\), \(\hat{c}^{s\dagger} \to \hat{c}^s\), los espinores \(u^s \to u^{s\dagger}\), \(v^s \to v^{s\dagger}\), y las exponenciales cambian de signo \((e^{-ip\cdot x})^* = e^{+ip\cdot x}\), \((e^{+ip\cdot x})^* = e^{-ip\cdot x}\). Multiplicando además por \(\gamma^0\) por la derecha, \(u^{s\dagger}\gamma^0 = \bar{u}^s\), \(v^{s\dagger}\gamma^0 = \bar{v}^s\) (definición de adjunto de Dirac). El resultado es
Aquí:
- \(E_{\boldsymbol{p}} = \sqrt{|\boldsymbol{p}|^2 + m^2}\)
-
\(s = 1, 2\) son los grados de libertad de espín (arriba/abajo) Confirmemos la notación. \(p \cdot x \equiv p^\mu x_\mu = E_{\boldsymbol{p}}t - \boldsymbol{p}\cdot\boldsymbol{x}\) es la notación del producto interno de 4-vectores introducida en Cap. 4 (correspondiente a la convención de signos de la métrica \((+,-,-,-)\) de Cap. 2). \(\not\!p \equiv \gamma^\mu p_\mu = \gamma^0 E_{\boldsymbol{p}} - \boldsymbol{\gamma}\cdot\boldsymbol{p}\) es la versión de momento de la notación slash.
-
\(u^s(\boldsymbol{p})\): espinor de energía positiva — sustituyendo la solución de onda plana \(\psi = u\, e^{-ip \cdot x}\) en la ecuación de Dirac, como \(\partial_\mu e^{-ip\cdot x} = -ip_\mu\, e^{-ip\cdot x}\), la ecuación de Dirac se convierte en \((\not\!p - m)u\,e^{-ip\cdot x} = 0\), y dividiendo por \(e^{-ip\cdot x} \neq 0\):
Esta es la ecuación que satisface \(u^s\). Para cada momento \(\boldsymbol{p}\) hay 2 soluciones independientes \(u^1, u^2\) correspondientes a los 2 grados de libertad de espín. La forma concreta depende de la representación elegida para las matrices \(\gamma\), pero para la discusión actual basta saber que "hay 2 espinores de 4 componentes que satisfacen \((\not\!p - m)u = 0\)". Para tener una imagen, veamos solo el caso del sistema en reposo \(\boldsymbol{p} = \boldsymbol{0}\): \(\not\!p = \gamma^0 m\) así que la ecuación es \((\gamma^0 - 1)m\,u = 0\), es decir \(\gamma^0 u = u\). En la representación quiral, \(\gamma^0\) es una matriz que intercambia las 2 componentes superiores con las inferiores, así que \(u^1\) y \(u^2\) son espinores donde las 2 componentes superiores son iguales a las inferiores. Para la forma concreta con \(\boldsymbol{p}\) general, consulta Apéndice B. - \(v^s(\boldsymbol{p})\): espinor de energía negativa (nombre histórico. Como veremos después, en la teoría cuántica de campos \(\hat{c}^\dagger\) crea una antipartícula de energía positiva, así que "energía negativa" es solo un nombre de clasificación como solución de la ecuación clásica).
Aquí hay una convención importante: mantenemos $p^0 = E_{\boldsymbol{p}} > 0$ sin cambiar, y ponemos el signo de la exponencial como $e^{+ip\cdot x}$. La razón es que en la expansión en modos la integral sobre momento $\boldsymbol{p}$ va de $-\infty$ a $+\infty$, así que fijar $p^0 = E_{\boldsymbol{p}} > 0$ hace que la estructura de la integral quede más limpia.
La dependencia temporal es $e^{+iE_{\boldsymbol{p}}t}$. Como aprendimos en mecánica cuántica, la dependencia temporal de un estado estacionario con energía $E$ es $e^{-iEt}$ (en unidades naturales). Reescribiendo $e^{+iE_{\boldsymbol{p}}t} = e^{-i(-E_{\boldsymbol{p}})t}$, esto corresponde formalmente a una solución con energía $-E_{\boldsymbol{p}}$ — por eso se llama "solución de energía negativa".
Derivemos la ecuación que satisface $v^s$. Sustituyamos $\psi = v\, e^{+ip \cdot x}$ en la ecuación de Dirac $(i\gamma^\mu\partial_\mu - m)\psi = 0$. Como $v$ es un espinor constante, la derivada actúa solo sobre $e^{+ip\cdot x}$: $\partial_\mu e^{+ip\cdot x} = (+ip_\mu)\,e^{+ip\cdot x}$. Sustituyendo:
Aquí, el primer \(i\) es el \(i\) que ya estaba en el operador \(i\gamma^\mu\partial_\mu\) de la ecuación de Dirac, y el \((+ip_\mu)\) con su \(i\) viene de la derivada. Multiplicando los dos \(i\): \(i \times i = i^2 = -1\). El resto \(\gamma^\mu p_\mu\) es \(\not\!p\) en notación slash:
La ecuación de Dirac completa es \((i\gamma^\mu\partial_\mu - m)\psi = 0\), así que sustituyendo \(\psi = v\,e^{+ip\cdot x}\): \((i\gamma^\mu\partial_\mu - m)(v\,e^{+ip\cdot x}) = 0\). El primer término del lado izquierdo es lo que acabamos de calcular \(-\not\!p\, v\, e^{+ip\cdot x}\), y el segundo es \(-m\,v\,e^{+ip\cdot x}\). Sumando: \((-\not\!p - m)v\,e^{+ip\cdot x} = 0\). Multiplicando ambos miembros por \(-1\): \((\not\!p + m)v\,e^{+ip\cdot x} = 0\). Dividiendo por \(e^{+ip\cdot x} \neq 0\):
🔵 Kai: \(u\) satisface \((\not\!p - m)u = 0\) y \(v\) satisface \((\not\!p + m)v = 0\) — ¡el signo del término de masa es opuesto!
🟡 Lina: Exacto. Estos espinores satisfacen relaciones de ortogonalidad y completitud. Los detalles los explicaré cuando los usemos, pero aquí menciono un hecho importante: los 4 espinores \(u^1, u^2, v^1, v^2\) forman una base completa del espacio de 4 dimensiones. Es decir, cualquier espinor de 4 componentes se puede escribir como combinación lineal de estos 4. La forma concreta de las relaciones de completitud es
El lado derecho es una matriz \(4 \times 4\) de la forma \(\not\!p \pm m\) porque \(u\bar{u}\) es un "vector columna × vector fila" que produce una matriz — por ejemplo en 2 componentes, \(\begin{pmatrix} a \\ b \end{pmatrix}(c\ d) = \begin{pmatrix} ac & ad \\ bc & bd \end{pmatrix}\), el producto de un vector columna por un vector fila es una matriz. Lo mismo ocurre con 4 componentes. Por qué el lado derecho tiene esta forma específica se entiende a partir de que \(u^s\) satisface \((\not\!p - m)u^s = 0\) — \(\not\!p + m\) juega el papel de "operador de proyección sobre el subespacio bidimensional donde vive \(u\)" (dividiendo por \(2m\) se obtiene exactamente el proyector \((\not\!p + m)/(2m)\)). Igualmente \(-(\not\!p - m)/(2m)\) es el proyector sobre el subespacio de \(v\). Observa que en \(u\bar{u}\) y \(v\bar{v}\) el signo del término de masa es opuesto (\(+m\) y \(-m\)). Esto se usará repetidamente en cálculos posteriores.
Tabla 5.2: Operadores que aparecen en la expansión en modos del campo de Dirac
| Operador | Rol | Posición en \(\hat{\psi}\) | Signo de energía |
|---|---|---|---|
| \(\hat{b}^s_{\boldsymbol{p}}\) | Aniquilación de partícula | Término de energía positiva | \(e^{-ip\cdot x}\) |
| \(\hat{b}^{s\dagger}_{\boldsymbol{p}}\) | Creación de partícula | (en \(\hat{\bar{\psi}}\)) | \(e^{+ip\cdot x}\) |
| \(\hat{c}^s_{\boldsymbol{p}}\) | Aniquilación de antipartícula | (en \(\hat{\bar{\psi}}\)) | \(e^{-ip\cdot x}\) |
| \(\hat{c}^{s\dagger}_{\boldsymbol{p}}\) | Creación de antipartícula | Término de energía negativa | \(e^{+ip\cdot x}\) |
🔵 Kai: En el campo escalar real solo había un par \(\hat{a}\) y \(\hat{a}^\dagger\), pero ahora hay dos pares \(\hat{b}\) y \(\hat{c}\). ¿Por qué coexisten en \(\hat{\psi}\) un operador de aniquilación \(\hat{b}\) y un operador de creación \(\hat{c}^\dagger\)?
🟡 Lina: Buena pregunta. Como el campo de Dirac describe tanto partículas como antipartículas, se necesitan 2 pares. Es la misma razón por la que en el campo escalar complejo de Cap. 4 se necesitaban 2 pares \(\hat{a}\) (partícula) y \(\hat{b}\) (antipartícula). Que \(\hat{c}^\dagger\) (operador de creación de antipartícula) esté dentro de \(\hat{\psi}\) también tiene la misma estructura que el campo escalar complejo — el operador de campo o bien "aniquila una partícula" o bien "crea una antipartícula".
Imponer relaciones de conmutación — Un signo ominoso¶
🟡 Lina: Ahora impongamos relaciones de conmutación a tiempos iguales como en el campo escalar. Para el campo escalar era \([\hat{\phi}(\boldsymbol{x}), \hat{\pi}(\boldsymbol{y})] = i\delta^{(3)}(\boldsymbol{x} - \boldsymbol{y})\). Para el campo de Dirac, como el momento conjugado es \(\Pi_\alpha = i\psi^\dagger_\alpha\), sustituyendo \(\hat{\Pi}_\beta = i\hat{\psi}^\dagger_\beta\) en la relación de conmutación canónica \([\hat{\psi}_\alpha(\boldsymbol{x}), \hat{\Pi}_\beta(\boldsymbol{y})] = i\delta_{\alpha\beta}\delta^{(3)}(\boldsymbol{x} - \boldsymbol{y})\): \([\hat{\psi}_\alpha, i\hat{\psi}^\dagger_\beta] = i\delta_{\alpha\beta}\delta^{(3)}\). La constante \(i\) sale fuera del conmutador (\([A, cB] = c[A, B]\)): \(i[\hat{\psi}_\alpha, \hat{\psi}^\dagger_\beta] = i\delta_{\alpha\beta}\delta^{(3)}\). Dividiendo por \(i\): \([\hat{\psi}_\alpha, \hat{\psi}^\dagger_\beta] = \delta_{\alpha\beta}\delta^{(3)}\). Esta es la relación de conmutación en el espacio de posiciones. Observa que no hay \((2\pi)^3\) en el lado derecho. Como la medida de integración en la expansión en modos es \(\int \frac{d^3p}{(2\pi)^3}\), al traducir \(\delta^{(3)}(\boldsymbol{x} - \boldsymbol{y})\) del espacio de posiciones al espacio de momentos mediante transformada de Fourier, el \((2\pi)^3\) de la medida de integración se traslada al lado derecho de la relación de conmutación dando la forma \((2\pi)^3\delta^{(3)}(\boldsymbol{p} - \boldsymbol{q})\) (véase la ecuación (5.15)). Así que escribimos la relación de conmutación entre \(\hat{\psi}\) y \(\hat{\psi}^\dagger\):
Aquí \(\alpha, \beta = 1, 2, 3, 4\) son las componentes del espinor de Dirac. Traduzcamos estas relaciones de conmutación del campo a relaciones de conmutación de operadores de creación y aniquilación usando la expansión en modos (5.11).
🟡 Lina: Al sustituir la expansión en modos en el lado izquierdo de (5.13), aparecen productos de \(e^{\pm ip \cdot x}\) y \(e^{\pm iq \cdot y}\). Usando la integral espacial \(\int d^3x\, e^{i(\boldsymbol{p} - \boldsymbol{q})\cdot\boldsymbol{x}} = (2\pi)^3\delta^{(3)}(\boldsymbol{p} - \boldsymbol{q})\) para igualar momentos, los términos de \(\hat{b}\) y \(\hat{c}\) se separan. El punto clave es que dentro de \(\hat{\psi}\) está \(\hat{c}^\dagger\), y dentro de \(\hat{\psi}^\dagger\) está \(\hat{c}\) (mira de nuevo la ecuación (5.11)). Así que al calcular \([\hat{\psi}, \hat{\psi}^\dagger]\), el término de \(\hat{c}\) aparece en el orden \([\hat{c}^{s\dagger}_{\boldsymbol{p}},\, \hat{c}^s_{\boldsymbol{p}}]\) — es decir, con el operador de creación primero.
🔵 Kai: Ah, como \([\hat{c}^\dagger, \hat{c}] = -[\hat{c}, \hat{c}^\dagger]\), tiene signo opuesto al término de \(\hat{b}\).
🟡 Lina: Exacto. Aquí usamos la "ortogonalidad de espinores". Esta es la propiedad de que los productos internos de espinores con diferentes estados de espín son cero — la misma estructura que \(\langle +|-\rangle = 0\) en mecánica cuántica. Concretamente, \(u^{r\dagger}(\boldsymbol{p})\,u^s(\boldsymbol{p}) \propto \delta^{rs}\) (cero para espines diferentes \(r \neq s\)), \(u^{r\dagger}(\boldsymbol{p})\,v^s(\boldsymbol{p}) = 0\) (espinores de energía positiva y negativa son ortogonales). Usando esto y organizando, el lado izquierdo de (5.13) tiene la estructura
🔵 Kai: Entiendo que el segundo término sale con el orden \([\hat{c}^{s\dagger}, \hat{c}^s]\). Pero, ¿por qué esto termina poniendo un signo menos a \([\hat{c}, \hat{c}^\dagger]\)?
🟡 Lina: Para comparar el lado izquierdo con el lado derecho \(\delta_{\alpha\beta}\,\delta^{(3)}(\boldsymbol{x} - \boldsymbol{y})\), necesitamos ponerlos en la misma forma. Te explico solo el punto esencial.
En el lado izquierdo hay un término de \(\hat{b}\) y un término de \(\hat{c}\). El término de \(\hat{b}\) sale directamente con la forma \([\hat{b}, \hat{b}^\dagger]\). En cambio, el término de \(\hat{c}\) aparece en el orden \([\hat{c}^{s\dagger}, \hat{c}^s]\), así que al reordenarlo: \([\hat{c}^{s\dagger}, \hat{c}^s] = -[\hat{c}^s, \hat{c}^{s\dagger}]\) — sale un signo menos.
Por otro lado, necesitamos expandir el lado derecho \(\delta_{\alpha\beta}\,\delta^{(3)}(\boldsymbol{x} - \boldsymbol{y})\) en el espacio de momentos. Como estamos tratando \([\hat{\psi}, \hat{\psi}^\dagger]\), lo que aparece en la expansión en modos de \(\hat{\psi}^\dagger\) es \(u^{s\dagger}\) y \(v^{s\dagger}\) (hermíticos conjugados). Esto es diferente de \(\bar{u}^s = u^{s\dagger}\gamma^0\) (adjunto de Dirac) — \(u\bar{u}\) es una matriz \(4 \times 4\) covariante de Lorentz, pero \(uu^\dagger\) es simplemente la matriz formada por vector columna × vector fila. Necesitamos descomponer el lado derecho usando relaciones de completitud. Los detalles técnicos los dejo para el ejercicio Problema M-1. Fallo de la cuantización mediante relaciones de conmutación, pero la conclusión es: los 4 espinores \(u^1, u^2, v^1, v^2\) forman una base completa del espacio de 4 dimensiones (análogo de la relación de completitud \(\sum_n |n\rangle\langle n| = \hat{1}\) de mecánica cuántica). Usando esta relación de completitud para descomponer \(\delta_{\alpha\beta}\,\delta^{(3)}(\boldsymbol{x} - \boldsymbol{y})\) del lado derecho en contribución de \(u\) y contribución de \(v\), ambas aparecen con coeficientes positivos. Es decir, el lado derecho tiene la estructura "parte de \(u\) = positiva" + "parte de \(v\) = positiva".
Comparando término a término los lados izquierdo y derecho (por las relaciones de completitud de \(u\) y \(v\), la \(\delta_{\alpha\beta}\delta^{(3)}\) del lado derecho se descompone con coeficientes positivos en las contribuciones de \(u\) y \(v\) respectivamente):
- Término de \(\hat{b}\) (corresponde a \(u\)): \([\hat{b}, \hat{b}^\dagger] = +\delta\) → consistente ✓
- Término de \(\hat{c}\) (corresponde a \(v\)): \(-[\hat{c}, \hat{c}^\dagger] = +\delta\) → se necesita \([\hat{c}, \hat{c}^\dagger] = -\delta\) ✗
¡Este \(-\delta\) es el signo menos fatal! Resumiendo el punto: en \(\hat{\psi}\), el término de energía positiva contiene el operador de aniquilación \(\hat{b}\), y el término de energía negativa contiene el operador de creación \(\hat{c}^\dagger\). Debido a esta estructura asimétrica, al tomar el conmutador, solo el término de \(\hat{c}\) aparece en orden inverso \([\hat{c}^\dagger, \hat{c}]\), siendo la raíz del signo menos. Los detalles técnicos incluyendo la derivación de las relaciones de completitud se tratan en el ejercicio Problema M-1. Fallo de la cuantización mediante relaciones de conmutación.
🔵 Kai: Entiendo... es decir, como \(\hat{c}^\dagger\) (operador de creación) está dentro de \(\hat{\psi}\), al calcular \([\hat{\psi}, \hat{\psi}^\dagger]\) el término de \(\hat{c}\) sale en orden \(\hat{c}^\dagger\hat{c}\) — con la creación primero. Pero, ¿por qué en la expansión en modos el término de energía positiva contiene el operador de aniquilación \(\hat{b}\) y el de energía negativa el operador de creación \(\hat{c}^\dagger\)? ¿No podría ser al revés?
🟡 Lina: Buena pregunta. Eso viene de que la condición "la aniquilación destruye el vacío" \(\hat{b}|0\rangle = \hat{c}|0\rangle = 0\), junto con la correcta dependencia temporal del operador de campo, hacen que esta combinación sea la única opción. El término de \(\hat{b}\) va con \(e^{-ip\cdot x}\) (frecuencia positiva) y el de \(\hat{c}^\dagger\) con \(e^{+ip\cdot x}\) (frecuencia negativa) — así \(\hat{\psi}\) satisface la ecuación de Dirac y al mismo tiempo el vacío es el estado de mínima energía. El resultado es:
🔵 Kai: ¡¿Eh?! ¡Hay un signo menos delante de \([\hat{c}, \hat{c}^\dagger]\)!
🟡 Lina: Sí. Y eso es fatal. Veamos qué problema físico causa este signo menos.
✅ Verificación de comprensión: ¿Cuál es el origen del signo menos que aparece en \([\hat{c}, \hat{c}^\dagger]\) en la ecuación (5.15b)?
Respuesta
En la expansión en modos (5.11), el término de energía negativa de \(\hat{\psi}\) contiene \(\hat{c}^\dagger\) (operador de creación), así que al calcular \([\hat{\psi}, \hat{\psi}^\dagger]\) el término de \(\hat{c}\) aparece en el orden \([\hat{c}^{s\dagger}, \hat{c}^s] = -[\hat{c}^s, \hat{c}^{s\dagger}]\). Por otro lado, al expandir la \(\delta\) del lado derecho usando las relaciones de completitud de los espinores, la contribución de \(v\) aparece con coeficiente positivo. Comparando ambos lados se necesita \([\hat{c}, \hat{c}^\dagger] = -\delta\).
🔵 Kai: Bien, entiendo la estructura. Pero, ¿qué problema físico causa este signo menos? Si solo cambia un signo matemáticamente, quizá no sea tan grave...
🟡 Lina: Buena pregunta. "Solo un signo" resulta ser fatal. Vamos a verlo ahora.
Cálculo del hamiltoniano — Energía sin cota inferior¶
🟡 Lina: Veamos qué desastre causa físicamente este signo menos. Sustituyamos la expansión en modos en el hamiltoniano.
Sustituyendo la expansión en modos en \(\hat{H} = \int d^3x\, \hat{\psi}^\dagger\, i\partial_0\, \hat{\psi}\) y organizando (el cálculo intermedio es algo largo, pero hay tres puntos clave. Primero, cuando \(i\partial_0\) actúa sobre la solución de energía positiva \(e^{-ip\cdot x}\) produce \(i \times (-iE_{\boldsymbol{p}}) = +E_{\boldsymbol{p}}\), y sobre la solución de energía negativa \(e^{+ip\cdot x}\) produce \(i \times (+iE_{\boldsymbol{p}}) = -E_{\boldsymbol{p}}\) — este \(-E_{\boldsymbol{p}}\) es la causa directa del signo menos del término de \(\hat{c}\) en (5.16). Segundo, al expandir el producto \(\hat{\psi}^\dagger\) y \(\hat{\psi}\) aparecen 4 tipos de términos \(\hat{b}^\dagger\hat{b}\), \(\hat{c}\hat{c}^\dagger\), \(\hat{b}^\dagger\hat{c}^\dagger\), \(\hat{c}\hat{b}\), pero los términos cruzados (\(\hat{b}^\dagger\hat{c}^\dagger\) y \(\hat{c}\hat{b}\)) contienen exponenciales de momentos distintos \(e^{\pm i(\boldsymbol{p}+\boldsymbol{q})\cdot\boldsymbol{x}}\) y se anulan con la integral espacial \(\int d^3x\) (también se usa la ortogonalidad de espinores \(u^\dagger v = 0\)). Tercero, el orden \(\hat{c}\hat{c}^\dagger\) que queda — el \(\hat{c}\) de \(\hat{\psi}^\dagger\) y el \(\hat{c}^\dagger\) de \(\hat{\psi}\) se multiplican, con el operador de creación a la derecha — este orden será relevante al reordenar en el siguiente paso. Los detalles están en el ejercicio Problema M-1. Fallo de la cuantización mediante relaciones de conmutación):
🔵 Kai: El término \(\hat{c}\hat{c}^\dagger\) tiene un signo menos. Si lo reordenamos con la relación de conmutación...
🟡 Lina: Usando la relación de conmutación (5.15b) para reescribir \(\hat{c}\hat{c}^\dagger = \hat{c}^\dagger\hat{c} + [\hat{c}, \hat{c}^\dagger]\):
Como \([\hat{c}, \hat{c}^\dagger] = -(2\pi)^3\delta^{(3)}(\boldsymbol{0})\):
Eliminando el término constante infinito con orden normal como en el campo escalar, el hamiltoniano es
🔵 Kai: Hay un signo menos delante de \(\hat{c}^\dagger\hat{c}\)... ¡eso significa que cada vez que se crea una antipartícula la energía baja!
🟡 Lina: Así es. Cada vez que \(\hat{c}^{s\dagger}_{\boldsymbol{p}}\) crea una antipartícula, la energía cambia en \(-E_{\boldsymbol{p}}\). Como se pueden crear ilimitadas antipartículas, la energía puede bajar indefinidamente — no está acotada inferiormente (unbounded below).
⚪ Mei: Es decir, no existe un estado de vacío estable. Se pueden crear estados con energía arbitrariamente baja. Esto es físicamente inaceptable.
🟡 Lina: Exactamente. Cuantizar el campo de Dirac con relaciones de conmutación lleva a una teoría que colapsa. Esta es la razón de "experimentar deliberadamente el error". En Fig. 5.2「Comparación del espectro de energía con relaciones de conmutación y anticonmutación」 comparo visualmente esta diferencia (el resultado con relaciones de anticonmutación se deriva en la siguiente sección, pero anticipo la conclusión para hacer la comparación).
Fig. 5.2: Comparación del espectro de energía con relaciones de conmutación y anticonmutación. Con relaciones de conmutación, cada antipartícula creada disminuye la energía hacia \(E \to -\infty\) (no hay vacío estable). Con relaciones de anticonmutación la energía es definida positiva (derivado en 5.5「Introducción de relaciones de anticonmutación — La receta que lo salva todo」) y cada estado admite como máximo 1 partícula (derivado en 5.6「El principio de exclusión de Pauli — Un regalo de las relaciones de anticonmutación」).
✅ Verificación de comprensión: Cuando el campo de Dirac se cuantiza con relaciones de conmutación, explica por qué la energía del hamiltoniano no está acotada inferiormente, refiriéndote a la ecuación (5.17). Incluye en tu respuesta qué significa que "no exista un estado de vacío estable".
Respuesta
En la ecuación (5.17), hay un signo menos delante de \(\hat{c}^{s\dagger}_{\boldsymbol{p}}\hat{c}^s_{\boldsymbol{p}}\), así que cuanto más crece el operador número de antipartículas \(\hat{N}_c = \hat{c}^\dagger\hat{c}\), más baja la energía. Con relaciones de conmutación los valores propios de \(\hat{N}_c\) son \(0, 1, 2, \ldots\) sin límite superior, así que la energía baja hasta \(-\infty\). Por lo tanto no se puede definir un estado de mínima energía (vacío) del que no se pueda bajar más, y no existe un vacío estable.
5.5 Introducción de relaciones de anticonmutación — La receta que lo salva todo¶
🟡 Lina: Las relaciones de conmutación fallaron. Entonces, ¿qué hacer? La respuesta es: imponer relaciones de anticonmutación en vez de relaciones de conmutación.
Aquí \(\{A, B\} \equiv AB + BA\) es el anticonmutador.
🔵 Kai: ¿Solo cambiar el menos del conmutador \([A, B] = AB - BA\) por un más? ¿Ese cambio tan simple resuelve el problema del signo menos de \([\hat{c}^\dagger, \hat{c}]\)?
🟡 Lina: Es solo un cambio de signo, pero todo cambia. Veámoslo concretamente. Traduzcamos las relaciones de anticonmutación del campo (5.18) a la expansión en modos. La estructura del cálculo es exactamente la misma que con relaciones de conmutación (ecuación (5.13) → (5.15a,b)) — la única diferencia es que \([A, B] = AB - BA\) se convierte en \(\{A, B\} = AB + BA\). El término de \(v\) aparece de nuevo en el orden \(\{\hat{c}^{s\dagger}, \hat{c}^s\}\), pero el anticonmutador es simétrico \(\{A, B\} = \{B, A\}\), así que \(\{\hat{c}^{s\dagger}, \hat{c}^s\} = \{\hat{c}^s, \hat{c}^{s\dagger}\}\) — ¡no sale signo menos al reordenar! El resultado es:
Todo lo demás es cero:
⚪ Mei: ¡La relación de anticonmutación de \(\hat{c}\) (5.20b) no tiene signo menos! ¡El ominoso signo menos que había con relaciones de conmutación (5.15b) ha desaparecido!
🟡 Lina: Exacto. Veamos por qué desaparece el signo menos, contrastando con el caso de relaciones de conmutación.
Con relaciones de conmutación: al calcular \([\hat{\psi}, \hat{\psi}^\dagger]\), el término de \(v\) aparece en el orden \([\hat{c}^{s\dagger}, \hat{c}^s]\). Al reordenarlo: \([\hat{c}^{s\dagger}, \hat{c}^s] = -[\hat{c}^s, \hat{c}^{s\dagger}]\) — sale un signo menos.
Con relaciones de anticonmutación: al calcular \(\{\hat{\psi}, \hat{\psi}^\dagger\}\), igualmente el término de \(v\) aparece en el orden \(\{\hat{c}^{s\dagger}, \hat{c}^s\}\). Pero el anticonmutador es simétrico \(\{A, B\} = \{B, A\}\), así que \(\{\hat{c}^{s\dagger}, \hat{c}^s\} = \{\hat{c}^s, \hat{c}^{s\dagger}\}\) — al intercambiar el orden no sale signo menos.
🔵 Kai: ¡Entiendo! El conmutador es antisimétrico \([A, B] = -[B, A]\) así que al reordenar sale un menos, pero el anticonmutador es simétrico \(\{A, B\} = \{B, A\}\) así que no sale menos — ¡esa es la diferencia decisiva!
🟡 Lina: Esa diferencia es decisiva. Por eso el término de \(v\) también tiene \(\{\hat{c}, \hat{c}^\dagger\}\) con coeficiente positivo, y no surge signo menos en (5.20b). Veamos cómo se refleja este efecto en el hamiltoniano con el recálculo siguiente.
Recálculo del hamiltoniano — La energía se vuelve definida positiva¶
🟡 Lina: Recalculemos el hamiltoniano. La ecuación (5.16)
no cambia. Lo que cambia es que al reordenar \(\hat{c}\hat{c}^\dagger\) usamos la relación de anticonmutación. Con relaciones de conmutación teníamos \([A, B] = AB - BA\) que se transforma en \(AB = BA + [A, B]\) (conectados por \(+\)), pero con relaciones de anticonmutación \(\{A, B\} = AB + BA\) se transforma en \(AB = -BA + \{A, B\}\) (conectados por \(-\)) — esta diferencia de signo es decisiva:
\(\{\hat{c}, \hat{c}^\dagger\} = (2\pi)^3\delta^{(3)}(\boldsymbol{0})\) (¡ahora con signo positivo!), así que
🔵 Kai: ¡Oh, el menos original y el menos del reordenamiento se cancelan, y delante de \(\hat{c}^\dagger\hat{c}\) queda un signo positivo!
🟡 Lina: \((2\pi)^3\delta^{(3)}(\boldsymbol{0})\) es una constante divergente en el límite de volumen \(V \to \infty\), igual que en Cap. 4. El orden normal para fermiones, al igual que para bosones, es la operación de "poner los operadores de creación a la izquierda de los de aniquilación y descartar los números c que surgen en el proceso", pero con una diferencia — cada vez que se intercambian operadores fermiónicos se añade un signo menos (reflejo de la relación de anticonmutación). En el caso actual, solo reordenamos \(\hat{c}\hat{c}^\dagger\) a \(\hat{c}^\dagger\hat{c}\), y descartando el término constante:
⚪ Mei: ¡El menos se convirtió en más! ¡Tanto partículas como antipartículas contribuyen positivamente a la energía!
🔵 Kai: Lo que se muestra en el lado derecho de Fig. 5.2「Comparación del espectro de energía con relaciones de conmutación y anticonmutación」 — "con relaciones de anticonmutación la energía es definida positiva" — ¡es exactamente esta ecuación (5.21)! Pero espera, eliminar la constante infinita con orden normal es la misma receta que con bosones. ¿Se puede justificar igual para fermiones?
🟡 Lina: Buena pregunta. La justificación física del orden normal es la misma que para bosones — la receta de "definir la energía del vacío como cero". Como lo observable son solo las diferencias de energía, sumar o restar una constante al total no cambia la física. La misma lógica se aplica para fermiones.
🔵 Kai: Entiendo, "el punto cero absoluto de energía no se puede medir", así que tomamos el vacío como referencia y solo los incrementos respecto a él son cantidades físicas — la misma idea tanto para bosones como para fermiones.
🟡 Lina: Bien, como \(E_{\boldsymbol{p}} > 0\) y los valores propios de los operadores número \(\hat{b}^\dagger\hat{b}\) y \(\hat{c}^\dagger\hat{c}\) son no negativos, el hamiltoniano es definido positivo. Existe un vacío estable \(|0\rangle\) (\(\hat{b}|0\rangle = \hat{c}|0\rangle = 0\)). Resumiendo lo que ocurrió: al reordenar \(-\hat{c}\hat{c}^\dagger\) de (5.16), la fórmula de anticonmutación \(AB = -BA + \{A, B\}\) tiene un primer signo menos que se cancela con el menos que ya estaba, dando finalmente un signo positivo — "menos \(\times\) menos \(=\) más" es la esencia.
⚪ Mei: Comparando (5.17) y (5.21), la única diferencia es el signo delante de \(\hat{c}^\dagger\hat{c}\). Con relaciones de conmutación era menos y con anticonmutación es más — una sola elección de signo cambia todo.
🔵 Kai: Pero, ¿por qué la naturaleza "eligió" las relaciones de anticonmutación? ¿Podemos decidir libremente si usar conmutación o anticonmutación? ¿O hay una razón profunda?
🟡 Lina: Una pregunta muy profunda. "¿Por qué el espín \(1/2\) debe usar relaciones de anticonmutación?" — la respuesta se revelará en 5.8「Teorema de espín y estadística — Por qué los fermiones anticonmutan」 con el teorema de espín y estadística. En esta etapa la conclusión es por eliminación: "con conmutación se rompe, así que se necesita anticonmutación", pero en realidad hay una razón más fundamental — la invariancia de Lorentz y la causalidad — que conecta el espín con la estadística. Eso queda para después.
🔵 Kai: Así que hay una base para decir que es "necesidad" y no "eliminación". Lo espero con interés.
🟡 Lina: Primero veamos las consecuencias de las relaciones de anticonmutación. En Fig. 5.3「Comparación del número de ocupación entre relaciones de conmutación y anticonmutación」 resumo anticipadamente cómo cambia el número de ocupación con conmutación vs. anticonmutación. Por qué se llega a "máximo 1 por estado" se deriva rigurosamente de las relaciones de anticonmutación en la siguiente sección.
Fig. 5.3: Comparación del número de ocupación entre relaciones de conmutación y anticonmutación. Para bosones (conmutación) no hay restricción en el número de ocupación, pero para fermiones (anticonmutación) cada estado admite como máximo 1 partícula (se muestra en detalle en 5.6「El principio de exclusión de Pauli — Un regalo de las relaciones de anticonmutación」).
✅ Verificación de comprensión: Usando la relación de anticonmutación \(\{\hat{c}, \hat{c}^\dagger\} = 1\) (caso discreto), expresa \(\hat{c}\hat{c}^\dagger\) en términos de \(\hat{c}^\dagger\hat{c}\). Compáralo con el caso de la relación de conmutación \([\hat{c}, \hat{c}^\dagger] = -1\).
Respuesta
Anticonmutación: \(\hat{c}\hat{c}^\dagger = 1 - \hat{c}^\dagger\hat{c}\). Por lo tanto \(-\hat{c}\hat{c}^\dagger = -1 + \hat{c}^\dagger\hat{c}\) (después del orden normal: \(+\hat{c}^\dagger\hat{c}\)). Conmutación: \(\hat{c}\hat{c}^\dagger = -1 + \hat{c}^\dagger\hat{c}\). Por lo tanto \(-\hat{c}\hat{c}^\dagger = 1 - \hat{c}^\dagger\hat{c}\) (después del orden normal: \(-\hat{c}^\dagger\hat{c}\)). Con anticonmutación la contribución a la energía es positiva, con conmutación es negativa.
📝 Ejercicios:
- Comparación del hamiltoniano del campo de Dirac con relaciones de conmutación y anticonmutación → Problema M-1. Fallo de la cuantización mediante relaciones de conmutación
5.6 El principio de exclusión de Pauli — Un regalo de las relaciones de anticonmutación¶
🟡 Lina: Las relaciones de anticonmutación tienen otra consecuencia física fundamental. De la ecuación (5.20c):
Es decir
🔵 Kai: ¡El cuadrado del operador de creación es cero! Eso significa que... ¿si intentas poner 2 partículas en el mismo estado cuántico, el estado se anula?
🟡 Lina: ¡Exacto!
No se pueden crear 2 partículas con el mismo momento \(\boldsymbol{p}\) y el mismo espín \(s\). Este es el principio de exclusión de Pauli.
⚪ Mei: Si no se pueden poner más de 2, parece que el operador número \(\hat{N} = \hat{b}^\dagger\hat{b}\) también tiene un límite superior en sus valores propios.
🟡 Lina: Así es. Comprobémoslo. \(\hat{N}^2 = \hat{b}^\dagger\hat{b}\hat{b}^\dagger\hat{b}\), usando la relación de anticonmutación \(\hat{b}\hat{b}^\dagger = 1 - \hat{b}^\dagger\hat{b}\): \(\hat{N}^2 = \hat{b}^\dagger(1 - \hat{b}^\dagger\hat{b})\hat{b} = \hat{b}^\dagger\hat{b} - (\hat{b}^\dagger)^2\hat{b}^2 = \hat{N} - 0 = \hat{N}\). Los valores propios que satisfacen \(\hat{N}^2 = \hat{N}\) son solo \(0\) y \(1\).
⚪ Mei: Si el valor propio es \(n\), entonces \(n^2 = n\), es decir \(n(n-1) = 0\), así que \(n = 0\) o \(n = 1\). El principio de exclusión sale limpiamente.
🔵 Kai: ¡Es como un bit — solo dos opciones: ON u OFF!
🟡 Lina: Perfecto. Cada estado cuántico admite como máximo 1 partícula — esta es la esencia de los fermiones. En Fig. 5.4「Comparación de la estructura del espacio de Fock entre bosones y fermiones」 puedes ver la diferencia de estructura del espacio de Fock entre bosones y fermiones.
Fig. 5.4: Comparación de la estructura del espacio de Fock entre bosones y fermiones. Para bosones se pueden poner cuantas partículas se quiera en cada estado cuántico, pero para fermiones \((\hat{b}^\dagger)^2 = 0\) impone que cada estado admita como máximo 1.
✅ Verificación de comprensión: A partir de la relación de anticonmutación \(\{\hat{b}^{s\dagger}_{\boldsymbol{p}}, \hat{b}^{s\dagger}_{\boldsymbol{p}}\} = 0\), demuestra que los valores propios del operador número \(\hat{N} = \hat{b}^\dagger \hat{b}\) son solo \(0\) y \(1\).
Respuesta
\(\hat{N}^2 = \hat{b}^\dagger \hat{b} \hat{b}^\dagger \hat{b}\), sustituyendo la relación de anticonmutación \(\hat{b}\hat{b}^\dagger = 1 - \hat{b}^\dagger\hat{b}\): \(\hat{N}^2 = \hat{b}^\dagger(1 - \hat{b}^\dagger\hat{b})\hat{b} = \hat{b}^\dagger\hat{b} - (\hat{b}^\dagger)^2\hat{b}^2 = \hat{N} - 0 = \hat{N}\). Los valores propios que satisfacen \(\hat{N}^2 = \hat{N}\) son, de \(n(n-1) = 0\), solo \(n = 0\) o \(n = 1\).
Tabla 5.3: Comparación de las condiciones de cuantización entre bosones y fermiones
| Bosones (conmutación) | Fermiones (anticonmutación) | |
|---|---|---|
| Condición de cuantización | \([\hat{a}, \hat{a}^\dagger] = 1\) | \(\{\hat{b}, \hat{b}^\dagger\} = 1\) |
| \((\hat{a}^\dagger)^2\) | \(\neq 0\) (se pueden crear sin límite) | \(= 0\) (no se pueden crear más de 2) |
| Rango del número de ocupación | \(0, 1, 2, 3, \ldots\) | Solo \(0\) o \(1\) |
| Estadística | Estadística de Bose-Einstein | Estadística de Fermi-Dirac |
🔵 Kai: En mecánica cuántica aprendí que "el principio de exclusión de Pauli se asume como hecho experimental", pero ¡en teoría cuántica de campos se deduce de las relaciones de anticonmutación! Pero entonces, ¿el principio de exclusión en mecánica cuántica era algo "que en realidad se puede demostrar pero se asumía como axioma"?
🟡 Lina: Buena pregunta. Solo dentro del marco de la mecánica cuántica no relativista no se puede derivar el principio de exclusión. Solo combinando la relatividad (invariancia de Lorentz) y la teoría cuántica de campos se puede derivar. Así que asumirlo como axioma en mecánica cuántica era el enfoque correcto dentro de las limitaciones de la teoría de entonces. Este es el poder de la teoría cuántica de campos — el principio de exclusión de Pauli no es un axioma caído del cielo, sino una consecuencia inevitable derivada de la estructura de la teoría relativista de campos.
🔵 Kai: Entonces con solo mecánica cuántica no se podía responder al "por qué" del principio de exclusión.
🟡 Lina: Exacto. Si estos postulados mismos se derivan de un principio más profundo, podríamos ver más allá del "por qué" — pero eso queda como una pregunta abierta.
📝 Ejercicios:
- Derivación del principio de exclusión de Pauli a partir de relaciones de anticonmutación → Problema M-2. Derivación del principio de exclusión de Pauli
5.7 Espacio de Fock de fermiones y antipartículas¶
🟡 Lina: Organicemos la estructura del espacio de Fock de fermiones.
Estado de vacío¶
En el vacío no existen ni partículas ni antipartículas.
Estados de una partícula¶
\(\hat{b}^\dagger\) crea una partícula (por ejemplo un electrón \(e^-\)) y \(\hat{c}^\dagger\) crea una antipartícula (por ejemplo un positrón \(e^+\)).
🔵 Kai: El positrón fue predicho por Dirac en 1928 y descubierto por Anderson en los rayos cósmicos en 1932, ¿verdad?
🟡 Lina: Así es. Reinterpretar la solución de energía negativa de la ecuación de Dirac como "solución de energía positiva de una antipartícula" es la comprensión moderna. En teoría cuántica de campos, \(\hat{c}^\dagger\) crea la antipartícula con energía positiva, así que la imagen antigua del "mar de Dirac" de energía negativa ya no es necesaria (en Fig. 5.5「Mar de Dirac e imagen moderna del vacío」 comparo ambas imágenes).
Fig. 5.5: Mar de Dirac e imagen moderna del vacío. A la izquierda, la imagen antigua del mar de Dirac (todos los niveles de energía negativa están ocupados; un hueco es un positrón). A la derecha, la imagen moderna de la teoría cuántica de campos (partículas y antipartículas se crean del vacío ambas con energía positiva).
✅ Verificación de comprensión: ¿En qué difiere la interpretación de las antipartículas en teoría cuántica de campos de la imagen del "mar de energía negativa" de Dirac?
Respuesta
En la imagen del mar de Dirac, todos los niveles de energía negativa están ocupados por electrones, y un "hueco" se observa como un positrón. En teoría cuántica de campos, el operador de creación de antipartículas \(\hat{c}^\dagger\) crea directamente una antipartícula con energía positiva a partir del vacío, por lo que el concepto de mar de energía negativa es innecesario.
Estados de muchas partículas y antisimetría¶
🟡 Lina: Consideremos un estado de 2 partículas. Al crear 2 electrones con diferentes números cuánticos \((\boldsymbol{p}_1, s_1)\) y \((\boldsymbol{p}_2, s_2)\):
De la relación de anticonmutación \(\{\hat{b}^{s_1\dagger}_{\boldsymbol{p}_1}, \hat{b}^{s_2\dagger}_{\boldsymbol{p}_2}\} = 0\):
⚪ Mei: Al intercambiar las dos partículas aparece un signo menos en el estado — es la antisimetría de la función de onda. La función de onda de muchos cuerpos de fermiones \(\Psi(1, 2) = -\Psi(2, 1)\) que aprendimos en mecánica cuántica, en teoría cuántica de campos sale automáticamente de las relaciones de anticonmutación.
🟡 Lina: Y por supuesto, si \(\boldsymbol{p}_1 = \boldsymbol{p}_2\) y \(s_1 = s_2\) entonces \((\hat{b}^{s\dagger}_{\boldsymbol{p}})^2|0\rangle = 0\) — el principio de exclusión de Pauli.
Conservación de la carga¶
🟡 Lina: Del teorema de Noether (Cap. 3), la carga conservada correspondiente a la simetría \(U(1)\) del campo de Dirac \(\psi \to e^{i\alpha}\psi\) es
🔵 Kai: ¡Es el número de partículas menos el número de antipartículas! Para el electrón \(Q = -e\) y para el positrón \(Q = +e\), así que \(\hat{b}^\dagger\) crea carga \(-e\) y \(\hat{c}^\dagger\) crea carga \(+e\).
🟡 Lina: Exacto. Partícula y antipartícula tienen la misma masa y el mismo espín, pero los signos de la carga (y otros números cuánticos aditivos) son opuestos.
✅ Verificación de comprensión: Explica cómo la carga conservada \(\hat{Q}\) (ecuación (5.26)) da cargas de signo opuesto a partículas y antipartículas.
Respuesta
Como \(\hat{Q} = \sum_s \int \frac{d^3p}{(2\pi)^3}[\hat{b}^{s\dagger}\hat{b}^s - \hat{c}^{s\dagger}\hat{c}^s]\), una partícula (creada por \(\hat{b}^\dagger\)) contribuye \(+1\) a \(\hat{Q}\), y una antipartícula (creada por \(\hat{c}^\dagger\)) contribuye \(-1\). Si la carga del electrón es \(-e\), entonces \(\hat{b}^\dagger\) crea una partícula con carga \(-e\) y \(\hat{c}^\dagger\) crea una antipartícula con carga \(+e\).
✅ Verificación de comprensión: A partir de la relación de anticonmutación \(\{\hat{b}^{s_1\dagger}_{\boldsymbol{p}_1}, \hat{b}^{s_2\dagger}_{\boldsymbol{p}_2}\} = 0\), deduce la antisimetría del estado de 2 fermiones.
Respuesta
De \(\hat{b}^{s_1\dagger}_{\boldsymbol{p}_1}\hat{b}^{s_2\dagger}_{\boldsymbol{p}_2} + \hat{b}^{s_2\dagger}_{\boldsymbol{p}_2}\hat{b}^{s_1\dagger}_{\boldsymbol{p}_1} = 0\) se obtiene \(\hat{b}^{s_1\dagger}_{\boldsymbol{p}_1}\hat{b}^{s_2\dagger}_{\boldsymbol{p}_2}|0\rangle = -\hat{b}^{s_2\dagger}_{\boldsymbol{p}_2}\hat{b}^{s_1\dagger}_{\boldsymbol{p}_1}|0\rangle\). Al intercambiar las partículas 1 y 2, el estado adquiere un signo menos.
5.8 Teorema de espín y estadística — Por qué los fermiones anticonmutan¶
🟡 Lina: Hasta aquí hemos visto que "cuantizar el campo de Dirac con relaciones de conmutación hace que la energía colapse, y con relaciones de anticonmutación se vuelve definida positiva". Pero hay una pregunta más profunda. ¿Por qué las partículas de espín \(1/2\) se cuantizan con relaciones de anticonmutación y las de espín \(0\) con relaciones de conmutación?
🔵 Kai: ¿No es una coincidencia?
🟡 Lina: No es coincidencia. En el marco de la teoría cuántica de campos relativista se puede demostrar el siguiente teorema:
Teorema de espín y estadística (spin-statistics theorem): - Los campos de espín entero (\(s = 0, 1, 2, \ldots\)) se cuantizan con relaciones de conmutación → bosones - Los campos de espín semientero (\(s = 1/2, 3/2, \ldots\)) se cuantizan con relaciones de anticonmutación → fermiones
🔵 Kai: ¿Cómo se demuestra?
🟡 Lina: La demostración completamente rigurosa es matemáticamente avanzada, pero la motivación física se puede entender desde 3 argumentos independientes.
Argumento 1: El colapso de la combinación "incorrecta"¶
🟡 Lina: Esto es exactamente la generalización de lo que acabamos de hacer.
- Cuantizar el campo de Dirac (espín \(1/2\)) con relaciones de conmutación → la energía no está acotada inferiormente (como vimos hoy)
- Cuantizar el campo escalar (espín \(0\)) con relaciones de anticonmutación → se viola la causalidad (el anticonmutador del campo en dos puntos separados por distancia espacial no se anula, produciendo correlaciones superlumínicas). Esto se puede verificar en el ejercicio (@exercise: Relaciones de anticonmutación del campo escalar y violación de causalidad → Problema B-9. Relaciones de anticonmutación para un campo escalar y violación de la causalidad).
Es decir, elegir la combinación "incorrecta" produce consecuencias físicamente inaceptables.
⚪ Mei: "Probar la opción equivocada" rompe la energía o la causalidad — por eliminación la combinación correcta queda determinada unívocamente.
Argumento 2: Causalidad (condición de microcausalidad)¶
🟡 Lina: En relatividad, la información no puede propagarse más rápido que la luz. En teoría cuántica de campos esto se expresa así:
En dos puntos separados por distancia espacial \((x - y)^2 < 0\), el conmutador de observables debe ser cero.
Para campos bosónicos, el campo mismo es (componente de) un observable, así que se necesita \([\hat{\phi}(x), \hat{\phi}(y)] = 0\). Para campos fermiónicos, los observables son formas bilineales como \(\bar{\psi}\psi\), que son productos de un número par de campos fermiónicos. Usando relaciones de anticonmutación se puede demostrar que el conmutador de productos de número par de campos se anula en la región espacial. Intuitivamente, al calcular el conmutador de \(\bar{\psi}(x)\psi(x)\) y \(\bar{\psi}(y)\psi(y)\), usando las relaciones de anticonmutación de campos fermiónicos para reordenar los campos, el conmutador de productos de número par de campos se reduce a la misma estructura que el conmutador de campos bosónicos — que es cero en la región espacial.
🔵 Kai: Eh, entonces como el campo fermiónico mismo no es un observable, ¿no importa que \(\{\hat{\psi}(x), \hat{\psi}(y)\}\) no sea cero?
🟡 Lina: Correcto. Los observables físicos son productos de número par como \(\bar{\psi}\psi\), así que mientras su conmutador sea cero, la causalidad se preserva.
Argumento 3: Dependencia del camino en el intercambio de partículas¶
🟡 Lina: Hay otro argumento intuitivo. Se interpreta el intercambio de 2 partículas como "una partícula da media vuelta alrededor de la otra".
Al mover una partícula espacialmente (rotar la parte orbital), en una teoría de campos relativista los grados de libertad internos de la partícula (espín) también se ven afectados por la misma rotación — esto es consecuencia de que el campo pertenece a una representación específica del grupo de Lorentz. Intuitivamente, la operación de "levantar la partícula y darle media vuelta" corresponde a rotar también la orientación (espín) de la partícula misma. Es como imaginar que al caminar llevando un globo terráqueo, la orientación del globo también cambia.
🔵 Kai: ¿Por qué "rotar la órbita" y "rotar el espín" están acoplados?
🟡 Lina: En mecánica cuántica no relativista, el momento angular orbital y el espín se podían tratar independientemente. Pero en teoría de campos relativista la situación es diferente. Un campo es un objeto que tiene un "valor" en cada punto del espacio, y ese valor se transforma como espinor o vector. Por ejemplo, piensa en el vector campo eléctrico \(\boldsymbol{E}\). Si rotas el sistema de coordenadas \(\pi\), \(E_x\) y \(E_y\) se mezclan, ¿verdad?
⚪ Mei: Es decir, en teoría de campos "qué punto miras" y "cómo se mezclan las componentes en ese punto" son inseparables.
🟡 Lina: Exacto. Matemáticamente, al rotar un campo de espín \(s\) un ángulo \(\theta\) alrededor del eje \(z\), actúa el operador de rotación \(e^{-iJ_z\theta}\). Así que el "ángulo de rotación orbital" y el "ángulo de rotación del espín" son el mismo \(\theta\).
Ahora consideremos concretamente la operación de intercambio de 2 partículas. Este no es un argumento riguroso sino intuitivo, pero captura la esencia. Al intercambiar dos partículas idénticas manteniendo fijo el centro de masa, el vector de coordenadas relativas \(\boldsymbol{r} = \boldsymbol{x}_1 - \boldsymbol{x}_2\) cambia a \(\boldsymbol{r} \to -\boldsymbol{r}\). Esto se puede ver como una rotación de ángulo \(\pi\) en el plano que contiene \(\boldsymbol{r}\) (en 3 dimensiones \(\boldsymbol{r} \to -\boldsymbol{r}\) es una inversión, pero siguiendo continuamente el camino del intercambio se realiza como una rotación de \(\pi\) en cierto plano).
Lo importante aquí es que cada partícula individualmente rota \(\pi\) alrededor del punto medio. Imagínatelo concretamente — la partícula 1 está a la derecha del origen y la partícula 2 a la izquierda (como son partículas idénticas tienen la misma masa y el centro de masa está justo en medio). Para intercambiarlas, la partícula 1 va por el semicírculo superior hacia la izquierda, y la partícula 2 por el semicírculo inferior hacia la derecha. Es como una balanza cuyos extremos dan media vuelta — ambas dan media vuelta (\(\pi\)) alrededor del origen, ¿verdad?
🔵 Kai: Entiendo, ¡intercambio = cada partícula da media vuelta (rotación \(\pi\))!
🟡 Lina: Así es. En teoría de campos relativista, al rotar espacialmente una partícula \(\pi\), la misma rotación \(\pi\) actúa sobre sus grados de libertad de espín (la propiedad explicada antes de que "las componentes del campo se mezclan bajo rotación"). Aquí complemento la razón por la que "a cada partícula independientemente" se le añade una fase. El operador de rotación del sistema de 2 partículas se escribe como producto tensorial \(e^{-iJ_z^{(1)}\theta} \otimes e^{-iJ_z^{(2)}\theta}\) — como el espín de la partícula 1 y el espín de la partícula 2 son grados de libertad independientes, la rotación actúa independientemente sobre cada uno. Así, a la componente de espín de cada partícula (tomando \(m = s\)) se le añade una fase \(e^{-is\pi}\), y como el estado del sistema de 2 partículas se escribe como producto tensorial \(|\text{partícula 1}\rangle \otimes |\text{partícula 2}\rangle\), en total se multiplican los dos factores de fase:
Calculemos concretamente:
- \(s = 0\) (escalar): \(e^{0} = +1\)
- \(s = 1/2\) (Dirac): \(e^{-i\pi} = \cos\pi + i\sin\pi = -1\)
- \(s = 1\) (vector): \(e^{-2i\pi} = \cos 2\pi + i\sin 2\pi = +1\)
En general:
- \(s\) entero: \(e^{-2is\pi} = +1\) → bosones
- \(s\) semientero: \(e^{-2is\pi} = -1\) → fermiones
🔵 Kai: ¡La propiedad de que el espinor cambia de signo al rotar \(360°\) entra en juego aquí! Lo de "\(720°\) para volver al original" que discutimos en 5.2「Representación espinorial del grupo de Lorentz — Los espinores no son vectores」 ¡era precisamente el origen de la estadística de Fermi!
🟡 Lina: Exacto. Repasando los 3 argumentos: el argumento 1 es "con la combinación incorrecta se rompe la energía o la causalidad", el argumento 2 es "para preservar la causalidad los campos fermiónicos deben anticonmutar", el argumento 3 es "la fase del intercambio de partículas está determinada por el espín" — tres ángulos independientes llegan a la misma conclusión.
⚪ Mei: Resumiendo el argumento 3: cada partícula rota \(\pi\) y adquiere una fase \(e^{-is\pi}\), para 2 partículas da \(e^{-2is\pi}\) — para espín semientero da \(-1\) (antisimétrico), para espín entero da \(+1\) (simétrico).
🟡 Lina: Así es. Los 3 argumentos convergen en la misma conclusión de que "el espín determina la estadística" — esta es la esencia del teorema de espín y estadística.
La conexión entre espín y estadística es una de las consecuencias más profundas de la teoría cuántica de campos relativista. Solo con mecánica cuántica no relativista no se puede derivar esta conexión. En Fig. 5.6「Diagrama conceptual del teorema de espín y estadística」 resumo la imagen completa.
Fig. 5.6: Diagrama conceptual del teorema de espín y estadística. Los campos de espín entero son bosones con relaciones de conmutación, y los campos de espín semientero son fermiones con relaciones de anticonmutación. Esta conexión se deriva inevitablemente de la teoría cuántica de campos relativista.
✅ Verificación de comprensión: Explica por qué el teorema de espín y estadística no se puede demostrar en mecánica cuántica no relativista.
Respuesta
En mecánica cuántica no relativista no se requiere invariancia de Lorentz, así que la causalidad (que el conmutador sea cero en la región espacial) y las propiedades de transformación bajo boosts (la distinción entre levógiro y dextrógiro) no entran en la discusión. La conexión entre espín y estadística solo se puede derivar combinando la relatividad (invariancia de Lorentz) y la mecánica cuántica.
5.9 Transformaciones \(C, P, T\)¶
🟡 Lina: Finalmente, veamos las 3 simetrías discretas para el campo de Dirac. Estas son la formulación en teoría cuántica de campos de lo que aprendimos conceptualmente en Mecánica Cuántica Cap. 26.
Tabla 5.4: Resumen de las transformaciones \(C\), \(P\), \(T\)
| Transformación | Operación | Acción sobre el campo de Dirac | Característica |
|---|---|---|---|
| \(P\) (paridad) | \(\boldsymbol{x} \to -\boldsymbol{x}\) | \(\psi_L \leftrightarrow \psi_R\) (mediada por \(\gamma^0\)) | Unitaria |
| \(C\) (conjugación de carga) | partícula \(\leftrightarrow\) antipartícula | \(\hat{b} \leftrightarrow \hat{c}\) | Unitaria |
| \(T\) (inversión temporal) | \(t \to -t\) | \(\gamma^1\gamma^3\) mezcla componentes del espinor | Antiunitaria |
Paridad \(P\) — Inversión espacial¶
🟡 Lina: La transformación de paridad \(P\) invierte las coordenadas espaciales: \(\boldsymbol{x} \to -\boldsymbol{x}\). Para el campo de Dirac:
🔵 Kai: Se multiplica por \(\gamma^0\). ¿Por qué?
🟡 Lina: Las 2 componentes superiores (levógiras) y las 2 inferiores (dextrógiras) del espinor de Dirac se intercambian bajo paridad. Aunque hay varias representaciones (elecciones concretas de matrices) para las matrices \(\gamma\), en la representación quiral (chiral representation) donde la estructura levógira/dextrógira es más visible:
Esta matriz intercambia las 2 componentes superiores con las inferiores — es decir, cumple el rol de intercambiar \(\psi_L\) y \(\psi_R\). Como la paridad es una "reflexión espacial", es intuitivamente natural que levógiro y dextrógiro se intercambien, ¿verdad?
⚪ Mei: Es la misma sensación de que al mirarse en un espejo se intercambian la mano derecha y la izquierda.
🟡 Lina: Exacto. Para los operadores de creación y aniquilación:
El signo del momento se invierte, y la antipartícula adquiere además un signo menos. Aquí introduzco un concepto nuevo. La paridad intrínseca (intrinsic parity) es el factor de fase propio que adquiere un estado al transformarse por paridad. ¿Por qué es necesario algo así? Porque la transformación de paridad es la operación de "dar vuelta al espacio", pero dependiendo de la estructura interna de la partícula (la relación entre componentes superiores e inferiores del espinor), puede añadirse una fase adicional al dar vuelta. Esta es una propiedad intrínseca de cada tipo de partícula, un número cuántico independiente del momento y el espín — en el mismo sentido que la carga es una "propiedad intrínseca" determinada por el tipo de partícula.
🔵 Kai: Mirando la ecuación (5.29), \(\hat{b}\) no tiene signo extra pero \(\hat{c}\) tiene un signo menos — ¿esa es la diferencia de paridad intrínseca?
🟡 Lina: Exacto. Mirando la ecuación (5.29), la transformación de \(\hat{b}\) no tiene signo extra (\(P^{-1}\hat{b}^s_{\boldsymbol{p}}P = \hat{b}^s_{-\boldsymbol{p}}\)), mientras que la de \(\hat{c}\) tiene un signo menos (\(P^{-1}\hat{c}^s_{\boldsymbol{p}}P = -\hat{c}^s_{-\boldsymbol{p}}\)). Ese signo menos extra es el número cuántico llamado "paridad intrínseca" — si se adopta la convención de que la paridad intrínseca de la partícula es \(+1\) (esta convención es un acuerdo, y las consecuencias físicas dependen del producto de las paridades intrínsecas de partícula y antipartícula), la paridad intrínseca de la antipartícula es \(-1\). Es decir, para fermiones el producto de las paridades intrínsecas de partícula y antipartícula es \(-1\) (\(\eta_P(\text{partícula}) \times \eta_P(\text{antipartícula}) = -1\)). Esto es una consecuencia determinada por la estructura de la ecuación de Dirac, y está confirmado experimentalmente (por ejemplo, por la distribución angular de \(\pi^0 \to e^+e^-\)).
Conjugación de carga \(C\) — Intercambio de partícula y antipartícula¶
🟡 Lina: La conjugación de carga \(C\) es la operación que intercambia partícula y antipartícula.
⚪ Mei: Entonces, si se aplica \(C\) al operador de carga \(\hat{Q} = \hat{N}_b - \hat{N}_c\) de la ecuación (5.26), como se intercambian el número de partículas y antipartículas: \(C^{-1}\hat{Q}\,C = -\hat{Q}\).
🟡 Lina: Correcto. Y solo pueden ser estados propios de \(C\) las partículas que son idénticas a su antipartícula. El fotón tiene paridad \(C\) igual a \(-1\), y el pión neutro \(\pi^0\) tiene paridad \(C\) igual a \(+1\).
✅ Verificación de comprensión: ¿Qué tipo de partículas pueden ser estados propios de la conjugación de carga \(C\)? Explica la razón.
Respuesta
Solo las partículas que son idénticas a su antipartícula (ejemplo: fotón, \(\pi^0\)) pueden ser estados propios de \(C\). Como \(C\) intercambia partícula y antipartícula, si son diferentes, \(C\) lleva a un estado diferente y no es un estado propio.
Inversión temporal \(T\) — Invertir el flujo del tiempo¶
🟡 Lina: La inversión temporal \(T\) es la operación \(t \to -t\). Sin embargo, \(T\) tiene una propiedad decisivamente diferente de las otras dos.
🔵 Kai: ¿Qué es diferente?
🟡 Lina: \(T\) es un operador antiunitario (anti-unitary operator). Es decir, \(T(c|\psi\rangle) = c^* T|\psi\rangle\) (convierte los números complejos en sus complejos conjugados). Recuerda lo aprendido en Mecánica Cuántica Cap. 26.
La forma concreta de la matriz \(\gamma^1\gamma^3\) depende de la representación de las matrices \(\gamma\), pero su rol es "mezclar las componentes del espinor para que la ecuación de Dirac sea invariante bajo \(t \to -t\)". Por qué es exactamente esta combinación se determina al encontrar la matriz necesaria para compensar el cambio de signo de \(\gamma^0\partial_0\) cuando \(t \to -t\), a partir del álgebra de Clifford. Los detalles de la derivación están en Apéndice B. La antiunitariedad de \(T\) viene de que en la ecuación de Schrödinger \(i\partial_t|\psi\rangle = H|\psi\rangle\), al hacer \(t \to -t\), también hay que invertir el signo de \(i\) para que la ecuación permanezca invariante.
⚪ Mei: Es decir, solo \(T\) es antiunitaria, mientras que \(C\) y \(P\) son unitarias — la inversión temporal es especial.
Teorema CPT¶
🟡 Lina: En la naturaleza, \(C\), \(P\), \(T\) individualmente pueden violarse. La interacción débil viola \(P\), y también viola \(CP\). Pero —
Teorema CPT: En una teoría cuántica de campos que sea invariante de Lorentz y local, la transformación simultánea de las tres \(CPT\) es siempre una simetría.
🔵 Kai: ¿Si se combinan las tres siempre es simétrica?
🟡 Lina: Así es. Como consecuencia del teorema CPT, partícula y antipartícula necesariamente tienen la misma masa y vida media. Esto está verificado experimentalmente con precisión extremadamente alta. Si CPT se violara, significaría que la invariancia de Lorentz o la localidad se rompe — eso sería un acontecimiento que sacudiría los cimientos de la física. En Fig. 5.7「Simetrías discretas C, P, T y teorema CPT」 resumo las relaciones entre \(C\), \(P\), \(T\).
Fig. 5.7: Simetrías discretas C, P, T y teorema CPT. Las 3 simetrías discretas \(C\) (conjugación de carga), \(P\) (paridad), \(T\) (inversión temporal). Individualmente pueden violarse, pero por el teorema CPT la transformación simultánea de las tres siempre es una simetría.
✅ Verificación de comprensión: Menciona 2 relaciones concretas entre partícula y antipartícula que se deriven del teorema CPT.
Respuesta
(1) Partícula y antipartícula tienen la misma masa. (2) Partícula y antipartícula tienen la misma vida media. (También son correctas: "tienen el mismo espín", "la magnitud del momento magnético es igual pero con signo opuesto".)
📝 Ejercicios:
- Composición de transformaciones \(C, P, T\) y teorema CPT → Problema A-2. Transformaciones \(C\), \(P\), \(T\) y teorema \(CPT\)
5.10 Resumen del capítulo¶
🟡 Lina: Repasemos el contenido de hoy.
⚪ Mei: Lo organizo.
-
La ecuación de Dirac se escribe como \((i\not\!\partial - m)\psi = 0\) usando matrices \(\gamma\) de \(4 \times 4\) que satisfacen el álgebra de Clifford \(\{\gamma^\mu, \gamma^\nu\} = 2\eta^{\mu\nu}\). La función de onda \(\psi\) es un espinor de Dirac de 4 componentes.
-
El álgebra de Lorentz se descompone en \(\mathfrak{su}(2) \oplus \mathfrak{su}(2)\), y el espinor de Dirac corresponde a la representación \((1/2, 0) \oplus (0, 1/2)\). Es la combinación de espinores de Weyl levógiro y dextrógiro.
-
El lagrangiano del campo de Dirac es \(\mathcal{L} = \bar{\psi}(i\not\!\partial - m)\psi\), y el momento conjugado es \(\Pi = i\psi^\dagger\).
-
Cuantizar con relaciones de conmutación produce un colapso — aparece un signo menos en \([\hat{c}, \hat{c}^\dagger]\) de la antipartícula, y la energía del hamiltoniano no está acotada inferiormente.
-
Cuantizando con relaciones de anticonmutación \(\{\hat{b}, \hat{b}^\dagger\} = \delta\), \(\{\hat{c}, \hat{c}^\dagger\} = \delta\), el hamiltoniano se vuelve definido positivo \(:\hat{H}: = \sum E_{\boldsymbol{p}}(\hat{b}^\dagger\hat{b} + \hat{c}^\dagger\hat{c})\) y existe un vacío estable.
-
De las relaciones de anticonmutación se derivan automáticamente el principio de exclusión de Pauli \((\hat{b}^\dagger)^2 = 0\) y la estadística de Fermi-Dirac.
-
Teorema de espín y estadística: espín entero → bosones (conmutación), espín semientero → fermiones (anticonmutación). Esta es una de las consecuencias más profundas de la teoría cuántica de campos relativista.
-
Transformaciones \(C, P, T\): respectivamente, partícula↔antipartícula, inversión espacial, inversión temporal. Individualmente pueden violarse, pero CPT es siempre una simetría.
🔵 Kai: Mientras que la cuantización del campo escalar era "imponer relaciones de conmutación y la energía se vuelve definida positiva", para el campo de Dirac fue "con conmutación se rompe así que se necesitan relaciones de anticonmutación". Haber experimentado el colapso con conmutación me hizo sentir que las relaciones de anticonmutación no se eligen "por falta de alternativa" sino por "necesidad". Solo cambiar de espín 0 a espín 1/2 trae tantos problemas nuevos. Entonces me pregunto qué pasa con el fotón de espín 1 — debería ir con relaciones de conmutación por ser espín entero, pero ¿no surgirá algún problema diferente?
🟡 Lina: Buena pregunta. El fotón tiene espín entero así que cuantizarlo con relaciones de conmutación es correcto. Pero el fotón tiene otro problema complicado escondido: la "libertad de gauge", y al intentar cuantizarlo canónicamente de forma ingenua se choca con un muro. Ese es el tema del próximo capítulo.
Y la protagonista del drama de hoy fue el "espín". Si el espín es entero o semientero determina la receta de cuantización, determina la estadística, determina la estabilidad de la materia. Sin la teoría cuántica de campos, esta profunda conexión no se habría podido ver.
Adelanto del próximo capítulo¶
Habiendo completado la cuantización de espín 0 (campo escalar) y espín 1/2 (campo de Dirac), queda el espín 1 — el campo del fotón. Sin embargo, el campo electromagnético esconde una problemática redundancia llamada "libertad de gauge", y al intentar ingenuamente la cuantización canónica se encuentra un nuevo muro: el momento conjugado se anula. En Cap. 6 aprenderemos a superar este muro usando técnicas de fijación de gauge para cuantizar correctamente solo los grados de libertad de polarización física del fotón. Una vez que tengamos la cuantización de los 3 campos libres — campo escalar (Cap. 4), campo de Dirac (este capítulo) y campo electromagnético (Cap. 6) — estaremos listos para introducir las interacciones en Cap. 7.
Ejercicios¶
📝 Ejercicios:
- Derivación de propiedades de las matrices \(\gamma\) a partir del álgebra de Clifford → Problema B-1. Cálculo básico del álgebra de Clifford
- Comparación del hamiltoniano del campo de Dirac con relaciones de conmutación y anticonmutación → Problema M-1. Fallo de la cuantización mediante relaciones de conmutación
- Derivación del principio de exclusión de Pauli a partir de relaciones de anticonmutación → Problema M-2. Derivación del principio de exclusión de Pauli
- Composición de transformaciones \(C, P, T\) y teorema CPT → Problema A-2. Transformaciones \(C\), \(P\), \(T\) y teorema \(CPT\)
- Relaciones de anticonmutación del campo escalar y violación de causalidad → Problema B-9. Relaciones de anticonmutación para un campo escalar y violación de la causalidad
Referencias¶
- Quantum Field Theory for the Gifted Amateur (Lancaster & Blundell) Capítulo 36 "La ecuación de Dirac", Capítulo 37 "Transformaciones de espinores", Capítulo 38 "Cuantización del campo de Dirac"
- Quantum Field Theory (David Tong, Cambridge) Capítulo 4 "The Dirac Equation", Capítulo 5 "Quantizing the Dirac Field"
- 場の量子論 — 不変性と自由場を中心にして (坂本眞人) Capítulo 4 "Derivación de la ecuación de Dirac y matrices γ", Capítulo 5 "Propiedades de transformación de Lorentz de la ecuación de Dirac", Capítulo 12 "Cuantización del campo de Dirac"
- Quantum Field Theory and the Standard Model (Schwartz) Capítulo 8 "Espinores y la ecuación de Dirac", Capítulo 9 "El teorema de espín y estadística"
Feedback on this page
Let us know if something was unclear, incorrect, or could be improved.






